Phenom-II - Power Ranger

CosmiChaos

Lieutnant
Mitglied seit
21.11.2012
Beiträge
94
Renomée
4
Phenom II - Optimised

Die Energieeffizenz eines Prozessors ergibt sich daraus, wieviel Rechenleistung er pro Energieleistung umsetzen kann. Die Sparsamkeit ohne Last ergibt sich wiederum daraus, wieweit der Prozessor seine Rechenkapazitäten reduzieren kann
In der Regel benötigen die Prozessoren einen hohen Takt um eine hohe Gesamtleistung zu erreichen und ein relativ hoher Takt erfordert allgemein auch immer eine relativ hohe Spannung.
Dies führt zu einem Problem. Entweder hat der Prozessor stets hohe Rechenkapazität verfügbar oder er verbraucht im Leerlauf eine hohe Energieleistung. Um die Anforderungen beider Welten zu vereinen gibt es aktuell zwei Haupttechnologien.


Einmal die Möglichkeit Kerne bzw einzelne seperate Rechenwerke abzuschalten, was beim Phenom II praktisch nicht möglich ist. Auch kann der Phenom II leider nichtmal einzelnen Kernen weniger Spannung zuführen, weshalb CoreParking in der Praxis, also auf dem Metall, grundsätzlich nicht möglich ist und daher auch im Betriebssystem als zu aktivierende Option nicht zu empfehlen ist, daher wird auch nicht weiter darauf eingegangen.

Und zweitens die Möglichkeit den Takt herabzusenken, welchen standardmäßig durch die Funktion von CnQ (Cool'n'Quiet) abgebildet ist. Hier setzt der mein Thread an. Als dritte semi-Option gibt es noch das "Turbo", welches ebenfalls eine Taktveränderung ist, indem Fall das Herauftakten und Sannungerhöhen in besonders ineffiziente, schwer zu kühlende Performance-Bereiche, auch darauf wird nciht eingegeangen, weil der Phenom II dies nicht unterstützt.

Insbesondere hebt sich AMD da mit den neueres FXern nicht gerade besonders gut hervor, da es sich im Prinzip um ans Limit overclockte 8350er handelt... das kann man auch mit ein bischen Sachverstand unter Garantieverlust bei praktisch gleichem Risiko selber machen :D

Die Phenoms II sind heute insbesondere noch sehr wirtschaftlich, da sie im reinen 4-Kern-Bereich, zwar in der Ernergieeffizienz von den 2-Kern-Modulern eingeholt wurden, aber nunmal nicht in der Performance, und auch weil AMDs 8-Kern-Bulldoser in reinen 4-Kern Anwendungen den alten eigenen Architekturen immernoch deutlich hinterherhinken. Viele Leute haben einen Phenom II weil er günstig und gut war und immernoch locker reicht.


Leise und Ruhig, dass kann CnQ. Aber wie sieht aus mit "Energieeffizienz" und einem "Performance-Sweet-Spot" aus? Leider geht CnQ gleich in die vollen, und reduziert ziemlich drastisch auf 800Mhz bei den Top-End Phenoms.

Es zeigt sich ausserdem, dass ein gewisser VCore nicht unterschritten werden darf, egal wie tief man mit dem Takt runtergeht, sowie das sich im Ultra-Tief-Takt (deutlich kleiner 800Mhz) Instabilitäten mit dem Speicher-Subsystem ergeben, also ist von davon deutlich abzuraten. Es nützt keinem Desktop-PC was ein paar Milliwatts im Idle weniger zu verbrauchen, wenn das ganze System in den "Atari-Modus" schaltet und nichtmal mehr die ganzen OS-Scheduler klarkommen, die auf gewisse Mindestanforderungen ausgelegt sind.


Das muss aber garnicht sein, wenn man sich zum Beispiel veranschaulicht, dass der reine Idle-Verbrauch eines FSB-Übertaktetem Phenom II mit 1230 Mhz Niedrig-Takt nur höchstens 1-2 Watt höher liegt... dafür aber gleich ca. doppelt so Schnell ist, da 800Mhz an HT und deutlich höher getaktetem Speicher krass limitiert. Wenn nun das Standard-CnQ bei mäßig kleiner Last schon in die nächst höhere Stufe takten muss ist der 1-2 Watt Gewinn schnell wieder dahin, während man dann wiederum bei 1230 Mhz und nur geringfügig höherer VCore deutlich länger Reserven hat bis es überhaupt soweit kommt.

Ziel sollte es also für jederman sein, den Prozessor für die eigenen Bedürfnisse in performanten und dennoch energie-wirtschaftlich Regionen zu halten und nur im Absoluten (Not-)Anforderungsfall in die unwirtschaftlichste Hochtaktstufe zu schalten.


Es gilt dabei:

Je höher der benötigte VCore um eine Takterhöhung zu erzwingen umso niedriger die Energieeffizienz.

Je tiefer der Takt unter RAM-Takt fällt umso mehr "Ressourcen" werden verschwendet.




Insbesondere auf AM3(+) Plattformen kann man den Speichercontroller (bei mir 1640Mhz) der Phenom II Serie durch den Northbridgetakt und leichte Spannungserhöhung sehr weit aufbohren und dadurch auch den Tief-Takt noch höher ansetzen um noch mehr Leistung pro Watt rauszukitzeln, wobei der Mehrverbauch im Idle dann allerdings mit 3-4 Watt schon deutlicher ist.

Ich konfiguriere gerne mit K10Stat weil es mehr Möglichkeiten bietet als beispielsweise ein AMD OverDrive.



Als Beispiel für einen individuell optimales Energiespar-Profil auf Kosten der Leistung werden folgende States definiert.

P3 ~ 3000 Mhz
P2 Mittelwert aus P1 und P3
P1 "RAM-Takt"
P0 800 Mhz


Weitere denkbare Beispiele für mehr Responsivität bei geringfügig mehr Idle-Energieaufnahme:

P3 doppelter (Sechs-drittel) "RAM-Takt"
P2 Fünf-drittel "RAM-Takt"
P1 Vier-drittel "RAM-Takt"
P0 einfacher "RAM-Takt"


K10Stat ermöglicht außerdem genaustens zu definieren wann die Kerne hochgetaktet werden.
Zum einen kann man pro Stufe defnieren bei welcher prozentualen Auslastung zur nächstem Stufe hoch bzw herutnergetaktet wird.
Außerdem kann man definieren, welcher Kern für die Bewertung der prozentualen Auslastung herangezogen wird.

Performant ist natürlich, wenn der Kern mit der größten Auslastung herangezogen wird, was auch strikt zu empfehlen ist, da Phenoms "Unganged" wie obens eingangs erwähnt nicht unterstützen und eine Heranziehung der kleinsten Auslastung eher zum Ausbremsen tendiert. Lediglich die durchschnittliche Auslastung aller Kern kann man sich aus energie-wirtschaftlichen Gründen überlegen, wenn es denn keine kritischen SIngle-Thread Anwendungen gibt.

Im Prinzip brauchen normale Anwender nur ein einziges Desktop-bzw.-"performantes"-Idle-Profile, sowie ein anderes Profil indem der P3 für Max-Takt definiert ist, denn man dann schnell über Schnelsstart-Knopf festnageln kann.

Wie macht ihr das, nutzt ihr CnQ überhaupt?
Nutzt sonst noch einer K10Stat?
Oder läuft bei den meißten einfach immer und ständig Volltakt?
 
Zuletzt bearbeitet:
Teil 2:

K10Stat - Up/Down-Schwellen:

Die Schwellen geben an, bei wieviel Prozent Auslastung in die jeweilig nächst-höhere oder nächst-niedrigere Takstufe gewechselt wird.

Standardwert für Up ist 80%, dass bedeuted, dass die Auslastung des Prozessor ausgehend von seiner niedrigeren Takstufe 80% überschreiten muss, damit er in die jeweilig höhere Stufe schaltet. Je niedriger der Up-Wert ist umso frühzeitiger wird heraufgetaktet.

Beispiel: Takt 2000 Mhz * Up 80% = 1600 Mhz. Sobald unser "Rechenbedarf" also 1600 Mhz überschreitet, soll 1 Stufe hochgetaktet werden.

Standardwert für Down ist 20%, dass bedeuted, dass die Auslastung des Prozessor ausgehend von seiner höheren Stufe 20% unterschreiten muss, damit er in die jeweilig niedrigere Stufe schaltet.

Beispiel: Takt 3000 Mhz * Down 20% = 600 Mhz. Sobald unser "Rechenbedarf" also 600 Mhz unterschreitet soll 1 Stufe rutergetaktet werden.

* natürlich ist das nur idealisiert, gesetz dem Fall das Mhz und Leistung parallel bzw kongruent verlaufen, wovon bei Werten überhalb der sonstigen Systemtakte locker ausgegangen werden kann, trotz minimaler Abweichungen.


Diese Standardeinstellung-Werte führen leider dazu, dass relativ früh hochgetaktet wird und der hohe Takt länger als nötig beibehalten wird. Besser wäre es die Up/Down-Schwellen feiner und genauer auf den Bedarf zu modifizieren....

... und zwar so das genau dann heruntergetaktet wird, wenn die Leistung auch durch die nächst niedrigere Stufe bewerkstelligt werden kann und nicht später UND niedriger als die Hochtakt-Schwelle, der nächst niedrigeren Stufe.
Weil P0 eventuell deutlich weniger Performance pro Mhz als P1 hat wenn man sich bei P0 deutlich unterhalb RAM-Takt bewegt sollte man außerdem die P1-Down-Schwelle deutlich niedriger ansetzen als die P0-Up-Schwelle.

Hier mal meine aktuellen Takte und Up/Down-Schwellen:

P3 - 3444 Mhz - Down: 74% (~2550)
P2 - 2830 Mhz - Up: 91% (~2575) - Down: 71% (~2010)
P1 - 2337 Mhz - Up: 87% (~2033) - Down: 36% (~841)
P0 - 1230 Mhz - Up: 81% (~996)

Mode: Ganged (HIGH),
Intervall-Überprüfung Up: 100ms
Intervall-Überprüfung Down: 400ms

Pro:
- bis zu 3444 Mhz; Undervolting noch möglich, durchweg sehr gute Leistung pro Watt
- 1230 Mhz Idle; Undervolting sehr gut möglich, deutlich höhere Leistung gegenüber 800Mhz.
- Bedarfsorientierte Hoch- und Runter-Taktungsschwellen
- leistungsorientierte hochfrequentierte Up-Intervalle und niedrig-frequentierte DOwn-Intervalle

Contra:
- geringfügig höherer Idle-Verbrauch im Vergleich zu CnQ (1-2Wh)


Das grundsätzliche Problem ist, dass es trotz 100ms Up-Intervall dann nunmal immernoch effektive 300 Millisekunden dauert bis der Volltakt des Profiles erreicht wird. Das ist aber ein grundsätzliches Problem mit K10Stat, weshalb man halt für Anwendung die ständig dynamisch spontan alle Reserven so schnell wie möglich benötigen eben den P3 festsetzen sollte. CnQ ist soweit ich weiß flotter, auch der PhenomTweaker. Aber K10Stat bietet die besseren Modifikationsmöglichkeiten bezüglich Takt und Spannung, weshalb man damit besser Energie sparen kann.


Weiterhin habe ich natürlich für das Overclocking wie gesagt noch ein weiteres Profil bei dem P0 bei 3940 Mhz liegt und ich via BAT-Executable einfach mit 1-CLick über die Schnellstartleiste umstellen kann... so habe ich effektiv automatsiche Stromsparstufen und einen manuelle Höchstleistungstaktstufe.

Beispiel für BAT:
taskkill /IM "K10Stat.exe"
start "" "C:\Program Files (x86)\K10Stat\K10STAT.exe" -lp:2 -ClkCtrl:2 -StayOnTray -nw


Aber das geht eben auf die Stromrechnung.... solange es sich nich um AAA-Titel handelt, kann ich mit dem Standardprofil sogar Mikro-Ruckel-frei zocken.


Nachtrag:

Das Up-Intervall lässt sich mit K10Stat auf 0ms festlegen, allerdings funktioniert das bei mir nicht sauber. Ggf. probieren, aber nicht wundern wenn Niedrigtakt-beibehalten wird, dann hilft leider nur 100ms. Leider gibt es für K10Stats keine Updates mehr.
 
Zuletzt bearbeitet:
Den PhenomII gibt es auch mit Turbo.

Ich lasse die Taktzwischenstufen auf Standard, so oft brauche ich die nicht.
Ich kann mir nicht vorstellen, dass sich da ein Optimieren lohnt, da sowieso in sehr kurzer Zeit hin und her geschalten wird.
Da würde ich auch Dein Argument mit der Stabilität ins Feld führen: Warum wegen ein paar µ-irgendwas an möglicher Performance-Steigerung an den Einstellungen rumpfuschen? ;)

Mal abgesehen davon lasse ich die CPU aber sowieso immer auf vollem Takt laufen. Wenn ich Strom sparen will, dann setze ich eben einen niedrigeren P-State fest und zwar mit optimaler, sprich möglichst geringer Spannung. Dafür habe ich in K10stat passende Profile mit maximal 3, 2.5, 2 und 0.8GHz.
 
Zuletzt bearbeitet:
Wenn du ihn immer auf Volltakt laufen lässt verschenkst du ca. 30W Idle-Leistung.

Wenn der Rechner das ganze Jahr läuft, bei einem Strompreis von 30 Cent sind das: ~ 80 Euro jährliche Mehrkosten.

Ständig manuell die Profile zu wechseln ist doch mühseelig

Das (Hochtakt) ist für üblichen Desktopbetrieb eh unsinnig. Wenn man das brauch kann man Volltakt entweder scriptgesteuert automatisiert für seine Spiele sonstwas benutzen oder einfach via 1-CLick manuell aktivieren. Dieser Thread soll eben genau das klären, wie man hoch und runter-Taktung optimal einstellt, damit es eben zu keiner großen Leistungseinbußung kommt, sowie hoher Responsivität, trotz aggressiver Energiespardrossel.

Jedesmal händich die Taktstufe anzusuchen, welche der Anwendung genügt zum Energiesparen ist doch eher ziemlich aufwendig.

Außerdem sind die Spannungen übergreifend definiert...dabei ist es egal ob du manuell die P-States festnagelst oder ob K10Stat die Stufe unlocked selber festlegt. Wenn du Problem mit der automatisierten Taktung hast, dann überprüfe bitte deine Schwellen/Intervall-Einstellungen. Wie gesagt, sind die Default-Werte fürn After und man kann da viel falsch machen.

Selbst der P0 in meiner Konfiguration spart bei max. 3444Mhz und automatischem Undervolting, deutlich mehr Strom als 3600Mhz Standardtakt mit Standardvoltage.


Das geht auch konfortabler ohne permanent manuell umzustellen. Ich brauche das nur im Notfall für Anwendungen die maximale Performance benötigen, AAA-Spiele, Encoding, etc. Ich behaupte dass ich mit meienr EInstellungen weniger oft manuell ran muss als du. :D

Edit: Ich habe meinen Post oben editiert, bin detaillierter auf die Up/Down-Schwellen eingegangen und habe ein Beispiel erklärt. Lies es bitte.

PS: Ich wüsste nicht, dass es den PhenomII mit Turbo gibt.... es gibt höchstens einen K10 mit Turbo... aber sowas steckt in Notebooks und schimpft sich Turion ... daher ist es wie gesagt für diesen Thread indem es um Desktop-Phenoms geht uninteressant, es ging dabei lediglich darum auzuzeigen, dass beim Phenom II weitestgehend nur der "Ganged (HIGH)"-Mode Sinn macht.... danke für deinen Beitrag xD
 
Zuletzt bearbeitet:
Nee, ich verschenke nichts, der Leerlaufprozess hat bei mir auch nach mehreren Tagen Dauerbetrieb nur wenige Minuten Laufzeit. ;)
Und die Profile wechsle ich allenfalls im Lauf der Jahreszeiten. Im Winter volle Leistung, im Sommer 2GHz, Herbst/Frühling meistens ne Zwischenstufe.
Ich finde es für die Spannungswandler und das Netzteil zudem deutlich entspannter, wenn die Spannung immer gleich bleibt und nicht im GHz-Takt hoch und runterjagt, auch wenn aktuelle Hardware dafür entworfen wurde.

Idle habe ich eigentlich nur auf dem HTPC und dort habe ich bewußt die Zeit fürs Hochtakten sehr klein und fürs Runtertakten sehr groß (mehrere Minuten) gestellt. Die Leistung soll sofort da sein, wenn gebraucht, aber nicht im Zickzack herumschalten.

Die Denebs aus der PhenomII-Familie haben den Turbo. Also die X6 und einige X4.
 
Zuletzt bearbeitet:
Die Denebs, bzw. besser ausgedrückt, die Modelle basierend auf dem Ridgeback-DIE haben keinen Turbo. Das haben nur die Modelle basierend auf dem Pharao-DIE, also Zosma und Thuban bzw. die Phenom II mit dem "T" am Ende der Modellbezeichnung.
 
Oh, Mist verwechselt...
 
@TE
Verstehe ich es recht, dass ein bestimmer Takt dann durchgängig gehalten, also praktisch nur ein P-State verwendet werden soll?

@LoRDxRaVeN
Was hältst du von diesem Tutorial?
 
Oh verflixt ich sehe gerade dass die K10Stat Einstellung fürs Up-Intervall "0" eher schlecht als recht funktioniert, kommt bei mir irgendwie auf den Profilwechsel nicht klar und taktet dann unlocked garnicht mehr hoch.

Mit 100ms geht alles einwandfrei. Ich editier das nochmal.

Zum Thema Spannungswandler minderer Qualität kann ich nicht viel sagen... wobei eigentlich shcon MSI-990FX-GD65 ... :D Da gabs ausgiebig Problem mit dem VSM... jedenfalls unterstützt meins sogar auto-phasing und passt die Spannungswandler entsprechend der geforderten Leistung auf 2-, 4-, 6- oder 8-Phasen an.

So spart das Board sogar noch mit daran!

Ich hab jedenfalls noch keine Probleme damit gehabt und kann die einzelnen States sauber undevolten, locken und ausgiebig benchen, danach ausgiebig manuell unter Last hoch und runterstufen in den State um Instabilitäten beim Takttstufenwechsel auszuschließen.

Zugegebenerweise ist die Umrechnung zwischen Prozessorauslastung und Taktfrequenz bischen idealisiert, weil Auslastung in micro-bursts gemessen wird...aber whatever, es funzt so jedenfalls prächtig.... kein unnötiges hin und hergetakte.... immer nur der benötigte Takt, das ist es ja gerade. :D

Gut bischen Verzögerung bis die Leistung da ist, aber in 90% meiner Zeit komme ich eben mit 1230Mhz locker aus! Für 5% brauch ich dann wiederum so viel Leistung, dass ich per 1-Click Overclocking einlege und fertig. Für die restlichen letzten 5% in den Apps Peaken reicht K10Stat total aus... ohne erst nach x-Minuten herunterzutakten xD

Die Prozentwerte die ich für Down/Up angegeben habe sind auch keine Gold-Standard-Werte, sondern liegen ziemlich eng beieinander. Das mag nicht bei jedem klappen, evtl soltle man Down-Schwelle noch weit tiefer ansetzen als die Up-Schwelle der tieferen Stufe, damit die Bereiche in denen ohne Taktwechsel operiert werden kann besser voneinander abgegrenzt sind, oder umgekehrt noch enger fassen um den Bereich zu erweitern, wozu ich nicht rate.

@Unbekannter Krieger:
Sofern die angeforderte Mehrleistung gegenüber dem Niedrigtakt kostant ist bzw nicht die jeweilig nächsten Schwellen über- bzw. unterschreitet, ja. Sobald die Last auf der Stufe ein kritisches Niveau erreicht wird hochgetaktet, sobald die Last abfällt und von der unteren Stufe gepackt werden sollte, wird heruntergetaktet. Genau dafür habe ich die so angepasst. Es gibt da zwar theoretisch ein paar minimale tote Winkel (Konstante Last im Schwellenbereich), welche sich nicht 100%ig ausschließen lassen, aber Probleme hatte ich damit keine, denn das Setting beugt dem insofern vor, dass bei so einem "hin- und her getakte" beide Stufen ausreichend Performance abliefern sollten, damit es zu keinerlei Einbußung kommt. Sprich, es kann vorkommen, dass die untere Stufe mal zu früh hochtaktet...umgekehrt sollte es so aber niemals vorkommen, dass eine höhere Stufe runtertaktet obwohl die Stufe damit garnicht fertig werden würde.

Normalerweise würde bei 20% erst dann 1-Stufe runtergetaktet werden, wenn die Last bereits wieder deutlich im Idle-Bereich liegt, weshalb man dabei den hohen Takt viel zu lange unnötigerweise hällt. Im Prinzip takten meine settings daher sogar häufiger hin und her, sie sind auf "Leistung pro Watt optimiert"... lediglich der Idle-State verbraucht geringfügig mehr Strom als 800Mhz-CnQ...aber das ist Leistungsmäßig so ein Absturz, ich finde das geht garnicht... DAS sorgt mMn eher für ständiges hin- und hertakten..., also dass die Idle-Leistung fürn Hintern ist.

Wie gesagt ist das alles nur für ein "Energiesparprofil", welches "gut" und "energiebewusst" performen kann wenn es muss. Ich hab meiner Rechnung deutlich etwas gutes getan ohne dass es irgendwo sonderlich negativ stört, mus smich icht mehr mit CnQ rumärgern, und wollt das einfach nur mal mit der Welt teilen :)
 
Zuletzt bearbeitet:
Warum nicht "PhenomMrsTweaker":

PhenomMrs-Tweaker ist ähnlich orientiert und bietet einige extras. Zum Beispiel definiert es bei mir insgesamt 5-States, wenn man der CnQ-Mod-Service nicht nutzt kann man K10Stat sogar damit erweitern, da es auch dort plötzlich 5-States zur Verfügung hat. Auch lassen sich mit PhenomMrsTweaker die Spannungen einstellen und sogar die Energieprofile mit einbinden. Zu guter letzt lässt sich das Update Intervall extrem eng definieren um die Responsivität zu erhöhen (3x100ms bei KStat ist doch arg viel bis zu Volltakt und deutlich überhalb menschlichem Reaktionsvermögen).

Es hat jedoch leider zwei entscheidende Nachteile:

1. der "Ganged"-Mode der Software kennt leider nur "load based on AVERAGE core", und behilft sich damit aus, dass die Gesamtauslastung 25% anzeigt wenn hochgetaktet werden soll, denn 25% kann bedeuten, dass ein Kern auf 100% ist. Das ist super wenn alle anderen Kerne nichts tun. Das Problem ist wenn jeder Kern mindestens einzeln die 25%-Hürde überschreitet, dann ist ebenso 25% Gesamtauslastung erreicht, aber jeder einzelne Kern hätte noch 75% Luft, trotzdem wird unnötigerweise hochgetaktet. Hier fehlt eine simple Funktion: "load- based on HIGHEST core", welche K10Stat bietet. Wirklich ultra-schade, ein must-have feature für so eine Lösung gerade wenn man eher ein Fan von deaktiviertem COre-Parking ist, was ich nur empfehlen kann... dabei wird die Last dann vom WIndows Scheduler nämlich wenn möglich eher auf alle Kerne gleichmäßig verteilt, besonders für geringe Last durch zB Aero. So entsteht bei PhenomMrsTweaker das Phenomen, dass seltsamerweise hochgetaktet wird wenn man nur die Maus bewegt, was wiederum an DWM.exe und dem load-balancing ohne core-parking liegt ;) Das verträgt sich nicht mit average CPU based load clocking.

2. die Software kennt keine eigenen Profile die man an den Energymode koppeln zu können. So kann man nur ein einzgies mal seine 5 States definieren und damit muss man dann für alle Energieprofile auskommen, lediglich beschränken lässt sich das ganze durch die "state-boundaries". K10Stat erlaubt eine Hülle und Fülle Profile anzulegen.

3. Die Load Schwelle für Up-/Down kann leider nur übergreifend und nicht individuell definiert werden. Das ist schade, da die Usage" auf dem Prozessor auch von seiner Taktgeschwindigkeit abhängt. Ohne dies kann ich leide rnicht so systematisch fine-tunen mit PhenomMrsTweaker wie in den Thread-Posts anhand von K10Stat erklärt.

Mit letzteren beiden könnt ich leben, aber 1. ist ein No-Go. Average CPU load ist für meine Begriffe sehr sehr zu ungenau, damit kann ich nichts anfangen, wahrscheinlich der Grund warum CnQ so wirsch ist. PhenomMrsTweaker erweitert ja nur das klassische CnQ :(



Ich muss daher einmal festhalten, dass es äußerst schade ist, dass keines der Tools weiterentwickelt wird.

K10Stat erlaubt nur "funktionierend" >100ms-Intervalle und PhenomMrs-Tweaker kennt leider nur "average CPU-cores load".

Wirklich schade, damit ist keine der beiden Lösungen wirklich durch und durch perfekt. :(
 
Zuletzt bearbeitet:
Ein weiteres Tool, welches sich perfekt eingliedert nennt sich "Process Lasso".

Vorweg, die Trial dauert nur 4 Tage, danach werden die interessanten Funktionen zwar nicht deaktiviert, aberman kann nichts mehr mehr neues einstellen und man müsste sich die Vollversion kaufen.

"ProBalance":
Prozesse welche den CPU voll auslasten werden intelligent in der Priorität gedrosselt (CPU,I/O,Speicher). Ausnahmen lassen sich einfach definieren.

"EnergySafer":
Das Energieprofil wird nach beliebiger Idle Zeit in einen beliebigen Energymode gesetzt (vornehmlich Energiesparen) und bei Benutzerinteraktion automatisch wieder zurück gesetzt.

"Gaming-Mode-Automatisierungen":
Einzelne Prozesse oder komfortabel ganze Über-Ordner lassen sich von "ProBalance" ausschließen, zur "Vordergrundstärkung" (abzuraten) hinzufügen, oder zu Energieprofil-Umschaltung (Höchstleistung) definieren.

Auch viele viele andere Dinge lassen sich mit Prozess Lasso automatisieren und bietet zentrale Konfigurations-GUI um an viele WIndows-Dinge praktisch und schnell heranzukommen. Im Tray verbraucht es selbst im Niedrigtakt keinerlei signifikante Ressourcen, im Gaming-Mode garnichts.


Mit PhenomMsrTweaker Service-Tweaker habe ich für das Energieprofil Höchstleistung auf "P0 only" 3940 Mhz, welches von Process Lasso automatisch auf alle Prozesse aus " C:\Spiele\*.* " angewendet wird. Für das Standard-Energieprofil Ausbalanciert wurde mit PhenomMsrTweaker P1 - P3 (3444 - 2337 - 1230) festgesetzt, außerdem noch Energiesparen P3 - P4 (1230 - 984).

Ergebis: Normal habe ich CnQ von 3444 -1230 Mhz, wenn ein Spiel läuft immer 3940 Mhz und wenn kein Spiel läuft und ich den Rechner verlasse wird nach 1 Minute automatisch in Energiesparen gewechselt und nurnoch von 1230 - 984 Mhz getaktet.

Alles vollkommen ohne klicken :D

Perfekt wäre jetzt nurnoch wenn PhenomMsrTweaker wenigstens alternativ "load sampling" based on hightest CPU-Core load anbieten würde. :(
 
Hi,

habe den Thread grade gefunden. Ist ja toll. Zwei Anmerkungen dazu:

Es hat jedoch leider zwei entscheidende Nachteile:
1. der "Ganged"-Mode der Software kennt leider nur "load based on AVERAGE core", und behilft sich damit aus, dass die Gesamtauslastung 25% anzeigt wenn hochgetaktet werden soll, denn 25% kann bedeuten, dass ein Kern auf 100% ist. Das ist super wenn alle anderen Kerne nichts tun. Das Problem ist wenn jeder Kern mindestens einzeln die 25%-Hürde überschreitet, dann ist ebenso 25% Gesamtauslastung erreicht, aber jeder einzelne Kern hätte noch 75% Luft, trotzdem wird unnötigerweise hochgetaktet. Hier fehlt eine simple Funktion: "load- based on HIGHEST core", welche K10Stat bietet.
Ich halte es von Vorteil die mittlere Auslastung aller Kerne anstatt der Maximalen Auslastung einzelner Kerne zu verwenden. Warum: Windows hat die dumme Eigenschaft, Rechenthreads ständig zwischen z.B. 2 oder auch mehr Kernen hin und her zu schieben. Nicht immer, aber das kommt vor. Daher könnte es z.B. bei einem 4-Kerner so sein, dass innerhalb der Messintervalls zur Ermittlung des Kernauslastung (10 ms) die Applikation 2.5 ms auf jeden der vier Kerne zubringt. Dann ist jeder Kern nur zu 25 % der Zeit ausgelastet. Hat man sich z.B. eine Maximallast von 40 % pro Kern definiert, würde der Prozessor nicht hochtakten sondern bei 800 MHz verweilen.
Andererseits könnte auch ein Prozessorkern (weil Windows grade mal eine Applikation wirklich auf einen Kern festnagelt) nur mal 45 % zu tun haben (Video abspielen) - er würde hochtakten, obwohl er das nicht müsste.

Zweite Anmerkung: Ich habe ein K8-X2 Subnotebook, das sich mit RM-Clock untervolten lässt [1]. Bei RM-Clock kann man auch noch zusätzlich 'Ereignisse' und 'Aktionen' definieren (in der Pro-Version). So ist z.B. die Maximaltaktabsenkung des Prozessors beim Überschreiten einer gewissen Temperatur einstellbar. Im Notebook ist das nötig, damit es a) nicht durchbrennt und b) nicht so laut wird.
Bei euch im Desktop-Bereich ließe sich damit aber z.B. auch für den alten K10 Deneb (Black Edition) ein Turbo-Modus implementieren. Angenommen die Elektrik des Boards macht es mit, könnte man ihn dann z.B. solange mit 3,8 GHz mit sehr hoher Spannung betreiben, bis er sich über 60°C erhitzt. Ab da taktet er wieder auf seine z.B. 3 GHz Standardtakt herunter. Geht das mit K10stat?
Bringt nichts zum Zocken, aber für einen Arbeitsrechner sicher ein nettes Feature. Und im übrigen genau das Feature, wie Intel gute 15 W Notebookprozessoren herstellt: Man übertaktet sie einfach so lange, wie das Kühlsystem der Lage Herr wird.
 
Darauf wurde shcon eingegangen... ohne aktiviertes Core-Parking scheffelt Windows keine Threads zwischen den Kernen hin und her, sollteste mal abschalten. Es lässt sich kein echter "Turbo" auf Desktop-K10 generieren darauf wurde schon ausführlich eingegangen.

Average taktet einfach nur früher hoch, obwohl dies nicht nötig ist, weil nunmal erst dann hoch getaktet werden muss, wenn ein Kern 100% erreicht, oder alle 25%, oder irgendwo dazwischen. Natürlich ist das besser für die Verfügbarkeitshaltung von (Mehr)-Leistung in parallel-orientierten Umgebungen aber nunmal bescheuert zum Strom sparen UND auch deutlich schlecht für single-thread Apps.

Die Wahl zu haben ob man Average oder Highest soltle auf jeden Fall gegeben und dem Nutzer überlassen sein. NUR Average genügt meinen Anforderungen nunmal nicht, weil zu häufig Energie verschwendet wird. Man nutzt es schließlich um hauptsächlich Strom zu sparen... wenn man höchste Leistungsverfügbarkeit will taktet man halt auf dem höchsten übertakteten P-State.

Ob die Taktprogramme nun 10ms oder 50ms ode rgar 100ms zum hochtakten brauchen spielt für den Zweck nur eine untergeordnete Rolle...hauptsache es wird überhaupt hochgetaktet und die APp bekommt dann für den dauerhaften Zeitraum auch die Mehrleistung...

Wie auch immer bei einem Arbeitsrechener macht es genausowenig Sinn bei durchshcnittlicher Auslastung von 25% schon hochzutakten... eben genau deshalb, weil wie du sagst, bei einer höher als 25% definiert durschnittlichen CPU-Auslastung auf seinem niedrigsten Stufe (800Mhz) hängen bleiben kann. Genau DESHALB brauch man ja eine Bewertung anhand des HÖCHSTEN-ausgelasteten Kernes... was ist daran so schwer zu verstehen?

Wer dann "frühzeitiger/preemptimer" hochtakten will könnte immernoch beispielsweise 60% einstellen...dann würde hochgetaktet werden sobald mindestens einer aller Kerne 60% erreicht... das wäre weit aus später als, wenn alle mit jeweils 25% bei insgesamt 25% shcon hochgetaktet werden würden und imemrnoch frühzeitiger, wenn ein Kern 100% anfordert... denn so wird auch da bei 60% eines Kerns hochgetaktet und nicht gewartet bis ein Kern auf 100% springt damit gesamt 25% erreicht wird.

WIe gesagt AVERAGE ist einfach zu ungenau...weil es nur den Durchschnitt betrachtet... für sowas komplexes wie CnQ brauch man aber detail-Werte... insgebesondere wenn alle Kerne zwangsweise imemr den gleichen Takt und die gleiche Spannung aufweisen MÜSSEN.

Es ist ein Irrglaube das nur und gerade weil die Cores auf dem Metall "GANGED" können ja "Average-CPU-load" fürs clocking ausreicht.... das stimtm nicht. Thread lassen sich nunmal nicht vierteilen. Eben weil es häufig Single-Threads gibt die NUR einen Kern belasten muss man das auch betrachten können um die Taktabstufung anpassen zu können.

Perfekt wäre übrigens ein combiend mode welcher ENTWEDEr hochtaktet wenn ein Kern ein gewisses Level überschreitet ODER alle Kerne ein gewisses average Level überschreitet. So könnte man beispielsweise bei 50% durschnittlicher Auslastung hochtakten oder aber wenn ein Kern einzelnd 75% überschreitet. Aber davon werden wir wohl nur träumen können.

Wobei wenn jemand C++ kann, PhenomMsrTweaker ist open-source.

Der Code für die Erfassung des Loads ist offen einsehbar:
http://sourceforge.net/projects/phe...e/PhenomMsrTweaker v2.0.4 source.zip/download

...Service\CPULoadMonitor.h

Hat jemand ne Idee wie man das umcoded auch das gewünschte?
 
Zuletzt bearbeitet:
Darauf wurde shcon eingegangen... ohne aktiviertes Core-Parking scheffelt Windows keine Threads zwischen den Kernen hin und her, sollteste mal abschalten. Es lässt sich kein echter "Turbo" auf Desktop-K10 generieren darauf wurde schon ausführlich eingegangen.
Kurz zum Nachfragen: Du lässt dir z.B. mit dem Windows-Taschenrechner die Fakultät von 100'000 ausrechnen und nur ein Kern erreicht 100 % (ohne manuelle Festlegung im Taskmanager), während alle anderen bei quasi 0% Auslastung rumdümpeln? Wenn ja, was genau hast du bei Windows 7 verstellt?
So recht will ich das nicht glauben, verschluckt sich doch Windows 7 selbst hin und wieder an Hyperthreading.

So richtig erschließt sich mir auch nicht, warum die mittlere Auslastung aller Kerne für Single-Thread-Apps schlechter sein soll. Das mit dem Stromsparen ist mir jetzt klar, vier Threads die z.B. Netzwerkanfragen bedienen und für sich jeweils nur 30 % CPU-Zeit im idle brauchen, laufen nicht (viel) besser, wenn man den Prozessor hochtaktet.
 
Du hast da was falsch verstanden. Ich sagte bei mir scheffelt Windows KEINEN EINZELNEN Thread von einem Kern zu einem anderen UM.

Dein Argument ist jetzt, dass doch neue Threads gespawnt werden und Pragrammierer die Last einer Rechnung durch 4 Threads die EINMALIG auf untershciedlichen Kernen gestartet werden abgearbeitet werden... na und? natürlich geht da sbei mir auch....

Auch dein Taschenrechner verteilt nich einen Thread auf 4 Kerne... erklär mir mal wie er da smachen soll ^^

Der Punkt ist dass damit (deaktiviertes CP) eben keine AKTIVEN Threads zwischen den Kernen wechseln... Windows spawnt mit deaktiviertem Core-Parking eben NICHT mehr nur auf EINEM Kern, in der Regel den mit der niedrigsten Last und lagert nur im Notfall um, es wird eben nicht mehr "pro-aktiv" permanent zu einem Kern geschiftet, damit die anderen "abschalten können" (siehe Frametime). Die Threads werden abwechselt verteilt zu gleichen Anteilen auf ALLEN Kernen gestartet. Auch mit deaktiviertem Core-Parking sind dann alle Kerne auf 100% Last.

Du tust immernoch so als würde aktiviertes Core-Parking Leistung bringen...du hast garnichts verstanden ^^

Du verstehst also nicht warum die Aussage durschnittlicher Notendurchschnitt "Drei" ungenauer ist als ... "mathe 6, physik 6, informatik 6, sport 1, kunst 1, musik 1"..... Bei diesem Kind ist kein Nachhilfebedarf...steht doch 3....

Vielleicht weil der Durschnitt umso unbedeutender wird, je mehr Fächer es gibt. Wichtig ist doch, dass nachgeholfen wird.... am besten shcon sobald sich IRGENDWO ein Defizit (4-) bildet ;)

Bei 8 Kernen ist 1 Thread auf einem Kern 100% = 12,5% Average CPU... wie willst du da noch irgendwas effizient "genau" regeln für parallele Threads. Das Konzept hinkt einfach.

Naja vielelicht begreifst du es noch.



Ich versuchs nochmal anders.

Bei 4 Kernen kann Average CPU-Load 25% viel bedeuten

Für einen einzelnen fordernden Single-Thread in einem idleden System bedeutet dies, dass erst dann eine Taktänderung erzwungen wird, wenn die Auslastung ~99% erreicht. Das ist für meinen Geschmack viel zu spät. Ich möchte bereits bei einer SIngle-Core auslastung von 80% hochtakten.

Für vier gleichmäßig fordernde parallele Threads bedeutet dies, dass schon bei einer gleichmäßigen Auslastung von 25% hochgetaktet wird. Das ist wiederum für meinen Geschmack viel zu früh und verschwendet unnötig viel Energie, da "relativ geringe" Last dann mit völlig überhöhtem Takt (und VCore) abgearbeitet wird.

Ich möchte:

1. Highest CPU-Core Load - (Available Range: 25% - 100%)
Sobald ein Kern mindestens XX % Auslastung erreicht wird auf jeden Fall hochgetaktet.

2. Average CPU-Load (Available Range: 25% - 100%)
Ist 1. nicht der Fall soll der Prozessor trotzdem hochtakten, wenn eine durschnittliche Gesamtauslastung von XX % erreicht wird.

Einfach beides gleichzeitig ist kein Problem... sobald man Average >25% (also in einen sinnvollen Bereich bewegt) beeinflusst es den "Hightest-CPU-Core-Load" nicht mehr, da der Wert über 100% läge.

Wenn man jetzt 1. auf 100% stellt und 2. auf 25% dann hätte man das alte Standard-Schema. Ich behaupte, dass 1. auf 80% und 2. auf 50% viel besser wäre...sowohl zum stromsparen (Parallel), als auch für schnellere Leistungsverfügbarkeit (Single-Threads). Man könnte sogar den Highest-CPU-Core-Load ebenfalls auf 25% setzen, dann würde schon ultra-pro-aktiv hochgetaktet werden sobald irgenwas ein bischen CPU fordert. ^^

Der Puntk ist dass "nur" Average einfach ein bischen "schwach" ist für PhenomMsrTweaker... schau dir halt mal K10Stat an, da kann man sich aussuchen ob GANGED based on Highest/average/lowest + UNGANGED...also 4 Optionen! Das musst du doch verstehen können. Die Effizienz- und Leistungswerte sind durchweg besser bei Highest statt Avergae beim Phenom II und es lässt sich feiner einstellen auf entweder "mehr stromsparen" oder "früher hochtakten", während man bei Average einen sehr begrenzten Einstellbereich hat, umso ungünstiger je mehr Kerne man hat.

Die Combo-Einstellmöglichkeit würde nätürlich sowohl Average einzeln als auch Highest einzelnd in den Schatten stellen. Besser ginge es nich. :D
 
Zuletzt bearbeitet:
@TE
Und ist es dir möglich, ohne großen Aufwand für jeden Phenom II ein optimales (o. zumindest optimiertes) Profil zu erstellen und weiterzugeben? Könntest du also z.B. für meinen 965 BE (müsste Stepping C2 sein) ein Profil basteln und ich müsste es nur per Software einschalten/übernehmen?
 
Du hast da was falsch verstanden. Ich sagte bei mir scheffelt Windows KEINEN EINZELNEN Thread von einem Kern zu einem anderen UM.
[...]
Auch dein Taschenrechner verteilt nich einen Thread auf 4 Kerne... erklär mir mal wie er da smachen soll ^^
Durch Zeitmultiplexing. Nennen wir als Anzeige-Interval 1 Sekunde. Die ersten 200 ms läuft er auf Kern 1, dann wird es auf Kern 2 verschoben um bei 900 ms auf Kern 3 verschoben zu werden. Damit hätten wir für die Kerne eine Auslastung von 20, 70 und 10%.
Meines Wissens ist das jedoch nicht wirklich reproduzierbar. Ich hatte auch schon den Fall, das auf meinem i7 Windows zwei Rechenthreads so blöd verlagert hat, dass ein physischer Kern zur Hälfte Däumchen dreht, während beim zweiten beide logische Kerne benutzt wurden.

Hier ist mal ein Beispielbild, bei welchem die Lastverteilung einer Single-Thread-Applikation noch recht gut aussieht. Manchmal verteilt Windows die Last aber auch 50:50.
2014-03-29_1.png


Der Punkt ist dass damit (deaktiviertes CP) eben keine AKTIVEN Threads zwischen den Kernen wechseln... Windows spawnt mit deaktiviertem Core-Parking eben NICHT mehr nur auf EINEM Kern, in der Regel den mit der niedrigsten Last und lagert nur im Notfall um, es wird eben nicht mehr "pro-aktiv" permanent zu einem Kern geschiftet, damit die anderen "abschalten können" (siehe Frametime). Die Threads werden abwechselt verteilt zu gleichen Anteilen auf ALLEN Kernen gestartet. Auch mit deaktiviertem Core-Parking sind dann alle Kerne auf 100% Last.
Was mich jetzt etwas wundert - Core-Parking sollte keine Einfluss auf einen Phenom II haben, weil dieser nur echte Kerne besitzt. Ein Zitat von heise:
Anders als Windows Server 2008 kann Windows 7 übrigens nur logische Prozessorkerne parken; bei Multi-Core-Prozessoren ohne Hyper-Threading, also mit ausschließlich physischen Kernen, kommt Core Parking nicht zum Einsatz.
http://www.heise.de/ct/hotline/Bitte-nicht-parken-1100682.html

Noch zwei Fragen zu K10stat, weil auch bei mir evtl. irgendwann ein Phenom auf der Einkaufsliste steht:
a) Besitzt K10stat jetzt 'Ereignisse' und 'Aktionen' aus. Könnte ich z.B. beim Überschreiten der 50 °C Marke in ein anderes Anwendungsprofil schalten?
b) Kann man, einen Black Edition Prozessor vorausgesetzt, auch die höheren Multiplikatoren jenseits der Turbostufen ansteuern?
 
Hallo,

ich möchte dir deine Mühen nicht schlecht reden, aber du erwartest deutlich zuviel von deiner manuellen Anpassung. CnQ in der automatischen Version über das BIOS und das Energieschema von Windows kennt mittlerweile je nach Prozessor auch schon mehrere P-States, die problemlos funktionieren. Wie du selbst schon geschrieben hast, spielt es eigentlich keine Rolle, ob die CPU bei 800 Mhz oder 1 Ghz. rumidelt. Ebenso spielt es keine wirkliche Rolle, ob die CPU bei 0,8V oder 1,1V rumidelt. Wir reden hier von 1 bis maximal 3W, die 3W fallen dann aber auch bei einem überdimensionierten System an. Zudem finde ich mittlerweile, dass die CPU doch für einen Moment auch problemlos auf den höchsten P-State steigen darf, wenn die Leistung benötigt wird. Es wird ja nichts gewonnen, wenn ich dem System aufzwinge, dass es bei bestimmten Auslastungen in einem niedrigeren P-State gefangen wird, nur um vermeintlich Energie zu sparen. Wenn Rechenaufgabe X bei 3,0 Ghz. 10 Sekunden braucht und bei 1,5 Ghz. 20 Sekunden ist die benötigte Energie nahezu die Gleiche, aber ich habe das System um 10 Sekunden verzögert, was auch ein eigentlich modernes System altbacken erscheinen lässt. Dazu noch die Eigenheiten des Schedulers, dass er teilweise willkürlich Threads zwischen Kernen verschiebt und damit den Tools ständig Steine in den Weg legt.

Der einzige große Vorteil, den du mit K10stat, RMClock oder ähnlichen Programmen erhältst, ist das mögliche Undervolten bei hohen Spannungen bei Beibehaltung der CnQ-Funktionen. So kann ich meinen Phenom X2 545 mit 3,0 Ghz bei 1,1 V betreiben anstatt 1,45 V, die manuell über das BIOS anstehen. Das bringt wirklich was, ist aber leider auch ein Glücksspiel, da man keine Garantie hat, dass jede CPU diese Werte stabil nutzen kann.

Aber jetzt kommt der große Nachteil dieser Programme: Mittlerweile ist es äußerst umständlich und kompliziert diese Programme im Autostart einzublenden, so dass sie ständig aktiv sind und auch nicht nach einer Standby-Phase ausfallen. Dann hab ich noch den Spaß, dass es sporadisch ausfällt, also das Programm grundlos nicht mehr beim Start geladen wird, obwohl nichts verändert wurde. Also muss ich doch wieder regelmäßig drüberschauen.

Dann kommen noch Spezialfälle, wie mein Thinkpad mit dem T5870 von Intel. Ich kann K10Stat oder RMClock problemlos nutzen, jedoch habe ich bei weitem nicht die Möglichkeiten VCore und Takt so anzupassen, wie es die CPU automatisch über das BIOS macht. Also wieder "never touch a runnin system".

Wenn man ehrlich ist und es deutlich und hart ausdrückt: Mit einem i3-4310 kann ich ohne manuelles Eingreifen schneller und energiesparender meine Aufgaben erledigen als wie mit dem am besten "getweakten" K10-Quadcore. Ich hab mich selbst jahrelang mit diesen Programmen rumgeärgert, um 1 W und noch 1 W einzusparen, aber außer viel Zeitverschwendung hab ich nicht viel gespart. Allein um alle P-States stundenlang mit Prime auf Stabilität zu testen, hat wohl deutlich mehr Strom verschwendet, als das System hinterher einsparen konnte ... ich bin echt soweit, dass diese Thematik mein zukünftiges Kaufverhalten prägt. Eine CPU zu kaufen, um sie nachträglich auf Stromsparen zu trimmen ist eigentlich sinnfrei und dient nur als Beschäftigungstherapie. Leichter vorher seinen Bedarf und Wünsche konkret berücksichtigen und die passende CPU dafür zu kaufen ...

Gruß Klaus
 
Produktiv ist das mit dem Undervolting, außer vielleicht für Cruncher, ohnehin nicht, nur wie sonst soll man sich denn einen AMD-Prozessor schmackhaft machen? ;D

Ich habe auf die Schnelle noch mal den Artikel zur temperaturgesteuerten Maximaltakt-Einstellung online gestellt, ist schon länger geplant gewesen. Ist ein Entwurf, speziell im letzte Bildchen sollte aber klar werden, wie ich das mit dem 'Drosseln bei Bedarf' meine:
http://www.foveon.de/sonstiges/lenovo_x100e_RMClock/index_Autosteuerung.htm

Ich weiß jetzt immer noch nicht ob das z.B. K10stat kann. (@CosmiChaos: Sag bitte etwas zu.)

Für einen Quadcore Llano wäre das m.E. von Interesse, freier Multi sei dank. Im Notebook bekommt man die Wärme nicht weg, nur ist es Schmarn nur deswegen einen Quadcore mit Einkernlast auf 1,4 GHz laufen zu lassen. Der AMD-eigene Turbo scheint ein ziemlicher Blindgänger zu sein, zumindest bei Llano.
 
Zurück
Oben Unten