Erste Benchmarks mit Phenom TLB-Erratum 298 BIOS-Patch

Also ehrlich gesagt wundert es mich schon, dass der Performance-Malus allein durch die Abschaltung des L3-TLB so derart gravierend ausfällt *noahnung* Dadurch fällt der Phenom laut den Benchmarks von TR in der Leistung noch hinter die K8-CPUs wie den X2 5600+ zurück. Gut, der ist etwas höher getaktet, als der Phenom, aber immerhin hat der überhaupt keinen L3-Cache und nur 2 Kerne.

Blickt man mal auf die K8-Prozessoren und vergleicht die Varianten mit 2x 512 KB Cache mit denen mit 2x 1024 KB Cache, stellt man fest, dass die Unterschiede gering sind, pi Mal Daumen ca. 5-10 Prozent über verschiedene Anwendungen hinweg gemittelt. Die Verdoppelung des schnellen Level 2 Caches bringt beim K8 also im Mittel maximal 10 Prozent Leistung.

Der 2 MB große Level 3 Cache beim Phenom ist ja im Endeffekt auch nichts anderes, als eine Verdoppelung der 4x 512 KB L2-Caches, allerdings mit dem Nachteil, dass die Latenzen des L3 deutlich höher sind, als jene des L2. Wie kann dann die Abschaltung eines kleinen Zusatz-Goodie des L3-Cache namens TLB die Performance in der Art und Weise beeinflussen wie man es bei den TR-Benchmarks gesehen hat? 14 Prozent im Mittel - das ist horrend. So einen Einfluss hätte ich nicht einmal erwartet wenn der L3-Cache komplett deaktiviert worden wäre.

Irgendwas passt da nicht zusammen. *nein*
 
Also ehrlich gesagt wundert es mich schon, dass der Performance-Malus allein durch die Abschaltung des L3-TLB so derart gravierend ausfällt *noahnung* Dadurch fällt der Phenom laut den Benchmarks von TR in der Leistung noch hinter die K8-CPUs wie den X2 5600+ zurück. Gut, der ist etwas höher getaktet, als der Phenom, aber immerhin hat der überhaupt keinen L3-Cache und nur 2 Kerne.

Blickt man mal auf die K8-Prozessoren und gleicht die Varianten mit 2x 512 KB Cache mit denen mit 2x 1024 KB Cache, stellt man fest, dass die Unterschiede gering sind, pi Mal Daumen ca. 5-10 Prozent über verschiedene Anwendungen hinweg gemittelt. Die Verdoppelung des schnellen Level 2 Caches bringt beim K8 also im Mittel maximal 10 Prozent Leistung.

Der 2 MB große Level 3 Cache beim Phenom ist ja im Endeffekt auch nichts anderes, als eine Verdoppelung der 4x 512 KB L2-Caches, allerdings mit dem Nachteil, dass die Latenzen des L3 deutlich höher sind, als jene des L2. Wie kann dann die Abschaltung eines kleinen Zusatz-Goodie des L3-Cache namens TLB die Performancen in der Art und Weise beeinflussen, wie man es bei den TR-Benchmarks gesehen hat? 14 Prozent im Mittel - das ist horrend. So einen Einfluss hätte ich nicht einmal erwartet, wenn der L3-Cache komplett deaktiviert worden wäre.

Irgendwas passt da nicht zusammen. *nein*

Ich behaupte ja auch immer noch, dass es keinen "TLB des L3-cache" gibt. Das ist AMD Marketing-Sprech. Der Fehler muss irgendwo in der MMU-Funktionalität des Chips stecken, möglicherweise irgendwie im Zusammenhang mit dem L3, aber eben doch grundlegender. Wobei ein völliges Fehlen aller TLB-Funktionalität sicher eher noch mehr Leistung kosten würde.

Wenn der Mann aus dem Urlaub zurück ist, der als einziger in der Lage ist, die Errata-Listen bei AMD zu aktualisieren, dann wissen wir vielleicht mehr.....*chatt*
 
Zuletzt bearbeitet:
Tja es ist in der Tat traurig das zu sehen.

Aber was solls, die kommen wieder hoch.

Die ganze Sache mit dem K10 und seinem Launch riecht für mich nach einer BWLer Entscheidung an der Expertise der Techniker vorbei.
Ich denke nicht, dass AMD das Problem und seine Auswirkungen erst kurzfristig entdeckt hast. Nur bei amerikanischen Aktiengesellschaften heißt es ja: als erstes kommt der Aktienbesitzer, dann die Firma, dann die Kunden und irgendwann mal kommen dann die Beschäftigten.
Aber nunja, das ist viel Spekulation meinerseits.

Wies auch immer gelaufen ist, dass sichtbare Ergebnis ist das, was zählt.

Und es sieht aktuell für den K10 nicht so aus, wie man es hätte erwarten können.

Gruß ErichH.

Edit: Dabei ist es letztlich egal, was für ein Fehler es ist.
 
Ich behaupte ja auch immer noch, dass es keinen "TLB des L3-cache" gibt. Das ist AMD Marketing-Sprech. Der Fehler muss irgendwo in der MMU-Funktionalität des Chips stecken, möglicherweise irgendwie im Zusammenhang mit dem L3, aber eben doch grundlegender. Wobei ein völliges Fehlen aller TLB-Funktionalität sicher eher noch mehr Leistung kosten würde.
Wenn man sich den patch und dessen Beschreibung durchliest geht es im Grunde nicht um den TLB des L3 sondern um das zwangsweise Ausräumen des L2 wenn dieser überläuft.
Dabei werden Daten in den L3 verschoben. Während dieser Zeit kann es passieren dass bestimmte bits im TLB nicht korrekt gesetzt werden, oder zu spät oder überholt sich was, was auch immer.
The basis for the kernel patch solution depends on the root cause of the L2 eviction problem
In der MMU selbst dürfte nicht das Problem sein, sondern im Zusammenspiel der vielen Komponenten die out of order arbeiten gibt es ein verflixtes Timing Problem, denke ich.

lg
__tom
 
Schon mal sehr gut, dass hier auf der Site umfangreich über den Phenom berichtet wird. Siehe Artikel von Nero. Da steht eindeutig, dass das momentane B2-Stepping beim Phenom nicht empfehlenswert ist. Sieht man die Benchmarkergebnisse mit TLB- BIOS Fix
kann man auch nur zu diesem Schluss kommen. Danke für die unabhängige Einschätzung!
Ich hab mir lange überlegt einen Phenom 9500 vor Weihnachten zu kaufen, dazu ein 790FX-Board.
Jetzt warte ich definitiv auf das B3 Stepping, und mal sehen...der Nachfolger des Amd 690 G Chipsatzes also die IGP für den Phenom. So lange wirds ja nicht mehr dauern, ich rechne mit Anfang März...


Grüße!
 
Auweiah AMD... :(
Eigentich sollte mein C2D nur eine kurze Übergangslösung sein (wollte mal wieder basteln und Intel kannte ich bis dahin noch nicht) und dann schnell auf den Phenom umsteigen, aber so wie es aussieht muss mein jetziges Sys wohl doch noch bis Ende des nächsten Jahres durchhalten, ich hoffe bis dahin hat AMD die Probleme im Griff und den Phenom auf vernünftige Taktraten bei vernünftiger Verlustleistung gebracht.
Naja, vielleicht gönne ich mir noch ein Graka Update auf eine 3870..... wenn sie denn mal verfügbar ist....

Krümel
 
der Nachfolger des Amd 690 G Chipsatzes also die IGP für den Phenom.
Davon gibt es sogar gleich drei:

AMD 780G alias RS780 mit Pixel Shader 4.1, Universal Video Decoder und Display Port

AMD 780V alias RS780C mit Pixel Shader 4.1 und Universal Video Decoder, aber ohne Display Port

Und dann noch der AMD 740G alias RS740 mit Pixel Shader 3.0 ohne Universal Video Decoder und nur PCIe 1.1 Unterstützung
 
Wenn man sich den patch und dessen Beschreibung durchliest geht es im Grunde nicht um den TLB des L3 sondern um das zwangsweise Ausräumen des L2 wenn dieser überläuft.
Dabei werden Daten in den L3 verschoben. Während dieser Zeit kann es passieren dass bestimmte bits im TLB nicht korrekt gesetzt werden, oder zu spät oder überholt sich was, was auch immer.


Den Linux kernel Patch bzw. dass der etwas beschrieben ist, das hab ich übersehen. Vielen Dank! Das macht es schon etwas klarer und deckt sich in etwa mit dem, was mir AS gestern auf meine email-Anfrage, was denn ein "TLB des L3-cache" bloß sei, in einem ultrakurzen Satz auch gesagt hat.
 
Ich verstehe nur nicht, warum jetzt ständig nach Preisnachlässen gerufen wird. Schaut euch doch einmal die Phenom Preise an. Die sind ausgesprochen niedrig. Die liegen sogar noch unter dem sonst für die Flaggschiffe üblichem Athlon 64 FX Niveau. Und es ist nachvollziehbar weshalb. Dies ist sicher nicht nur wegen des Preisdrucks geschehen, sondern weil AMD schon bei der Preisgestaltung um den TLB Bug des L3 Caches wusste. Jetzt nachträglich eine zweite Preisminderung zu verlangen ist verfehlt. Zumal AMD mit den TLB Bug nicht verheimlicht hat und von Anfang an von Geschwindigkeitseinbußen ab 10 Prozent sprach.

Also erstmal sind es MEHR als 10%
Zweitens hat AMD NICHT von Anfang an gesagt das damit zu rechnen ist sondern erst SPAETER und auserdem wurde gesagt VON AMD (nicht inquirer) das nur die CPUs mit mehr als 2,3 Ghz das Problem haben. Und die Preise sind auch NICHT ausgesprochen niedrig. man bekommt einen 6600 fuer den gleichen Preis und dieser 6600 ist bei GLEICHEM Takt (also Phenom OC) schneller und das auch OHNE dieses Biosupdate. Mit dem Update ist der Phenom DEUTLICH langsamer fuer gleiches Geld. Und das "Flagschiff" ist halt auch schneller von daher owhl auhc teuer. Und was fuer ne Unverschaemtheit ist es denn erst wenn sie shcon bei der Preisgestaltung wussten das die Teile defekt sind, sie ausgeliefert haben und einen Patch erst NACHSCHIEBEN (zumal der Server ja schon seid laengerer Zeit draussen ist und der wohl auch diesen Bug haben wird.

Langsam geht mir dieses ultra "Was regt ihr euch denn alle auf, das ist doch alles ganz normal" gelaber auf den Sack. Das ist nun wirklich nurnoch Fanboy.

Ich kauf doch auch kein Auto was man erst Wochen NACH dem Kauf noch drosseln muss damit ich keinen Kolbenfresser bekomme falls ich zu schnell fahre.
 
Klasse wenn man die Informationen so ausgibt das man nicht mal als HALBWEGS versierter User versteht was das fuer Konsequenzen hat (ja mit CPU Architektur kenn ich nicht NICHT aus) dann ist das natuerlich eine ganz dolle Informationspolitik.
Egal. Selbst wenn sies gemacht haetten. Warum haben sie nicht gleich den Patch rausgebracht sondern was auf den marktgeworfen was erst gepatcht werden muss durch ein BIOSUPDATE (was ja nun auch nicht jedermans sache ist). Bezahlt AMD das wenn ich zum haendler gehe und mir den patch mache? Wieviele normaluser BEKOMMEN DAS UEBERHAUPT MIT? Nicht jeder Liest hardwareseiten. EINFACH BESCHISS. Sorry aber anders ist das nicht zu bezeichnen. Mein Cousin kauft sich son Teil und wird 100% niemals mitbekommen das es diesen Patch gibt. Er kauft also ein defektes Produkt.

Und HIGHEND ist der Phenom nicht. Wo ist der HighEnd?

Ich steh zu AMD. Seit ich hier bin hab ich 7 AMD Rechner und 1 INTEL zusammengebaut. Und den INTEL auch nur weil ich da so neu war das ich nicht wusste wo die anderen Hardwareshops sind. AMD ist im 30-50 Eurosegment wirklich unschlagbar. Ich hab auch grad ne 3850 bestellt weil ich es cool finde das sie so sparsam sind und dabei alle aktuellen games spielbar auf den bildschirm bringt.

Aber der Phenom. DER PHENOM. Das ist ja BISSHER noch misratener als die 2900XT.
 
Zuletzt bearbeitet:
Zuletzt bearbeitet:
ja weil intel innerhalb KUERZESTER zeit ein neues stepping nachgelegt hat. Ausserdem liesst sicher dieser C2D Bug viel spezifischer als der von AMD. Bei AMD passiert halt was unter Volllast. Bei INTEL unter extrem bestimmten sachen bei einem ganz bestimmtem Code. Auserdem wurde es ohne 15% leistungseinbussen gefixt. AMD bringt in 2-3 monaten was neues raus und einen patch der die leistung um 13-19% einschraenkt. Und was ist wenn mein Cousin ganz am Anfang gekauft haette? in den ersten 2 Wochen? Beschiss ist beschiss aber du findest sicher immer noch Wege AMD schoenzureden.
 
Zuletzt bearbeitet:
...aber du findest sicher immer noch Wege AMD schoenzureden.
Das möchte ich nicht einmal. Es geht nur um Gerechtigkeit und es ist nunmal so, dass der Phenom 9xxx besser ist als sein Ruf.

Jetzt fehlt nur mehr auf multithreaded optimierte Software, damit er sein Potential vollends entfalten kann.
 
Ich schätze das es mit dem AM3 Sockel erst bei AMD wider abgeht.
Das mit dem AM2+ ist doch nur ein verkorxter Übergang.

Wie man sieht braucht Entwicklung Zeit. Um neue Architekturen auszunutzen
braucht man Exemplare auf denen man programmieren kann.

Ich sag nur durchhalten.8)
 
ja weil intel innerhalb KUERZESTER zeit ein neues stepping nachgelegt hat. Ausserdem liesst sicher dieser C2D Bug viel spezifischer als der von AMD. Bei AMD passiert halt was unter Volllast. Bei INTEL unter extrem bestimmten sachen bei einem ganz bestimmtem Code. Auserdem wurde es ohne 15% leistungseinbussen gefixt. AMD bringt in 2-3 monaten was neues raus und einen patch der die leistung um 13-19% einschraenkt. Und was ist wenn mein Cousin ganz am Anfang gekauft haette? in den ersten 2 Wochen? Beschiss ist beschiss aber du findest sicher immer noch Wege AMD schoenzureden.

Du magst ja deine CAPS LOCK-Taste WIRKLICH SEHR GERNE, ODER?
:o
;D
 
Das möchte ich nicht einmal. Es geht nur um Gerechtigkeit und es ist nunmal so, dass der Phenom 9xxx besser ist als sein Ruf.

Jetzt fehlt nur mehr auf multithreaded optimierte Software, damit er sein Potential vollends entfalten kann.

Also das scheint nichtmal AMD so zu sehen. Auslieferungsstop. Dieser Fehler ueberschreitet alles bissher dagewesene im CPU Bereich. Auslieferungsstop. Das gabs das letzte mal beim P3 1,13 Ghz. Und das nicht weil er defekt war, sondern einfach nur hoffnungslos uebertaktet (ja da hat INTEL noch abgestunken *G*)

Und die hoffnung auf optimierte SOftware erinnert mich an die optimierten Treiber fuer die 2900XT (aus denen nie was geworden ist)

Komisch das INTELs Quad trotz unoptimierter Software schoen schnell ist...

PS:
Du magst ja deine CAPS LOCK-Taste WIRKLICH SEHR GERNE, ODER?
Sehr sogar *G* ich brauch ne taste mit der ich auf knopfdruck kursiev schreiben kann um bestimmte woerter zu betonen.
 
Zuletzt bearbeitet:
Komisch das INTELs Quad trotz unoptimierter Software schoen schnell ist...
Heutige Software enthält oftmals Optimierungen für Pentium und Core Prozessoren aus dem Hause Intel. Meist im Zusammespiel mit den SIMD Einheiten. Allein deshalb weil oftmals ein Intel eigener Compiler zum Einsatz kommt. Allerdings will ich nicht in Abrede stellen, dass die Core 2 Quad aufgrund dieser Optimierungen derzeit die bessere Wahl sind. Bis auch die neuen Funktionen, wie AMD-V oder SSE128, der Phenom 9xxx in den Genuss davon kommen werden noch einige Monate ins Land gehen.
 
1.) Der Unterschied ist, dass der Bug im C2D nicht relevant ist. Es kann nur unter ganz bestimmten Bedingungen eine nicht wirklich relevante Sicherheitslücke auftreten, aber die Stabilität ist nicht gefährdet.

2.) Dass der Phenom mit den Quads von Intel nicht mithalten kann, war irgendwie klar. Die Aufgabe von AMD war es, überhaupt einmal einen Quad Core zu bauen. Bisher waren maximal 2,7GHz drin bei 65nm und da beim Quad auch die Verlustleistung halbiert werden musste, finde ich 2,3-2,4GHz gar nicht einmal so schlecht, da ja auch eine Performancesteigerung da ist. Dass nicht auf einmal das große Wunder auftaucht, war ja irgendwie klar.

3.) Dass das Beta BIOS von MSI sau langsam ist und man die Abschaltung des TLB nicht umgehen kann, wollt ihr doch nicht ernsthaft AMD in die Schuhe schieben;D
Tatsache ist, dass es einen Bug gibt, der zu Instabilitäten führen kann, aber dass bei der Behebung so viel Leistung drauf geht, daran ist MSI schuld.

4.) Das, was man AMD vorwerfen kann ist, dass ihre CPUs instabil sind und sie das Problem vertuschen wollen, anstatt die CPUs per Rückrufaktion auszutauschen, was sie sich aber leider nicht leisten können, weniger finanziell, als vom Image her. Meiner Meinung nach sollte AMD lieber eine ordentliche High End Karte bei den Grafikkarten bauen. Da haben sie nämlich nicht den Nachteil bei der Fertigung. Wenn sie zwei 3870 zusammenstöpseln mit 512Bit Speicheranbindung, dann würde sie das gleich einmal viel weiter bringen. Bei den CPUs sollten sie sich auch vom Privatkundengeschäft trennen und nur noch Opterons fertigen. Da haben sie nämlich den Vorteil, dass ihre CPUs sehr gut mit der Anzahl an Kernen skalieren. Da haben auch niedrig getaktete Quads eine Daseinsberechtigung. Mit 2-4 Sockeln ist das sogar brauchbar, wenn sie die Bugs bereinigen. So etwas, wie der TLB Bug darf, dann halt nicht mehr vorkommen. Im Privatkundengeschäft, gibt es sowieso nichts mehr zu holen. Intel bringt günstige Dual Cores mit viel Takt raus, wo AMD nicht mit kann und nur Semprons fertigen macht keinen Sinn. Quad Cores mit wenig Takt, sind auch Blödsinn, weil die User, die wirklich Quads brauchen, sind sehr selten und die wollen dann, doch viel Performance haben für Rendering, Videoencoding etc. Der typische Spieler oder Office User (da ist Performance nämlich auch nicht so egal, wie immer alle tun) ist da mit einem Dual Core je nach Budget zwischen 2,4 und 3GHz besser bedient.
 
1.) Der Unterschied ist, dass der Bug im C2D nicht relevant ist. Es kann nur unter ganz bestimmten Bedingungen eine nicht wirklich relevante Sicherheitslücke auftreten, aber die Stabilität ist nicht gefährdet.
Die Relevanz/Bedeutung hier ist aber schon eindeutig geklärt?
Auch hier kann der Bug nur unter bestimmten Bedingungen auftreten und zumindest für
Linux gibt es bereits einen Patch, der sogar ohne Performanceverlust auskommen soll.

4.) Das, was man AMD vorwerfen kann ist, dass ihre CPUs instabil sind und sie das Problem vertuschen wollen, anstatt die CPUs per Rückrufaktion auszutauschen,
Ob die CPUs stabil sind kann man doch gar nicht testen. Wenn es derzeit zu Abstürzen
kommt, dann kann das genauso gut ein Fehler der noch nicht ausgereiften BIOS Versionen
sein. Davon, dass AMD das Problem vertuschen will kann nun wirklich auch keine Rede
sein. AMD hat selbst dieses Problem ins Gespräch gebracht, es wurde nicht von
irgendeiner Webseite publiziert. Dazu noch wurde es kurz vor der Präsentation der B2
CPUs veröffentlicht. Also da kann von Vertuschen wirklich keine Rede sein.
Evtl. gibt es ja seitens Microsoft (na bemerkt jetzt mal einer den Nachteil von Closed source:])
auch noch einen Patch, der ohne Performanceverlust auskommt.
 
Ich behaupte ja auch immer noch, dass es keinen "TLB des L3-cache" gibt.


Da liegst du anscheinend nichtmal so verkehrt, wenn man sich den Software Optimization Guide for the AMD Family 10h Processors so anschaut. Steht doch auf Seite 221 "The AMD Family 10h processors utilize a two-level TLB structure." L1 Instruction/Data und L2 Instruction/Data. Einen TLB für L3 gibts da nicht.
Diese two-level structure hatte aber der K8 auch schon (Software Optimization Guide for AMD64 Processors S. 254).
Welcher TLB wird dann deaktiviert, der vom L2? Oder was wird Bios-gepatcht? Der L3 komplett deaktiviert?
 
Zuletzt bearbeitet:
Wenn ich einen Phenom gekauft hätte, dann würde ich dieses Ding jetzt wieder zurückgeben!
 
Zurück
Oben Unten