Korrektur zur TLB-Erratum 298 Berichterstattung

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.445
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Einen Tag vor der offiziellen Vorstellung des AMD Phenom <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1195410896">berichteten</A> wir, dass AMD den Phenom 9700 wegen eines Bugs zurückgezogen hat. Die damalige offizielle Erklärung zu diesem Bug lautete:<ul><i>The Translation Lookaside Buffer (TLB) errata is an L3 protocol issue causing a system hang when running certain client workload applications independent of platform.</i></ul>Woraus wir (sowie die meisten anderen Publikationen) folgerten, dass es sich um einen Fehler im TLB des Level 3 Cache handelt. Allerdings gab es bereits von Anfang an Stimmen, auch bei <a href="http://www.planet3dnow.de/vbulletin/showthread.php?p=3426591#post3426591">versierten Lesern bei uns im Forum</a> (danke masel und larsbo für den Hinweis), dass der Level 3 Cache des Phenom eigentlich gar keinen TLB haben dürfte.

Leider scheint ja der einzige Mann, der bei AMD die Revision-Guides pflegen kann, derzeit <a href="http://www.heise.de/newsticker/meldung/100165" TARGET="_blank">im Urlaub</a> zu sein. Aus diesem Grund fehlt das Erratum 298 und dessen ausführliche Beschreibung noch immer in diesem Dokument. Allerdings hat ein kürzlich veröffentlichter <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1196897489">Linux-Patch</A> zur Umgehung des TLB-Erratum 298 sowie der <a href="http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/40546.pdf" TARGET="_blank">Software Optimierungs-Guide für den K10</a> ab Seite 219 einiges Licht in die eigentliche Ursache gebracht. Demnach liegt es nicht an einem fehlerhaften TLB des Level 3 Cache (dieser besitzt tatsächlich keinen), sondern an einem Fehler im TLB des Level 2 Cache (genau genommen in den TLBs der Level 2 Caches; der Phenom hat ja vier davon, einen je Kern), der in Kombination mit dem Level 3 Cache Protokoll zu einem Absturz führen kann.

Im Detail geht es dabei wohl um ein Timing-Problem. Es scheint ein kleines Zeitfenster nach einem Page-Miss zu geben, in dem es passieren kann, dass Daten aus einem veralteten Eintrag im TLB des L2 in den L3-Cache hinterlegt werden, bevor die tatsächlich aktuelle Version in den L2-Cache geschrieben wurde. Die gepufferten Daten in L2- und L3-Cache sind demnach nicht eindeutig. Geschieht es, dass ausgerechnet in diesem Moment darauf zugegriffen wird, ist der Datensalat perfekt und der Prozessor stürzt ab. Die offizielle Kurzbeschreibung des Bugs steht in der gestrigen Linux-Meldung.

Mit dem bereits beschriebenen <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1196930651">BIOS-Update</a>, welches AMD den Mainboard-Herstellern empfiehlt, wird der betroffene Teil des L2-TLB kurzerhand deaktiviert (nicht der komplette L3-Cache, wie man auch gelegentlich liest). Der erwähnte Linux-Patch dagegen geht einen anderen Weg und emuliert die Funktion, welche für das korrekte Setzen der Dirty- und Accessed Bits zuständig ist, kurzerhand per Kernelfunktion.
 
Also würde die Linux Lösung kaum/keine Leistung kosten :]
 
Also würde die Linux Lösung kaum/keine Leistung kosten :]
Kaum Leistung würde ich sagen, da die Funktion, welche das Setzen der Dirty- und Accessed-Bits im TLB übernimmt und normalerweise in Hardware realisiert ist, nun per Software erledigt werden muss, was logischerweise ein wenig CPU-Zeit in Anspruch nimmt. Aber zumindest wird die Funktion nicht komplett deaktiviert wie beim BIOS-Patch. Hier die relevante Notiz aus dem Linux-Patch:
The L2 Eviction Linux kernel performance patch re-enables the
registers set for the BIOS workaround described in the Revision
Guide document. It then prevents the processor from performing the
operation that can trigger erratum 298. The patch works by emulating
the Accessed and Dirty bits.
Ich verstehe die Notiz sogar so, dass der Linux-Patch zur Laufzeit die Einstellungen des BIOS-Patches wieder rückgängig macht und die betroffene Einheit wieder aktiviert, um die defekte Funktion dann per Software zu emulieren. Linux-User können meiner Ansicht nach den BIOS-Patch also bedenkenlos installieren (z.B. weil ein neueres BIOS auch andere Fehler oder Inkompatibilitäten behebt, worauf man nicht verzichten möchte, indem man ein altes BIOS drauflässt), da er durch den Linux-Patch sowieso wieder rückgängig gemacht wird.

Das könnte auch erklären, wieso AMD die BIOS-Entwickler dazu anhält, den Patch nicht optional zu gestalten, wie gestern berichtet. Das BIOS soll die Einheit wohl erst einmal abschalten und versierte User können dann das Overdrive-Tool verwenden, um die Einheit wieder einzuschalten und die Funktion davon per Software emulieren zu lassen ähnlich wie es der Linux-Patch macht.
 
Das heißt doch aber auch, das wenn MS es wollte sie das ganze auch per Patch für Windows liefern könnten, oder?
 
Jup, ein solcher Patch sollte auch unter windows möglich sein. Aber bekanntermaßen tut sich Microsoft mit soetwas immer recht schwer und es könnte mal wieder eniges an Zeit ins Land gehen. Bis dahin sind warscheinlich die neuen steppings des K10 draußen.

gruß

cumec
 
Vielleicht wird der Workaround auch Teil des AMD Prozessortreibers oder einer anderen Software von AMD.
 
Damit sind reißerische News wie: "bis zu 50% Leistungseinbruch!" hoffentlich bald vorbei. Wenn jetzt nicht noch die Nachträgliche Erhöhung des TDP wäre... warum haben die es erst jetzt fest gestellt ???
 
Wenn sich das Ganze noch in Wohlgefallen auflöst, hätte die ganze Sache doch noch etwas gutes. Nicht für AMD, deren Ruf hat jetzt nachhaltig unter der Hetzkampagnen gelitten, aber für uns als Endverbraucher. Wir würden in den Genuss von günstigen Phenom 9xxx kommen, nachdem sie derart schlecht geredet wurden. Übrigens eine beliebte Masche beim Gebrauchtwagenkauf.
 
Das könnte auch erklären, wieso AMD die BIOS-Entwickler dazu anhält, den Patch nicht optional zu gestalten, wie gestern berichtet. Das BIOS soll die Einheit wohl erst einmal abschalten und versierte User können dann das Overdrive-Tool verwenden, um die Einheit wieder einzuschalten und die Funktion davon per Software emulieren zu lassen ähnlich wie es der Linux-Patch macht.
Aber auch nur, wenn eben der Patch verwendet wird. Dafür muss man den Kernel selbst
kompilieren, denn es ist nicht klar, ob der Patch in den Vanilla Kernel integriert wird, oder
in Distributionskernel, da muss man mal abwarten.
Vielleicht wird der Workaround auch Teil des AMD Prozessortreibers oder einer anderen Software von AMD.
Der Linux Patch stellt schon einen tieferen Eingriff in den Kernel dar, ich weiß nicht, ob AMD
da die Möglichkeiten bei Windows hat.
Bis Microsoft das hinbekommt könnte es evtl. etwas dauern, wir werden sehen.
 
Endlich mal spezifische Infos. Das sollte man doch hinbekommen.
 
Wenn sich das Ganze noch in Wohlgefallen auflöst, hätte die ganze Sache doch noch etwas gutes. Nicht für AMD, deren Ruf hat jetzt nachhaltig unter der Hetzkampagnen gelitten, aber für uns als Endverbraucher. Wir würden in den Genuss von günstigen Phenom 9xxx kommen, nachdem sie derart schlecht geredet wurden. Übrigens eine beliebte Masche beim Gebrauchtwagenkauf.

Naja, der einfache Konsument kann halt nicht trennen, und AMD ist dann generell Mist. Handelt sich ja nur um das erste Stepping einer neuen Generation Cpu´s mit reichlich Potenzial für die Zukunft. Aber unter den Tisch kehren kann man das auch nicht. Ist schon ein starkes Stück. EInen B2-Stepping kann man doch nicht ernsthaft als Kaufoption momentan in Erwägung ziehen, es sei den man ist Bastler, und die B2´s kosten~150€. In grad mal ~10-12 Monaten sind die B3´s angekündigt, solange wird man ja noch warten können*noahnung* Obwohl der 9600 Black Ed. mit offenem Multi schon jetzt interessant klingt...


Grüße!
 
Naja, der einfache Konsument kann halt nicht trennen, und AMD ist dann generell Mist.

Genau dieses Problem sehe ich auch. Und diesen Ruf dann erstmal wieder loszuwerden kann lange dauern. Sehr lange!

Handelt sich ja nur um das erste Stepping einer neuen Generation Cpu´s mit reichlich Potenzial für die Zukunft.

Hm, wo siehst du da ein Potential???

Halten wir mal fest:

- kaum eine höhere IPC pro Kern als der Vorgänger K8
- hoffnungslos dem C2D unterlegen, vom Penryn ganz zu schweigen
- das "Feature" des K10 überhaupt: Eine im Vergleich zum Takt exponentiell ansteigende TDP; sowas gabs noch nie
- Aufgrund der exorbitanten TDP kaum Hoffnung auf Phenom-Modelle mit 3GHz oder größer (außer man nimmt 200W TDP in Kauf :P)

Es ist ja vor allem der Ausblick, welcher auf den K10 ein so trostloses Bild wirft. Beim Launch war es zunächst mal nur die (im Vergleich zum C2D) schwache Performance, welche enttäuschte. Marginale Verbesserungen im Vergleich zum K8 zwar, aber ohne die reale Aussicht, daß das Teil auch mal in nächster Zeit auf 3GHz Kommt, ist das ganze schon sehr wenig. Man kann bereits jetzt schon sagen, daß der K10 (beinahe) seinen Maximalausbau erreicht hat. Ich schätze mit 65nm 2.6GHz (140W), mit 45nm sind vielleicht 3GHz drin - das aber auch nur mit TDPs weit jenseits von 100W.

Der TLB-Errata kommt hier natürlich noch erschwerend dazu. Ne, aber das Ding wird nix mehr. Am besten einstampfen, vergessen und was besseres machen.

EInen B2-Stepping kann man doch nicht ernsthaft als Kaufoption momentan in Erwägung ziehen, es sei den man ist Bastler, und die B2´s kosten~150€.

Als informierter User kann man das nicht mehr ernsthaft in Erwägung ziehen, das ist richtig. Allerdings gibt es noch genügend Unwissende, die sich von AMDs Quad-Core-Power einlullen und zum Kauf verleiten lassen. AMD sollte, vor allem um sich vor weiteren Imageverlusten zu schützen, den Verkauf der Phenoms einstellen bis das B3-Stepping verfügbar ist. Der B2 war ganz einfach noch nicht fertig.

Grüsse,

Rangoon
 
Zuletzt bearbeitet:
Naja, der einfache Konsument kann halt nicht trennen, und AMD ist dann generell Mist.
Naja, da müssen sich die AMD-Liebhaber in diversen Foren (auch hier!) aber auch selber an die Nase fassen. Was die letzten zwei Wochen an polemischen und z. T. sehr unrichtigen Kommentaren hier gepostet wurde ist schon ein starkes Stück.
 
Vielleicht sollte AMD den K10 abschreiben, und einen K11 ohne dessen Mängel bringen.

Des letzteren war der obige Link von @Nero24, auf ein Intel Microcode Patch zurückzuführen.

Hat nicht mal jemand gesagt, das das bei AMD nicht möglich ist ?
 
Zuletzt bearbeitet:
- hoffnungslos dem C2D unterlegen, vom Penryn ganz zu schweigen
- das "Feature" des K10 überhaupt: Eine im Vergleich zum Takt exponentiell ansteigende TDP; sowas gabs noch nie
- Aufgrund der exorbitanten TDP kaum Hoffnung auf Phenom-Modelle mit 3GHz oder größer (außer man nimmt 200W TDP in Kauf :P)
welch maßlos Übertreibung :]. Ja der K10 hat ernsthafte Schwierigkeiten, aber man kann im aktuellen Totgerede von AMD auch übertreiben.
 
Vielleicht sollte AMD den K10 abschreiben, und einen K11 ohne dessen Mängel bringen.
Klar, der K11 liegt fertig entwickelt in der Schublade... Außerderm ist beim K11 garantiert, dass er keine Fehler enthält...
 
Klar, der K11 liegt fertig entwickelt in der Schublade... Außerderm ist beim K11 garantiert, dass er keine Fehler enthält...

Jeder Prozessor hat Fehler, nur wenn sie wie hier "Probleme" bereiten und man durch ein neues Stepping mal eben den Fehler nicht beseitigen kann, oder ein neues Problem auftritt, muß man einen anderen konsequenten Weg gehen.

Weiter machen geht jedenfalls auch nicht, aber den Auslieferungstop gabs ja bereits.

Und AMD hat scheinbar die lange Zeit nicht genutzt, nehme mal an das der ATI-Kauf diese wichtige Phase mit gestört hat im Gegensatz zu Intel nach der Netburst Pleite. Nun muß AMD diese Suppe auch wieder auslöfeln.
 
Zuletzt bearbeitet:
Hi LinuS!

welch maßlose Übertreibung

Findest du?

Daß der K10 der C2D-Technik in jeder Hinsicht (IPC und TDP) hoffnungslos unterlegen ist, wirst du wohl nicht abstreiten ;).

- das "Feature" des K10 überhaupt: Eine im Vergleich zum Takt exponentiell ansteigende TDP; sowas gabs noch nie
- Aufgrund der exorbitanten TDP kaum Hoffnung auf Phenom-Modelle mit 3GHz oder größer (außer man nimmt 200W TDP in Kauf )

Was ist daran übertrieben?

Phenom 9500/2.2GHz: 95W
Phenom 9700/2.4GHz: 125W
Phenom 9900/2.6GHz: 140W

Äh, sorry. Aber laut meinem Taschenrechner ergibt das ganze bei 18% Mehrleistung eine 47%ige Steigerung der TDP ;). Gut, die 200W waren natürlich bei 65nm gerechnet. Dürfte allerdings hinkommen wenn man das weiter hochskaliert. In 45nm ist selbstverständlich schon eine Energieersparnis drin. Vergleiche mal die Steigerungen der TDPs bei den K8. Da steigt die Leistungaufnahme nur linear zur Taktfrequenz.

Ja der K10 hat ernsthafte Schwierigkeiten,

Das ist sehr vorsichtig ausgedrückt! Das Ding ist ne Totgeburt.

aber man kann im aktuellen Totgerede von AMD auch übertreiben.

Habe ich auch nicht gesagt. AMD - und da bin ich mir sicher - wird es auch in 5, 10 oder noch mehr Jahren noch geben. Schließlich lebt AMD ja nicht alleine von CPUs. Ich bin ziemlich optimistisch, daß AMD auch hier weiterhin existieren wird. Hier sehe ich allerdings kurz- und mittelfristig nur die Budget-Schiene. AMD hat trotz des K10-Debakels genügend Erfahrung und Know-How um größere Investoren (Samsung???) zum Investieren zu bewegen. Und ja: Totgesagte leben bekanntlich immer länger. Wer weiß: Wenn sich Intel in Zukunft zu lange auf seinen Lorbeeren ausruht wäre es durchaus möglich, daß AMD (oder auch eine ganz andere Prozessorschmiede) zurückschlägt ;). Für uns Konsumenten wäre das am besten. Obwohl ich mir nicht wirklich vorstellen kann, daß Intel sich nocheinmal (wie zu Netburstzeiten) die Butter vom Brot nehmen läßt.

Grüsse

Rangoon
 
Naja, da müssen sich die AMD-Liebhaber in diversen Foren (auch hier!) aber auch selber an die Nase fassen. Was die letzten zwei Wochen an polemischen und z. T. sehr unrichtigen Kommentaren hier gepostet wurde ist schon ein starkes Stück.

Die Enttäuschung steht manchen ins Gesicht geschrieben, so auch bei mir...Stimme dir aber grundsätzlich zu.


- kaum eine höhere IPC pro Kern als der Vorgänger K8
- hoffnungslos dem C2D unterlegen, vom Penryn ganz zu schweigen
- das "Feature" des K10 überhaupt: Eine im Vergleich zum Takt exponentiell ansteigende TDP; sowas gabs noch nie
- Aufgrund der exorbitanten TDP kaum Hoffnung auf Phenom-Modelle mit 3GHz oder größer (außer man nimmt 200W TDP in Kauf )

*kopfkratz Vielleicht hab ichs auch falsch in Erinnerung, bin mir nicht sicher...
Die K8-Architektur ist im Mittel 25 % langsamer wie ein C2D.
EIn Phenom (ohne Bug) bei gleichem Takt ~10 % langsamer als ein C2D
Ein Penryn (keine selektierten Benchmarks) im Mittel 5 % schneller als ein C2D
Unterm Strich sind das 15 % Unterschied vom Phenom zum Penryn, auch bei 20 % wäre es eine Verbesserung gegenüber K8<>C2D.

Zweitens ist der Phenom durch seine Architektur anders einsatzfähig. Bei einem Penryn Q9300 werkeln im Idle 6x 333 MHZ also 2 GHZ auf 4 Kernen. Das ist für Surfen vielleicht ein bisschen viel? Warte doch mal ab, wie sich ein "variabel" getakteter Phenom da schlägt. Gerade für Enthusiasten, die sich auch mit dem zteilen von Resourcen auskennen, ist es u.U. Interessant, z.B nur einen Kern@ 3.0 GHZ laufen zu lassen.

Bei den nächsten Steppings sind außerdem Verbesserungen im Stromverbrauch und der Taktrate vom Werk aus zu erwarten. Beim K8 kann man z.B. von 300 MHZ Mehrtakt vom G1 zu G2 Stepping sprechen. (Brisbane 65nm Prozess). Ein alter X2 FX mit 2.8 GHZ im 90nm F2 Stepping hatte zu ANfang mal 125 Watt TDP @ 2,8 GHZ. Mittlerweile hat ein 6000+ X2 EE ebenfalls im 90nm Prozess aber F3 Stepping 89 Watt TDP @ 3.0 GHZ.

Erst der 6400 Black Edition hat wieder 125 Watt TDP aber eben mit 400 MHZ Mehrtakt. Ich bin mal gespannt, das B2-Stepping ist nur der Anfang. 45nm und größerer L3 Cache würden ja prinzipiell auf dem K10 aufbauen...

Grüße!
 
AMD hat trotz des K10-Debakels...
Also bisher sehe ich noch kein ernsthaftes Debakel. Fakt ist:

- Ein K10 Kern ist aufgrund zahlreicher Detailverbesserungen bei selben Takt schneller als ein K8 Kern
- Der Funktionsumfang ist gegenüber dem K8 und K9 ebenso deutlich gewachsen (z.B. SSE4a)
- Ein K10 ist bereits für unter 200 Euro zu bekommen und die Preise befinden sich im freien Fall

Zwar ist er keine Wunderwaffe aber eine Enttäuschung ist er auch nicht, wenn man nicht gerade überzogene Hoffnungen gehegt hat.

Recht interessant: http://www.xbitlabs.com/articles/cpu/display/amd-k10.html
 
@Rangoon: TDP *hust* Wie genau war nochmal in der näheren Vergangenheit die TDP? Das sind zwar Zahlen welche man unter Laborbedingungen erreichen könnte, nur wie oft kommt das in der Realität vor? Intels Premium CPUs sind/wären da mit 130W auch nicht wirklich besser und das trotz! 45nm (QX9650). Dazu kommt noch Intels etwas andere Definition von TDP... Das ist nunmal der Preis den man für 4 Herzen zahlt ;)
Die Abwärme erhöht sich immernoch proportional/linear mit dem Takt. Nur hat man aber 4 Cores, so ist halt die Erhöhung 4x so hoch (die Gerade wird steiler gestellt), wenn man nicht Optimierungen in Betracht ziehen würde.
 
Naja, aber das sind beim 9500 gerade mal ein Paar Euronen weniger als beim Kentsfield, dafür ist er auch noch langsamer und hat 200 Mhz weniger Takt. Beim 9600 und beim 9700 stehen da ganz andere Preise zu Buche.;)
Und man kann wegen dem TLB noch nicht wirklich abschätzen obs bei der Leistung runtergeht und wie weit runter mit der Leistung.
Und in nem knappen Monat kommen die Penryn, wenn die einen ähnlichen Preis haben wie die jetzigen Intel Modelle, dann mal gute Nacht mit den Preisen für Amd. Wenn man irgendwie über den Preis Konkurrenzfähig sein will. ich möchte lieber nicht wissen wie hoch der Gewinn pro Cpu, falls überhaupt, dann noch ist.
Immerhin sieht man ja das Intel einen recht guten Gewinn im Vergleich zum Umsatz hat, und der ist bei Amd jetzt schon mehr als dürftig, sofern es einen Gewinn überhaupt gibt. Und die Phenom lassen sich ganz sicher nicht nur ein wenig teurer herstellen als die K8.
 
Intels Premium CPUs sind/wären da mit 130W auch nicht wirklich besser und das trotz! 45nm (QX9650).
da sollte man die specs mal mit der realität vergleichen. obwohl der 45nm yorkfield die gleiche tdp hat wie der kentsfield, verbraucht z.b. der qx9650 um welten weniger als sein vorgänger.

http://www.lostcircuits.com/cpu/intel_yorkfield/4.shtml

http://www.hardtecs4u.com/reviews/2007/intel_qx9650/index6.php

http://www.computerbase.de/artikel/...2_extreme_qx9650/23/#abschnitt_stromverbrauch

http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3137&p=6

usw.
 
Zurück
Oben Unten