90nm doch schneller?

amdslide.gif


bzw. der Link: http://techreport.com/onearticle.x/6363

dürfte sich auf die NACHFOLGER des Winchester beziehen.

Ob da schon der Lanchester/Q1'05 betroffen ist (25/35 Watt mobil), müssen wir noch sehen.
Auf jeden Fall aber der Dual-Core, da ja insgesamt auch kompakter im Vergleich zum Winchester oder den kommenden 90nm Opteronen ausfällt.

Man sollte sich immer vor Augen halten, daß die AMD-Fertigung aktuell im Zeitplan fast 12 Monate hinter der Prototypen-Entwicklung liegt.
Winchester und neuer Opteron sind Entwicklung aus Ende 2003, die Präsentation von oben einige Monate vor Fertigstellung des Dual-Core gelaufen.
Man sollte also AMD bzgl. ähnlichen Daten trauen, da 'D0' und 'GC' fast zur gleichen Zeit (also Q4'03) fertiggestellt wurden.


The enhancements include power reductions (gained by using slow but less leaky transistors in non-critical paths) and speed improvements (by using fast but leaky transistors in critical paths). Also, the processor halt and stopclock states have been improved, reducing some unnecessary work previously conducted during these states, resulting in a savings of several hundred milliwatts.

Dies könnte aber wiederum auf den Lanchester hin deuten.
Die verbesserten Transistoren dürften dann auch das Winchster-Serienspeed Maximum bei ca. 2,2 GHz anheben AMD in die Nähe von 3 GHz bringen, was der K8 ja eigentlich lt. ursprünglicher P4 Planung auch benötigt hätte um im Spiel zu bleiben.
 
Original geschrieben von rkinet
Dies könnte aber wiederum auf den Lanchester hin deuten.
Die verbesserten Transistoren dürften dann auch das Winchster-Serienspeed Maximum bei ca. 2,2 GHz anheben AMD in die Nähe von 3 GHz bringen, was der K8 ja eigentlich lt. ursprünglicher P4 Planung auch benötigt hätte um im Spiel zu bleiben.

Das sind die alten Geschichten von Leuten, die Glauben, dass 90nm automatisch schlecht sein muss, weil die Fertigung beim Prescott ja auch schlecht ist. Was aber viele nicht wissen ist (oder nicht glauben wollen) ist, dass das nur aufgrund der hohen Verlustleistung ist. Das ist bei AMD nicht der Fall wegen SOI und der geringeren Anzahl an aktiven Transistoren. Der Prescott lässt sich super takten (mit Extremkühlung bis zu 6Ghz). Das Problem, das Intel hat ist, dass sie eben SOI nicht haben und zweitens die extremen Taktraten eine sehr komplexe Schaltung erfordert, die mit der langen Pipeline zurechtkommt und deshalb sehr viele aktive Transistoren nötig sind. Ich denke, dass da die 40 Mio. ungeklärten Transistoren hingewandert sind entweder direkt oder indirekt. Wenn der Prescott ähnlich wie der A64 eine Verlustleistung von ca. 50Watt hätte, dann wären 4Ghz ohne weiteres drin, aber das ist eben der große Nachteil an Netburst. Der A64 mit 90nm ist auch nicht so wie viele denken nur bis 2,2Ghz taktbar sondern viel weiter. Das hat ja auch der Test von anandtech gezeigt. Sogar ein 3000+ hat es bis 2,6Ghz geschafft und ein 3500+ sogar mit nur 1,5V. Diese CPUs waren aber nicht selektiert sondern sogar von 2 verschiedenen Quellen. Denkt ihr echt, dass 0,1V 400Mhz Taktunterschied ausmachen. Ich tu das nicht.
 
Original geschrieben von andr_gin
Der A64 mit 90nm ist auch nicht so wie viele denken nur bis 2,2Ghz taktbar sondern viel weiter. Das hat ja auch der Test von anandtech gezeigt. Sogar ein 3000+ hat es bis 2,6Ghz geschafft und ein 3500+ sogar mit nur 1,5V. Diese CPUs waren aber nicht selektiert sondern sogar von 2 verschiedenen Quellen. Denkt ihr echt, dass 0,1V 400Mhz Taktunterschied ausmachen. Ich tu das nicht.

nun, eine CPU die bei 0,1 V mehr 2,6 GHz packt ist für einen Serienzustand von 2,2 GHz ok.

Intel hat es bzgl. P4 4,0 GHz sogar gestern aufgeführt, daß die Tücke im Detail liegt.
Ein Hersteller muss für alle denkbaren Kombinationen von Vorgängen in der CPU einen 100% Funktionsfähigkeit auch bei den schlechtesten zulässigen Vcc-Bedingungen oder Temperaturen garantieren.
OC mit Windows und Benchmarks deckt dies in keinem Falle so ab.

2,2 GHz Maximum bezog sich auf das Ausbeutemaximum - AMD hat sicherlich auch noch Chips, die 2,4 oder etwas mehr vertragen könnten. Nur, so kann AMD noch beruhigter sein Erstlingswerk in 90nm verkaufen.
Und s. neue Features /Transistoren für neue Steppings - AMD muss sich beim Winchester nicht ans Limit begeben. Der muss nur zuverlässig arbeiten - Taktreserven sind voll erwünscht.
Für 'Power' ist das nächste Stepping gedacht und ja auch schon längst fertig.
 
Original geschrieben von Seemann
Könnte "improved page crossing" heißen. Was immer das auch sein mag.
Das war eine Extra-Geschichte. Die Möglichkeit des HW-Prefetchers, "negative strides" zu erkennen, heißt dagegen, daß er automatisch prefetcht, wenn Zugriffsmuster wie x, x-4, x-8.. auftauchen.

Bis jetzt gab es sogar den Trick des rückwärtslaufenden Kopierens von Speicher (evtl. sogar im memcpy im Linux-Kernel), wo von höheren hin zu niedrigeren Adressen aus dem Quellbereich gelesen wird, um den HW-Prefetcher auszutricksen (weil er beim Kopieren nicht so gut hilft). Dadurch gewann man noch ein paar Prozent.
 
Original geschrieben von rkinet
nun, eine CPU die bei 0,1 V mehr 2,6 GHz packt ist für einen Serienzustand von 2,2 GHz ok.

Intel hat es bzgl. P4 4,0 GHz sogar gestern aufgeführt, daß die Tücke im Detail liegt.
Ein Hersteller muss für alle denkbaren Kombinationen von Vorgängen in der CPU einen 100% Funktionsfähigkeit auch bei den schlechtesten zulässigen Vcc-Bedingungen oder Temperaturen garantieren.
OC mit Windows und Benchmarks deckt dies in keinem Falle so ab.

2,2 GHz Maximum bezog sich auf das Ausbeutemaximum - AMD hat sicherlich auch noch Chips, die 2,4 oder etwas mehr vertragen könnten. Nur, so kann AMD noch beruhigter sein Erstlingswerk in 90nm verkaufen.
Und s. neue Features /Transistoren für neue Steppings - AMD muss sich beim Winchester nicht ans Limit begeben. Der muss nur zuverlässig arbeiten - Taktreserven sind voll erwünscht.
Für 'Power' ist das nächste Stepping gedacht und ja auch schon längst fertig.

Wenn AMD jetzt den Standardtakt auf 1,5V lässt, dann werden auch nicht alle CPUs eingehen. Außerdem mit der Kühlung dürfte es auch kein Problem sein. Wer ein Gehäuse ohne Lüfter und den boxed Kühler in einem 30Grad heißen Raum einsetzt ist selber schuld. Beim Prescott hat man da ja auch Pech gehabt. Die OEM Systeme sind sowieso so ausgelegt und die, die sich den PC selber zusammenstellen kenn sich gut genug aus oder wenigstens der Händler, dass der PC nicht überhitzt. Das einzige Problem sind manche Systemadministratoren, die auf Profi machen, aber von der Hardware in Wirklichkeit keine Ahnung haben. Ich habe auch solche in der Schule (EDV Schule also da hat jeder EDV-Kenntnisse). So mit Administrationsachen müssen die sich wirklich gut auskennen, weil wir wirklich alles haben von Terminal Server über Samba hin zu alter Software zum connecten auf alte CICS Systeme, auf denen wir bis letztes Jahr noch Cobol programmiert haben (ich weiß über den Sinn lässt sich streiten). Das alles unter einen Hut zu bekommen ist sicher nicht leicht, aber dann kaufen sie neue PCs und nehmen Celerons, die wirklich unterm Hund sind und installieren nicht einmal die Treiber ordentlich etc., was dazu führt, dass die Rechner nur 1/4 der Geschwindigkeit meines Rechners (siehe Sig. haben) bei gleichem Takt ;D
Ich denke aber, dass man als User sich entweder auskennt oder den Händler fragt, was man jetzt wo einbauen kann. Wer dazu nicht in der Lage ist, der zahlt in jedem Fall drauf, wenn er z.B. DDR2 gemeinsam mit einem Prescott und einer AGP-Grafikkarte auf einem S478 Board verbauen will. Da wird er sich von 2 Teilen davon trennen müssen ;D
 
Original geschrieben von andr_gin
Wenn AMD jetzt den Standardtakt auf 1,5V lässt, dann werden auch nicht alle CPUs eingehen. Außerdem mit der Kühlung dürfte es auch kein Problem sein.

AMD hatte für 90nm eigentlich 1,2 - 1,35V bei Vollast vorgesehen.
Die 1,35 V haben wohl die 35 Watt mobilen bekommen,
die 1,4 V sind ein Kompromiss für die 90nm Einführung.

AMD ging mit dem 2.Stepping (wie bei Dual-Coer im Einsatz) einige laufzeit-kritische Bereiche an und dürfte die Vcc noch absenken.
Mehr wie 1,35 V dürfte 2005 nicht mehr üblich sein.
 
Ich denke an der Verlustleistung braucht AMD nicht mehr drehen. Wem es nicht passt, der kann es ja ändern und für den durchschnittlichen Bürouser gibt es ja Cool and Quiet. Da ist das überhaupt kein Thema mehr. Der 3800+ wird ziemlich bald in 90nm kommen. Das kannst du mir glauben und bis zum 4000+ (2,6Ghz/512KB) wird es auch nicht mehr ewig dauern.
 
Original geschrieben von andr_gin
....Der 3800+ wird ziemlich bald in 90nm kommen. Das kannst du mir glauben und bis zum 4000+ (2,6Ghz/512KB) wird es auch nicht mehr ewig dauern.


das sagen dir deine mega-geheimen quellen? :]
 
Original geschrieben von andr_gin
Ich denke an der Verlustleistung braucht AMD nicht mehr drehen. ...
Der 3800+ wird ziemlich bald in 90nm kommen. Das kannst du mir glauben und bis zum 4000+ (2,6Ghz/512KB) wird es auch nicht mehr ewig dauern.

Nun, Dual-Core packt die 95 Watt nicht mit 1,40 V und die Unicore-Opterone dürften auch eher 1,35 V oder 1,30 V erhalten - da fehlt ja Coll'n'Quite.

Den 2,6 GHz /512k wird es meiner Meinung nach überhaupt nicht mehr geben.
AMD begrenzt auf 2,4 /3800+ und fertigt den Rest mit 1M-L2 in 11-Layer.
Das neue (kommt Q1'05 mit Lanchester/Newark) dürfte ca. 105mm2 haben, also etwas über Barton-Niveau. (abgeschätzt aus 1/2 Dual-Core von 200mm2)
Das bereits beim Dual-Core angesprochne Stepping dürfte locker 0,3-0,5 GHz im Schnitt mehr bringen, also AMD in H1'05 nahe an 3 GHz bringen.
 
@andr_gin
Wer dazu nicht in der Lage ist, der zahlt in jedem Fall drauf, wenn er z.B. DDR2 gemeinsam mit einem Prescott und einer AGP-Grafikkarte auf einem S478 Board verbauen will. Da wird er sich von 2 Teilen davon trennen müssen
Ich habe das Gefühl, dass einige Info immer mehr mit Entertainment mischen ... -> Infotainment
Klasse Beispiel ... einfach schöööööön ;D 8)

Das gibt n Sonderpreis für hübsche gelungene Beispiele.

Installationsmeister Award
dotm-012_k.jpg

Quelle: http://www.dau-alarm.de/dotm-0103.html

Gibt es in deiner EDV-Schule auch solche Installationsmeister, andr_gin?

Zur Preisverleihung dieser Meister kann man dann (statt Anstecknadel) diesen gezeigten Kühl-Körper mit Heisskleber denen auf die Nase kleben. ;D

MFG Bokill
 
Zuletzt bearbeitet:
Original geschrieben von Bokill
Gibt es in deiner EDV-Schule auch solche Installationsmeister, andr_gin?

Nein das wissen die Administratoren bei uns in der Schule schon, wo der Kühlkörper hingehört ;D

Aber sehr viel weiter als korrekt zusammenstecken ist bei denen auch nicht drinnen.

Ich denke, wer sich nicht auskennt, aber allen anderen beweisen will, dass er ja so intelligent ist und keine Hilfe braucht, dem gehört es nicht anders. Der macht dann halt seine eigenen Erfahrungen und wenn einer so blöd ist und den Kühlkörper am Gehäuse befestigt, dann wird der PC sowieso nicht laufen. Da ist es egal ob die CPU jetzt 20Watt hat oder 120Watt. Der PC dürte in keinem Fall laufen.

@p4z1f1st: Das ist meine göttliche Eingebung ;D

Nein mal im Ernst. Wenn zwei CPUs, die wahllos herausgenommen wurden (davon einer ein 3000+) 2,6Ghz mit einer kleinen Spannungserhöhung schaffen, dann sind 2,4Ghz bei einigen selektierten Exemplaren sicher drin und die Fertigung wird auch nicht das nächste Jahr auf dem selben Niveau verbleiben. 2,6Ghz sind nicht so undenkbar. Vielleicht nicht mehr vor Weihnachten, aber machbar ist es sicher. Kann sein, dass AMD den Cache auch erhöht, aber es wird auch genug CPUs mit 512KB für den Massenmarkt geben und wenn da ein größerer Anteil mit 2,6Ghz und mehr ohne Probleme läuft, dann wird AMD diesen auch nicht mit Gewalt runterlabeln. Das haben sie beim XP gemacht, aber beim A64 haben sie umgedacht. Deshalb auch die vielen Versionen.
 
Original geschrieben von andr_gin
@p4z1f1st: Das ist meine göttliche Eingebung ;D

Nein mal im Ernst. Wenn zwei CPUs, die wahllos herausgenommen wurden (davon einer ein 3000+) 2,6Ghz mit einer kleinen Spannungserhöhung schaffen, dann sind 2,4Ghz bei einigen selektierten Exemplaren sicher drin und die Fertigung wird auch nicht das nächste Jahr auf dem selben Niveau verbleiben. 2,6Ghz sind nicht so undenkbar. Vielleicht nicht mehr vor Weihnachten, aber machbar ist es sicher. Kann sein, dass AMD den Cache auch erhöht, aber es wird auch genug CPUs mit 512KB für den Massenmarkt geben und wenn da ein größerer Anteil mit 2,6Ghz und mehr ohne Probleme läuft, dann wird AMD diesen auch nicht mit Gewalt runterlabeln. Das haben sie beim XP gemacht, aber beim A64 haben sie umgedacht. Deshalb auch die vielen Versionen.

ok, die Roadmap hat noch nicht alle Details, aber mal in Zusammenfassung:
- 1MB wird für Mobil-CPUs kommen, sowohl 65 Watt und kleiner als auch 25/35 Watt
- AMD hat bereits ein deutlich optimiertes Stepping in der Schublade mit höheren Taktraten und auch das oft gewünschte SSE3
- Zu 90% Wahrscheinlichkeit macht AMD 2005 sowohl eine 9-Layer Budget Linie (Winchester/Palermo) und eine 11-Layer Fertigung (1M, Dual-Core) die höher taktet oder weniger Strom verbraucht

Was der Winchester so bringt, ist also ziemlich nebensächlich - ist nur das Budget-Design. Wahrscheinlich taugt dies problemlos bis 2,4 GHz und wird dann als A64 (Winchester) und später Sempron (Palermo) verkauft.
Für alles andere hat sich AMD einiges bereits im Frühfahr 2004 einfallen lassen.

An der Fertigung selbst dürfte AMD kaum noch was verändern - Schwerpunkt der Arbeit für die Fertigungsingenieure ist die 65nm Fertigung; die ersten Geräte kommen Dezember 2004 nach DD, wohl im Sommer'05 wirds ernst für das Einfahren dort.
Für 90nm bleibt da kaum noch Zeit ...
 
Original geschrieben von Treverer
schon ein heftiger sprung vom opteron@2400, aber das timing der rams ist auch deutlich besser (cl2 anstatt cl3). dennoch: weit über 10% mehr leistung bei den integer werten; nur: warum bleibt er denn gegenüber dem opteron bei den fp-wert zurück? compiler? ???
Jepp, es liegt am Compiler. Wenn du die detaillierten Ergebnisse (die "HTML"-Links in der AH-SPECMine) anschaust, siehst du, daß der FX unter 32bit Windows lief.

Für die schnellsten 64bit-Ergebnisse wird wahrscheinlich wieder Sun verantwortlich sein - die machen das ganz gut unter Einsatz aller guten und verfügbaren AMD64-Compiler.
 
Original geschrieben von Dresdenboy
Jepp, es liegt am Compiler. Wenn du die detaillierten Ergebnisse (die "HTML"-Links in der AH-SPECMine) anschaust, siehst du, daß der FX unter 32bit Windows lief.

Für die schnellsten 64bit-Ergebnisse wird wahrscheinlich wieder Sun verantwortlich sein - die machen das ganz gut unter Einsatz aller guten und verfügbaren AMD64-Compiler.

danke für den hinweis auf die detalierten ergebnisse, aber die kannte ich schon, schließlich konnte ich ja nur so über die ram-timings aussagen machen ;) ich hatte vorhin nur keine zeit, es weiter abzuchecken und warf es einfach so in den raum ;D

und zu etwas anderem kam ich ebenso nicht, was mir viel wichtiger war und weswegen ich überhaupt auf die aces-spec-seite ging: ich wollte sehen, ob die neuen 90nm chips auch bei den specs zeigen würden, daß sie schneller sind, als die alten.

dummerweise ist aber der athlon fx55 noch in 130nm und vor allem cg-stepping und nicht d0 wie die 90nm cpus (wenn ich es richtig verstehe; google nach ADAFX55DEI5AS)...

und so bin ich jetzt doch arg baff über die leistungssteigerung bei den int-werten, die ich mir so kaum vorstellen kann. es sieht für mich so aus, als seien die int-werte mit identischen compiler inkl. identischen parametern errechnet. für die base- und peak-werte ergibt sich eine steigerung um jeweils rund 11,5%. und das, wo doch der takt nur um 8,33% erhöht wurde. selbst wenn diese takterhöhung 1:1 umgesetzt werden würde - was unmöglich ist - müssen irgendwoher weitere beachtliche 3% kommen! klar anderes board UND CL2 anstatt CL3 beim opteron. aber ich kann mich nicht entsinnen, daß letzteres jemals soviel ausmachte und auch bei dem neuen board bliebe die frage offen, woher ein so hoher gewinn kommen soll. wäre es nicht angeblich das alte cg stepping hätte ich ja gesagt, es lege genau daran, nämlich am neuen...

egal: die zusätzlichen 11,5% sind heftig.

für die fp-werte kann man leider so nicht rechnen, da die compiler-flags verschieden waren bzw. einmal in 32bit und einmal in 64bit gearbeitet wurde. macht aber auch nichts, denn man sieht immerhin mal wieder, daß die 64bit des opteron werte ausreichen, eine 11,5% steigerung auszugleichen (wobei ich anehme, daß es eben genausolche steigerung geben würde wie bei den int-werten). das ist doch auch top...

und die frage bleibt, wann intel-em64t werte kommen - im nächsten jahr, oder wie?


edit1: und man sieht wieder wunderbar, daß eine x86-cpu durch compiler-optimierung noch erheblich zulegen kann, während dies beim itanium nicht so scheint. manche mein(t)en, dessen entwicklung stünde ja noch am anfang und gerade für den compiler sei ja noch nicht genug zeit gewesen. ich denke eher, seine architektur macht compiler-optimierung nicht nur zwingend sondern eben auch leicht - das hat aber zu folge, daß da nicht mehr viel zu drehen ist unter default-umständen (folge base nahezu gleich peak-werte)
 
Zuletzt bearbeitet:
@Treverer:
Soweit ich sehe, sind die von AMD verwendeten 32bit-Compiler-Versionen beim Opteron 850 und FX-55 identisch. Da bleibt zur Erklärung wirklich nur anzuführen: CL2.0 unbuffered vs. CL3.0 registered RAM. Aber wenn du etwas in den früheren SPEC-Ergebnissen gräbst (am besten mit der SPEC-Suche bei spec.org), kannst du wahrnehmbare (sprich: x%, x>0) Unterschiede bei Systemen feststellen, wo sich nur diese Kennwerte des Speichers unterscheiden.

Speziell SPEC hat ja einige speicherlastige Benchmarks dabei, und da können sich Latenzunterschiede von insgesamt 2 DRAM-Taktzyklen (CL2->CL3 und unbuffered->reg.) - also 12 CPU-Taktzyklen (bei 2,4GHz), was in dem Fall eine um mehr als 10% höhere Latenz bedeutet - deutlich bemerkbar machen. Dieses Lostcircuits-Review vergleicht u.a. reg. RAM (CL3) auf FX-53 mit unbuff. RAM (CL2) auf A64-3800+. Es zeigt auch die praktischen Auswirkungen.
 
Also die SPEC-Werte sagen doch absolut nichts über die Performance aus. Das ist das reinste Synthetische Zeug.
 
Original geschrieben von andr_gin
Also die SPEC-Werte sagen doch absolut nichts über die Performance aus. Das ist das reinste Synthetische Zeug.
Die SPEC-Benchmarks enthalten viele reell eingesetzte Algorithmen und Codes (z.B. den GCC-Compiler selbst). Da diese meist aber am Einsatz im HPC-Bereich oder anderen wissenschaftlich oder geschäftlich eingesetzten Systemen orientiert sind, haben die Ergebnisse wenig Aussagekraft für die meisten Consumer. Aber sie indizieren dennoch, wie sich die Leistung von Hardware und Software (Compiler) weiterentwickelt.
 
Ja aber da jeder den Compiler verwendet, der ihm passt ist das optimiert ohne Ende also keine Software, wie sie in der Relität vorkommt. Ich halte auch z.B. 3DMark03 für absulut nichtssagend, weil eben nur optimiert wird. Der P4 ist gut, wenn ihm der Code optimal zugeschnitten ist, aber so spielt es das eben nicht immer.
 
Original geschrieben von andr_gin
Ja aber da jeder den Compiler verwendet, der ihm passt ist das optimiert ohne Ende also keine Software, wie sie in der Relität vorkommt. Ich halte auch z.B. 3DMark03 für absulut nichtssagend, weil eben nur optimiert wird. Der P4 ist gut, wenn ihm der Code optimal zugeschnitten ist, aber so spielt es das eben nicht immer.
Viele der größeren Softwareprodukte (inkl. Spiele) werden zumindest mit Hilfe der Compiler-Optionen optimiert - manchmal auch unter Nutzung besserer Compiler.

3DMark ist zwar von ehemaligen Grafikdemo-Programmierern, aber das sind viele der Spiele ebenfalls :) Und bei so einer Herkunft ist zumindest mit optimierten Algorithmen zu rechnen (Rest macht Compiler).

@90nm-Powerconsumption:

Neue Werte von Anandtech (wiedermal das Gesamtsystem gemessen):
Anandtech-Review

Vor allem der niedrige Wert unter Load sieht gut aus.
 
Wäre ja ein Knaller!

Während intel die Latenzen des (Prescott)-L2-Cache deutlich verschlechterte, verbessert sie AMD einen Hauch zum besseren ... wenn, das so weitergeht werden wir Weihnachten noch einen AMD64 4400+ sehen ...

MFG Bokill
 
Zuletzt bearbeitet:
Schade, dass es keine AMBiX Ergebnisse gibt - daraus könnte man es sicherlich ziemlich genau ableiten :(.
 
Zurück
Oben Unten