Aktueller Inhalt von Gipsel
-
News Will AMD Intel im Enthusiast-Segment angreifen?
Die Taktraten von CanardPC (2,4 GHz Base /2,8 GHz Boost) sind deutlich zu niedrig. Mag ja sein, daß irgendein Sample momentan so läuft, aber in 150W sind da locker >=3GHz drin, und zwar Bastetakt. Da das Teil ja wohl ein MCM aus zwei Zeppelin-Dies ist, kann man ja mal grob den Verbrauch des...- Gipsel
- Beitrag #9
- Forum: Kommentare
-
News AMD stellt Achtkern-Prozessor FX-9590 mit 5 GHz vor [Update]
Die hätten bei ihrer Behauptung mit dem "world’s first commercially available 5 GHz processor" mal lieber noch ein "x86" einfügen sollen. Den Power6 gab es auch bereits mit 5GHz (im Jahr 2007 in 65nm).- Gipsel
- Beitrag #11
- Forum: Kommentare
-
R1000 Spekulationsthread
Oder auch 2 CUs wie bei Kabini. Wieso, Du beschreibst doch gerade, wie die Lösung mit 36 CUs perfekt paßt?!? 3 Raster-Einheiten (je 16 Pixel pro Takt, also in der Summe 48 ), 3 Shaderarrays zu je 12 CUs bestehend aus 3 Gruppen zu je 4 CUs. Ergibt 36 CUs mit Vierergruppen aus CUs. Die Zahl der...- Gipsel
- Beitrag #1.180
- Forum: Planet 3DNow! Tech-Talk
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Pro Kern ist es egal, die FPU und sein eigener Scheduler kümmern die Integer-Kerne nicht wirklich. Und nein, die Pipelines bei BD/PD/SR sind 128Bit breit, die haben nur 3 (Steamroller) bis 4 (BD/PD) davon, die jeweils etwas unterschiedlich mit Einheiten bestückt sind, die sind also nicht...- Gipsel
- Beitrag #72
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Das muß man nicht unbedingt ausprobieren, falls man den Optimierungs-Guides von AMD vertraut ;). Da steht das genau so drin. Es ist ja keine Frage, daß AVX-Instruktionen, die mit den 256Bit breiten YMM-Registern operieren, meist in zwei µOps zerlegt werden (bei ein paar werden es mehr als...- Gipsel
- Beitrag #64
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Es ist vielleicht für Dich nicht relevant, aber es ist entscheidend für das Flag, um welches sich dieser Thread dreht. *buck* Im Übrigen solltest Du vielleicht nochmal die Argumentation mit dem K8 überdenken. Eine ganze Latte von double decode Instruktionen kann der nämlich auch mit Durchsatz 1...- Gipsel
- Beitrag #62
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Na dann schauen wir doch mal in Deinen ersten Beitrag hier: Das ist schlicht falsch. BD kann 256Bit Instruktionen eben nicht direkt in voller Breite abarbeiten. Er besitzt keine 256Bit Pipeline(s), sondern multiple 128Bit-Pipelines (weswegen die 256Bit Instruktionen ja auch in zwei 128bittige...- Gipsel
- Beitrag #58
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Das bezog sich offensichtlich auf die von Dir postulierte Aufteilung von SIMD-Instruktionen auf das 32bit oder 64bit Level der einzelnen Werte im Vektor. Die findet nicht statt. Ein (interne µOp-) Instruktion kann die komplette, physisch implementierte Vektorbreite abarbeiten. Das ist der...- Gipsel
- Beitrag #55
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
@gruffi: AVX, FMA, whatever bezeichnen SIMD-Befehlssatzerweiterungen. D.h. ein Satz von z.B. 64Bit breiten DP-Werten in einem breiteren Vektorregister wird von einem einzigen SIMD-Befehl als Operand konsumiert. Da wird intern gar nichts an den Befehlen aufgeteilt, nur die eigentlichen...- Gipsel
- Beitrag #52
- Forum: Kommentare
-
Kaveri - der Trinity Nachfolger
Dazu nochmal Genaueres. Bisher sieht es so aus: Mit Steamroller dann so: Pipe 0 (FMA0)|Pipe 1 (FMA1)|Pipe 2 (FSTORE) FPFMA (fmul, fadd, fmac) | FPFMA (fmul, fadd, fmac) | FPSTO (fpstore) FPMAL (MMX/AVX/SIMD ALU [adds, bitops, cmps] | FPXBR (shuffles?, packs, permutes) | FPMAL...- Gipsel
- Beitrag #628
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Na klar pro Core. Bei BD kann ein Kern vier µOps in einem Rutsch (in einem Takt) erhalten. Laut dem Software Optimization Guide gibt es bereits jetzt einen sogenannen Instruction Byte Buffer (der bei Jaguar offenbar nur noch Instruction Buffer heißt). AMD behauptet, daß der pro Thread 16...- Gipsel
- Beitrag #626
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Weil vermutlich die FPU nicht mit 8 auf einmal klarkommt. Wenn also beide Decoderblöcke nur FP-µOps ausspucken, müssen sich die etwas einbremsen, um z.B. die (mal ins Blaue getippt) Summe von 4 FP-Ops/Takt nicht zu überschreiten. Ja, aber in diesem zweiten Takt sind es dann 4 Ops/Takt. ;) Na die...- Gipsel
- Beitrag #623
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Nun, Du mußt aufpassen, was Zitat ist und was Schlußfolgerung von BSN. Wir sind uns ja einig, daß das mit den Latenzen nicht stimmen kann und die Pipeline-Anzahl meint (entweder falsch zitiert oder es steht falsch drin). Dann kannst Du aber nicht die aufgrund einer falschen Voraussetzung...- Gipsel
- Beitrag #621
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Da wird nur nichts verkürzt. Die floating point Pipelines haben 6 Stages für die Arithmetik und das bleibt ziemlich sicher auch so. Was sich ändert, ist daß die Anzahl der Pipelines von 4 auf 3 reduziert wird. Das zitiert BSN entweder falsch oder es steht falsch im Guide (wäre nicht...- Gipsel
- Beitrag #617
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Nicht so ganz. Alle DRAM-Chips haben seit Jahren Latenzen im identischen Bereich, wenn man es in Nanosekunden ausdrückt. Als typische/gute Werte kann man so etwa 10-10-10-30 ns annehmen. Das gilt über alle DDR-Varianten und auch für GDDR3/4/5 (die Speicherzellen sind ja die gleichen, die hängen...- Gipsel
- Beitrag #608
- Forum: Planet 3DNow! Tech-Talk