Suchergebnisse
-
News Will AMD Intel im Enthusiast-Segment angreifen?
Die Taktraten von CanardPC (2,4 GHz Base /2,8 GHz Boost) sind deutlich zu niedrig. Mag ja sein, daß irgendein Sample momentan so läuft, aber in 150W sind da locker >=3GHz drin, und zwar Bastetakt. Da das Teil ja wohl ein MCM aus zwei Zeppelin-Dies ist, kann man ja mal grob den Verbrauch des...- Gipsel
- Beitrag #9
- Forum: Kommentare
-
News AMD stellt Achtkern-Prozessor FX-9590 mit 5 GHz vor [Update]
Die hätten bei ihrer Behauptung mit dem "world’s first commercially available 5 GHz processor" mal lieber noch ein "x86" einfügen sollen. Den Power6 gab es auch bereits mit 5GHz (im Jahr 2007 in 65nm).- Gipsel
- Beitrag #11
- Forum: Kommentare
-
R1000 Spekulationsthread
Oder auch 2 CUs wie bei Kabini. Wieso, Du beschreibst doch gerade, wie die Lösung mit 36 CUs perfekt paßt?!? 3 Raster-Einheiten (je 16 Pixel pro Takt, also in der Summe 48 ), 3 Shaderarrays zu je 12 CUs bestehend aus 3 Gruppen zu je 4 CUs. Ergibt 36 CUs mit Vierergruppen aus CUs. Die Zahl der...- Gipsel
- Beitrag #1.180
- Forum: Planet 3DNow! Tech-Talk
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Pro Kern ist es egal, die FPU und sein eigener Scheduler kümmern die Integer-Kerne nicht wirklich. Und nein, die Pipelines bei BD/PD/SR sind 128Bit breit, die haben nur 3 (Steamroller) bis 4 (BD/PD) davon, die jeweils etwas unterschiedlich mit Einheiten bestückt sind, die sind also nicht...- Gipsel
- Beitrag #72
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Das muß man nicht unbedingt ausprobieren, falls man den Optimierungs-Guides von AMD vertraut ;). Da steht das genau so drin. Es ist ja keine Frage, daß AVX-Instruktionen, die mit den 256Bit breiten YMM-Registern operieren, meist in zwei µOps zerlegt werden (bei ein paar werden es mehr als...- Gipsel
- Beitrag #64
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Es ist vielleicht für Dich nicht relevant, aber es ist entscheidend für das Flag, um welches sich dieser Thread dreht. *buck* Im Übrigen solltest Du vielleicht nochmal die Argumentation mit dem K8 überdenken. Eine ganze Latte von double decode Instruktionen kann der nämlich auch mit Durchsatz 1...- Gipsel
- Beitrag #62
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Na dann schauen wir doch mal in Deinen ersten Beitrag hier: Das ist schlicht falsch. BD kann 256Bit Instruktionen eben nicht direkt in voller Breite abarbeiten. Er besitzt keine 256Bit Pipeline(s), sondern multiple 128Bit-Pipelines (weswegen die 256Bit Instruktionen ja auch in zwei 128bittige...- Gipsel
- Beitrag #58
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
Das bezog sich offensichtlich auf die von Dir postulierte Aufteilung von SIMD-Instruktionen auf das 32bit oder 64bit Level der einzelnen Werte im Vektor. Die findet nicht statt. Ein (interne µOp-) Instruktion kann die komplette, physisch implementierte Vektorbreite abarbeiten. Das ist der...- Gipsel
- Beitrag #55
- Forum: Kommentare
-
News AMD in Zukunft mit 256-Bit-FPU-Pipelines
@gruffi: AVX, FMA, whatever bezeichnen SIMD-Befehlssatzerweiterungen. D.h. ein Satz von z.B. 64Bit breiten DP-Werten in einem breiteren Vektorregister wird von einem einzigen SIMD-Befehl als Operand konsumiert. Da wird intern gar nichts an den Befehlen aufgeteilt, nur die eigentlichen...- Gipsel
- Beitrag #52
- Forum: Kommentare
-
Kaveri - der Trinity Nachfolger
Dazu nochmal Genaueres. Bisher sieht es so aus: Mit Steamroller dann so: Pipe 0 (FMA0)|Pipe 1 (FMA1)|Pipe 2 (FSTORE) FPFMA (fmul, fadd, fmac) | FPFMA (fmul, fadd, fmac) | FPSTO (fpstore) FPMAL (MMX/AVX/SIMD ALU [adds, bitops, cmps] | FPXBR (shuffles?, packs, permutes) | FPMAL...- Gipsel
- Beitrag #628
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Na klar pro Core. Bei BD kann ein Kern vier µOps in einem Rutsch (in einem Takt) erhalten. Laut dem Software Optimization Guide gibt es bereits jetzt einen sogenannen Instruction Byte Buffer (der bei Jaguar offenbar nur noch Instruction Buffer heißt). AMD behauptet, daß der pro Thread 16...- Gipsel
- Beitrag #626
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Weil vermutlich die FPU nicht mit 8 auf einmal klarkommt. Wenn also beide Decoderblöcke nur FP-µOps ausspucken, müssen sich die etwas einbremsen, um z.B. die (mal ins Blaue getippt) Summe von 4 FP-Ops/Takt nicht zu überschreiten. Ja, aber in diesem zweiten Takt sind es dann 4 Ops/Takt. ;) Na die...- Gipsel
- Beitrag #623
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Nun, Du mußt aufpassen, was Zitat ist und was Schlußfolgerung von BSN. Wir sind uns ja einig, daß das mit den Latenzen nicht stimmen kann und die Pipeline-Anzahl meint (entweder falsch zitiert oder es steht falsch drin). Dann kannst Du aber nicht die aufgrund einer falschen Voraussetzung...- Gipsel
- Beitrag #621
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Da wird nur nichts verkürzt. Die floating point Pipelines haben 6 Stages für die Arithmetik und das bleibt ziemlich sicher auch so. Was sich ändert, ist daß die Anzahl der Pipelines von 4 auf 3 reduziert wird. Das zitiert BSN entweder falsch oder es steht falsch im Guide (wäre nicht...- Gipsel
- Beitrag #617
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Nicht so ganz. Alle DRAM-Chips haben seit Jahren Latenzen im identischen Bereich, wenn man es in Nanosekunden ausdrückt. Als typische/gute Werte kann man so etwa 10-10-10-30 ns annehmen. Das gilt über alle DDR-Varianten und auch für GDDR3/4/5 (die Speicherzellen sind ja die gleichen, die hängen...- Gipsel
- Beitrag #608
- Forum: Planet 3DNow! Tech-Talk
-
AMD Kabini APU / Jaguar CPU + Graphics Core Next GPU, 2-4 Kerne, 28nm TSMC, 2013
Heise hat da was in den falschen Hals bekommen. Im Turbodock steckt keine GPU (also im vorgeführten). Der Temash-Chip wird 40% höher getaktet, das war's. AMD hat nur erwähnt, daß man optional eine diskrete GPU in das Dock bauen könnte. Aber zum einen wäre die Anbindung nicht übermäßig schnell...- Gipsel
- Beitrag #576
- Forum: Planet 3DNow! Tech-Talk
-
Kaveri - der Trinity Nachfolger
Inzwischen gibt es 4 GBit-Chips (PS4 wird 16 davon benutzen). An einem 128Bit-Interface bekommt man 8 davon unter (im Clamshell-Modus, jeder Chip mit 16Bit angebunden, das unterstützt GDDR5 standardmäßig), sind dann also 4 GB maximal. Edit: Opteron hat natürlich recht. Wenn man sich mal die...- Gipsel
- Beitrag #601
- Forum: Planet 3DNow! Tech-Talk
-
News Turbo-Dock: AMD nennt Cinebench-Ergebnisse von Temash - Quad-Jaguar schneller als zwei Piledriver-Module
Der Vergleichswert von 3DMark Vantage für den C50 (1246 Punkte) ist übrigens falsch. Das ist offenbar der CPU Score (der höchste, den man bei notebookcheck.com für den C50 findet), nicht der Gesamt- oder GPU-Score. Diese gibt es hier bei der HD6250 zu sehen. Das wären dann maximal 425 für den...- Gipsel
- Beitrag #31
- Forum: Kommentare
-
AMD Kabini APU / Jaguar CPU + Graphics Core Next GPU, 2-4 Kerne, 28nm TSMC, 2013
Aus diesen Plots lassen sich kaum konkrete Frequenzen ablesen. Die >+10% beziehen sich ja erstmal auf Vorteile durch das Design noch ohne den Prozeß. Wo genau im Shmoo-Plot AMD die üblichen Betriebspunkte sieht, geht ja durch die ganzen Normierungen auch verloren. Außerdem zeigen beide Plots nur...- Gipsel
- Beitrag #391
- Forum: Planet 3DNow! Tech-Talk
-
News AMD präsentiert Jaguar-Quad-Modul auf der ISSCC (Update)
Was für einen Account benötigt man eigentlich, um die Bildergalerie einzusehen? Ich bekomme da immer ein "Access denied". :(- Gipsel
- Beitrag #14
- Forum: Kommentare
-
Spekulationen zu aktuellen und zukünftigen Prozessen bei GlobalFoundries (<= 32nm)
Bei GF haben alle 28nm Prozesse HKMG. Das war TSMC, bei denen 28LP nur Poly-Gates hat (HPL ist deren low power Prozeß mit HKMG).- Gipsel
- Beitrag #723
- Forum: Planet 3DNow! Tech-Talk
-
3. BOINC Pentathlon - Collatz Diskussionsthread
Opteron hat mir eine PN geschrieben (die letzte, die ins Postfach paßte :]). Ich packe meine Antwort an ihn auch einfach mal hier ins Forum. =============== Um ehrlich zu sein, bin ich da schon eine Weile raus. Allerdings muß ich gestehen, daß ich kürzlich mitbekommen habe, daß da nicht...- Gipsel
- Beitrag #86
- Forum: Café Planet 3DNow!
-
Spekulationen zu aktuellen und zukünftigen Prozessen bei GlobalFoundries (<= 32nm)
Man kann zwar (aber längst nicht immer) Source und Drain benachbarter Transistoren direkt verbinden (ermöglicht effizienteres Layout, ist eine Optimierungsaufgabe), trotzdem werden die unteren Metal-Layer (z.B. M1 bis M3, die sogenannten "critical layers") mit den gleichen Tools belichtet, wie...- Gipsel
- Beitrag #459
- Forum: Planet 3DNow! Tech-Talk
-
Spekulationen zu aktuellen und zukünftigen Prozessen bei GlobalFoundries (<= 32nm)
Du sagst es. Außerdem gibt es entsprechende Beschreibungen durchaus zu finden, ich habe halt nur eines der ersten Suchergebnisse genommen, die Google zu dem Thema ausspuckte. In der Präsentation ging es um die Messung und Charakterisierung des Selfheating-Effektes. ;) Nö, die Leiterbahnen laufen...- Gipsel
- Beitrag #455
- Forum: Planet 3DNow! Tech-Talk
-
Spekulationen zu aktuellen und zukünftigen Prozessen bei GlobalFoundries (<= 32nm)
Steht da, welche Optionen noch "under assessment" sind oder woher weißt Du, daß UTBOx nicht schon unter verfügbar fällt, da ja die Oxidschichtdicke laut Dir bei 10nm anfangen kann? ;) Ich sage doch nur, daß mit UTBOx das self heating abnimmt und dies somit weniger kritisch wäre. Und durch...- Gipsel
- Beitrag #453
- Forum: Planet 3DNow! Tech-Talk