App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Opteron
Redaktion
☆☆☆☆☆☆
★ Themenstarter ★
Von ausnahmsweise belastbaren Informationen zu Zen weiß Matthias Waldhauer auf seinem Blog zu berichten. Mitte Februar tauchten wieder einige neue Codesegmente von AMD-Programmierern in Open-Sourcen-Projekten auf.
(…)
» Artikel lesen
(…)
» Artikel lesen
Zuletzt bearbeitet:
deoroller
Grand Admiral Special
Der Pentium 4 hat auch einen µOp-Cache, wenn ich mich recht entsinne.
genervt
Admiral Special
- Mitglied seit
- 27.07.2006
- Beiträge
- 1.135
- Renomée
- 10
- Standort
- Berlin
- Aktuelle Projekte
- NumberFields
- BOINC-Statistiken
- Mein Laptop
- Leonvo E145
- Prozessor
- XEON 1230v2
- Mainboard
- H61M-K [Ersatz]
- Kühlung
- Brocken
- Speicher
- 16 GB Corsair
- Grafikprozessor
- RX480 8GB
- Display
- BenQ BL3200PT - 30 Zoll - 1440p
- SSD
- Crucial MX100, BX200
- HDD
- 1x 750GB 1x 3 TB
- Optisches Laufwerk
- LG BH10LS30
- Soundkarte
- Xonar DX
- Gehäuse
- Fractal
- Netzteil
- BeQuiet
- Betriebssystem
- Win7 64bit, Win10
- Webbrowser
- Firefox
- Verschiedenes
- im Umbau
Klingt interessant. Mich hat "BTW have you ever heard of a processor core having 2 front ends and one shared back end?" mehr verwundert. Kann mich da eigentlich nur an AMDs GPUS mit 2x Frontend erinnern.
Dresdenboy
Redaktion
☆☆☆☆☆☆
Richtig, aber als Trace Cache ausgelegt. Dort diente es dem Zweck, genügend µOp-Bandbreite bereitzustellen und am normalen Dekoder zu sparen (1 komplexer Befehl/Takt). Die Traces speichern Befehlssequenzen auch nach einem Sprungbefehl mit ab, wenn der Sprung recht wahrscheinlich ist. Das läuft etwas anders, als in den typischen µOp-Caches heute, die normale Dispatch-Pakete ablegen.Der Pentium 4 hat auch einen µOp-Cache, wenn ich mich recht entsinne.
Mehr zum P4 hier: http://www.ecs.umass.edu/ece/koren/ece568/papers/Pentium4.pdf
Locuza
Commodore Special
- Mitglied seit
- 03.03.2011
- Beiträge
- 351
- Renomée
- 3
Ja, konzeptionell ähnlich war der Trace-Cache vom Pentium 4.Der Pentium 4 hat auch einen µOp-Cache, wenn ich mich recht entsinne.
Erst ab Sandy-Bridge hat Intel die Idee wieder aufgegriffen, aber natürlich anders implementiert.
Ich bin gespannt auf die Umsetzung von Zen, neben allen anderen Dingen wie SMT.
Bei modernen GPUs hängen mehrere ALU-Arrays an einem Frontend-Modul und beim Backend sieht das vermutlich ähnlich aus.Klingt interessant. Mich hat "BTW have you ever heard of a processor core having 2 front ends and one shared back end?" mehr verwundert. Kann mich da eigentlich nur an AMDs GPUS mit 2x Frontend erinnern.
Opteron
Redaktion
☆☆☆☆☆☆
★ Themenstarter ★
Richtig, aber als Trace Cache ausgelegt. Dort diente es dem Zweck, genügend µOp-Bandbreite bereitzustellen und am normalen Dekoder zu sparen (1 komplexer Befehl/Takt). Die Traces speichern Befehlssequenzen auch nach einem Sprungbefehl mit ab, wenn der Sprung recht wahrscheinlich ist. Das läuft etwas anders, als in den typischen µOp-Caches heute, die normale Dispatch-Pakete ablegen.
Mehr zum P4 hier: http://www.ecs.umass.edu/ece/koren/ece568/papers/Pentium4.pdf
David Kanter hatte das damals beim Sandy Bridge auch schön erklärt:
http://www.realworldtech.com/sandy-bridge/4/
Im Endeffekt wirkt es auch wie ein größerer L1-I-Cache, den musste AMD bei Bulldozer auch schon erhöhen. Falls er also bei Zen ebenfalls nur 32kB groß wäre, wäre etwas extra in Form eines L0-Caches sicher nicht verkehrt.
Preisfrage ist nun natürlich die Größe ... hat Intel den µOp-Cache bei Skylake eigentlich vergrößert? Ich finde nur Quellen zur Bandbreite.
Onkel_Dithmeyer
Redaktion
☆☆☆☆☆☆
- Mitglied seit
- 22.04.2008
- Beiträge
- 12.949
- Renomée
- 4.048
- Standort
- Zlavti
- Aktuelle Projekte
- Universe@home
- Lieblingsprojekt
- Universe@home
- Meine Systeme
- cd0726792825f6f563c8fc4afd8a10b9
- BOINC-Statistiken
- Prozessor
- Ryzen 9 3900X @4000 MHz//1,15V
- Mainboard
- MSI X370 XPOWER GAMING TITANIUM
- Kühlung
- Custom Wasserkühlung vom So. G34
- Speicher
- 4x8 GB @ 3000 MHz
- Grafikprozessor
- Radeon R9 Nano
- Display
- HP ZR30W & HP LP3065
- SSD
- 2 TB ADATA
- Optisches Laufwerk
- LG
- Soundkarte
- Im Headset
- Gehäuse
- Xigmatek
- Netzteil
- BeQuiet Dark Pro 9
- Tastatur
- GSkill KM570
- Maus
- GSkill MX780
- Betriebssystem
- Ubuntu 20.04
- Webbrowser
- Firefox Version 94715469
- Internetanbindung
- ▼100 Mbit ▲5 Mbit
Opteron
Redaktion
☆☆☆☆☆☆
★ Themenstarter ★
Ach der gut Agner hat schon ein Update mit Skylake, Danke. Dann dürfte das geklärt sein .. wobei er die Bandbreitenerhöhung anscheinend verschlafen hat. Er schreibt bei Skylake immer noch von nur 4 µOps pro Takt...Der µOp-Cache hat sich seit Sandy nicht geändert: "1536 µops, 8 way, 6 µop line size, per core"
Quelle
Dresdenboy
Redaktion
☆☆☆☆☆☆
Die Line Size von 6 µops war dann ja eine gute Vorlage für die Erweiterung des Interfaces zum Dispatcher bei der Skylake-Mikroarchitektur.Der µOp-Cache hat sich seit Sandy nicht geändert: "1536 µops, 8 way, 6 µop line size, per core"
Quelle
Mal sehen, was es bei Zen wird. Mindestens 4, max. 8 denke ich. Längen darüber hinaus sind vermutlich zu selten zwischen 2 Sprüngen und gleichzeitig zu aufwändig. AMDs alte Trace Cache Patente hatten 8-er-Blöcke.
OBrian
Moderation MBDB, ,
- Mitglied seit
- 16.10.2000
- Beiträge
- 17.031
- Renomée
- 267
- Standort
- NRW
- Prozessor
- Phenom II X4 940 BE, C2-Stepping (undervolted)
- Mainboard
- Gigabyte GA-MA69G-S3H (BIOS F7)
- Kühlung
- Noctua NH-U12F
- Speicher
- 4 GB DDR2-800 ADATA/OCZ
- Grafikprozessor
- Radeon HD 5850
- Display
- NEC MultiSync 24WMGX³
- SSD
- Samsung 840 Evo 256 GB
- HDD
- WD Caviar Green 2 TB (WD20EARX)
- Optisches Laufwerk
- Samsung SH-S183L
- Soundkarte
- Creative X-Fi EM mit YouP-PAX-Treibern, Headset: Sennheiser PC350
- Gehäuse
- Coolermaster Stacker, 120mm-Lüfter ersetzt durch Scythe S-Flex, zusätzliche Staubfilter
- Netzteil
- BeQuiet 500W PCGH-Edition
- Betriebssystem
- Windows 7 x64
- Webbrowser
- Firefox
- Verschiedenes
- Tastatur: Zowie Celeritas Caseking-Mod (weiße Tasten)
Wohl gar nicht so falsch, was von Intel abzugucken. Je ähnlicher es zu Intel ist, desto einfacher wird es wahrscheinlich, auch ein ähnliches Performanceprofil zu erreichen. Immerhin muß AMD ja praktisch immer mit Software klarkommen, die für Intels gemacht/kompiliert wurde. Etwas anzubieten, was Intel nicht bietet, nutzt dann kaum eine Software aus, dafür müßte man an anderer Stelle sparen und das rächt sich dann.
Opteron
Redaktion
☆☆☆☆☆☆
★ Themenstarter ★
Na dann hoffen wir mal, dass es 8er Blöcke samt 8er Interface werden und nach der Decoder-Queue keine weiteren Flaschenhälse existierenDie Line Size von 6 µops war dann ja eine gute Vorlage für die Erweiterung des Interfaces zum Dispatcher bei der Skylake-Mikroarchitektur.
Mal sehen, was es bei Zen wird. Mindestens 4, max. 8 denke ich. Längen darüber hinaus sind vermutlich zu selten zwischen 2 Sprüngen und gleichzeitig zu aufwändig. AMDs alte Trace Cache Patente hatten 8-er-Blöcke.
Vermutlich muss AMD mangels unified Scheduler sowieso ranklotzen, weil die Pipeline dann früher aufgeteilt wird.
Hmm, denke jetzt nicht, dass man auf low-level-Sachen dermaßen optimieren kann. Gut mit Assembler gehts natürlich, aber da muss man dann auch auf die Line Sizes und Pipapo aufpassen. Das ist so ähnlich wie bei der Cachegröße, alleine dass AMD nen L1-Cache hat ist noch nicht genügend, es sollte halt mindestens genausoviel Speicher wie bei Intel sein. Der BD-Cache war dahingehend auch schlecht gewählt, da die 16kB kleiner als Intels lange genutzte Größe von 32 kB waren. Excavator zog erstmals wieder gleich und schon ist die IPC halbwegs brauchbar ... natürlich wurde noch mehr gemacht, aber der L1 wird schon mit am Meisten zur IPC-Verbesserung beigetragen haben.Wohl gar nicht so falsch, was von Intel abzugucken. Je ähnlicher es zu Intel ist, desto einfacher wird es wahrscheinlich, auch ein ähnliches Performanceprofil zu erreichen. Immerhin muß AMD ja praktisch immer mit Software klarkommen, die für Intels gemacht/kompiliert wurde. Etwas anzubieten, was Intel nicht bietet, nutzt dann kaum eine Software aus, dafür müßte man an anderer Stelle sparen und das rächt sich dann.
Bei den ganzen Gerüchten ist jetzt noch die Frage, was man aus dem VR-Zone-Leak machen soll, immerhin redeten die als erste vom L0-Cache, der nun bestätigt wurde. Als Größe gaben sie 4kB an, außerdem 64kB L1-Caches und 512 kB L2 ... letzteres wurde schon öfters genannt, aber 64kB L1 .. naja beschweren würde ich mich sicher nicht und bisher hatten alle Designs vom Keller 64kB L1. Wäre sicherlich auch nett im 2xfach SMT-Betrieb.
OBrian
Moderation MBDB, ,
- Mitglied seit
- 16.10.2000
- Beiträge
- 17.031
- Renomée
- 267
- Standort
- NRW
- Prozessor
- Phenom II X4 940 BE, C2-Stepping (undervolted)
- Mainboard
- Gigabyte GA-MA69G-S3H (BIOS F7)
- Kühlung
- Noctua NH-U12F
- Speicher
- 4 GB DDR2-800 ADATA/OCZ
- Grafikprozessor
- Radeon HD 5850
- Display
- NEC MultiSync 24WMGX³
- SSD
- Samsung 840 Evo 256 GB
- HDD
- WD Caviar Green 2 TB (WD20EARX)
- Optisches Laufwerk
- Samsung SH-S183L
- Soundkarte
- Creative X-Fi EM mit YouP-PAX-Treibern, Headset: Sennheiser PC350
- Gehäuse
- Coolermaster Stacker, 120mm-Lüfter ersetzt durch Scythe S-Flex, zusätzliche Staubfilter
- Netzteil
- BeQuiet 500W PCGH-Edition
- Betriebssystem
- Windows 7 x64
- Webbrowser
- Firefox
- Verschiedenes
- Tastatur: Zowie Celeritas Caseking-Mod (weiße Tasten)
Als Programmierer bleibt man ja auch lieber von der Hardware weg und schreibt objektorientiert, statt in die Tefen der Register abzutauchen Ich meinte eher, daß der Compiler im Zweifel eher darauf eingestellt ist, was für Intels gut ist und auf AMDs "auch läuft", nicht umgekehrt. Und das dürfte nicht nur den Intel Compiler betreffen, sondern auch den von Microsoft, womit ja wohl das meiste an Windows-Software kompiliert wird. Bei Linux kompilieren ja mehr Leute selber, aber die Standardkompilate werden auch in 80-90% der Fälle auf Intel-Maschinen entstanden sein. Das ist nun mal so, der Teufel scheißt immer auf den größten Haufen.
https://www.phoronix.com/scan.php?page=home wird da wahrscheinlich schon mal Benchs gemacht haben beziehungsweise auf dem Benchmark Archive davon könntest du eventuell welche finden: http://openbenchmarking.org/
Ähnliche Themen
- Antworten
- 103
- Aufrufe
- 6K
- Antworten
- 15
- Aufrufe
- 2K
- Antworten
- 41
- Aufrufe
- 3K
- Antworten
- 22
- Aufrufe
- 2K