Intel Haswell - AVX2 | FMA3 | 22nm

Duplex · 21.03.2013

FredD schrieb:
Wozu bringst du im Haswell/Broadwell Thread den GTX Titan ins Spiel?

Na und...
Weil die meißten Leute eine Grafikkarte kaufen, ist doch interessant wie eine aktuelle Karte mit der neuen CPU dann skaliert, die iGPU von Haswell ist nicht für Gamer gedacht.

FredD · 21.03.2013

Duplex schrieb:
die iGPU von Haswell ist nicht für Gamer gedacht.

Interessante Wendung

Wenn du rein aus der Perspektive eines High-End Gamers argumentierst, könnten wir diesen Thread fast schon wieder dicht machen.

Twodee · 21.03.2013

...oder gar nicht erst darauf eingehen

Duplex · 21.03.2013

FredD schrieb:
Interessante Wendung

Wenn du rein aus der Perspektive eines High-End Gamers argumentierst, könnten wir diesen Thread fast schon wieder dicht machen.

Was für eine Wendung?
Ich glaube du hast langeweile.
Außerdem handelt es sich bei den 4770k um eine 300 Euro CPU, das ist wohl eine High End Gamer CPU.
Ich hab doch nur gesagt auf richtige Tests warten, am besten mit ded. GPU.
Wenn es dir nicht passt dann halte dich einfach zurück, brauchst mich nicht immer zitieren.

Complicated · 21.03.2013

Also dass Transactional Memory bei Spielen oder Desktop PCs jemals eine Rolle spielen wird, halte ich für völlig ausgeschlossen. Das nützt nur Datenbankservern mit tausenden von Zugriffen auf die Datenbank. Siehe Seite 6 dieses Threads:

Complicated schrieb:
Ein lesenswerter Artikel bei Anand zu Haswells "Transactional Synchronization eXtensions" (TSX), welche eine Befehlsatzerweiterung darstellen die Hardware beschleunigtes Transactional Memory ermöglichen.
http://www.anandtech.com/show/6290/...well-transactional-synchronization-extensions

Somit werden Restricted Transactional Memory (RTM) und Hardware Lock Elision (HLE) ermöglicht. Diese Techniken benötigen geringfügige Änderungen in Software welche dann nicht rückwärtskompatibel ist. Mit der Erweiterung der Instuktionen sollen vor allem die Probleme bei der Skalierung grosser Multicore-Systeme addressiert werden.

Besonders bei Datenbanken resuliteren Skalierungsproblem daraus, dass Daten gesperrt werden von einem Thread und so ein anderer warten muss bis eine Freigabe erfolgt um auf die Daten zugreifen zu können.

FredD schrieb:
Was meint Duplex zu den neuen Testergebnissen mit einem Vorserien-Exemplar, welche das geahnte Performance-Bild (+5% IPC single thread, +10% IPC multi thread) weiter untermauern?

Also das habe ich nun des öfteren gelesen und habe eine Frage dazu:
Wie wird diese "IPC" denn definiert, damit sie in Singlethread eine andere Steigerung erreicht als in Multithread Szenarien? IPC sollte nach meinem Verständnis sich doch auf einen Kern beziehen. Noch nicht mal bei Bulldozermodulen habe ich von unterschiedlicher IPC bei Single-/Multithread gelesen. Wobei es dort ja am ehesten gerechtfertigt wäre dies zu unterscheiden.

Dresdenboy · 21.03.2013

Complicated schrieb:
Also das habe ich nun des öfteren gelesen und habe eine Frage dazu:
Wie wird diese "IPC" denn definiert, damit sie in Singlethread eine andere Steigerung erreicht als in Multithread Szenarien? IPC sollte nach meinem Verständnis sich doch auf einen Kern beziehen. Noch nicht mal bei Bulldozermodulen habe ich von unterschiedlicher IPC bei Single-/Multithread gelesen. Wobei es dort ja am ehesten gerechtfertigt wäre dies zu unterscheiden.

So, wie es jetzt oft verwendet wird, stellen diese IPC-Änderungen nur die Änderung gegenüber einer anderen CPU-Mikroarchitektur dar, was bei Taktgleichheit oder Taktnormierung möglich ist. Dabei kommen keine konkreten IPC-Messwerte heraus.

Da aber auch der Takt dank Turbo- und Throttlemechanismen nicht konstant ist, wie auch die Leistung des Speichercontrollers oder anderer Komponenten, ist selbst dieser Änderungswert "IPC" als Maß für Architekturverbesserungen recht ungenau.

FredD · 21.03.2013

Complicated schrieb:
Also das habe ich nun des öfteren gelesen und habe eine Frage dazu:
Wie wird diese "IPC" denn definiert, damit sie in Singlethread eine andere Steigerung erreicht als in Multithread Szenarien? IPC sollte nach meinem Verständnis sich doch auf einen Kern beziehen. Noch nicht mal bei Bulldozermodulen habe ich von unterschiedlicher IPC bei Single-/Multithread gelesen. Wobei es dort ja am ehesten gerechtfertigt wäre dies zu unterscheiden.

Vager Begriff. Bin selbst kein IPC-Fetischist, obwohl ich Solchigen gerne auf den Zahn fühle.
Der Zwang zur Unterscheidung (ST / MT) einerseits, und zur Betonung dieser Kennzahl (die jedoch kaum absolut bestimmt wird) rührt meiner Einschätzung nach aus den (Un-)Möglichkeiten der Software-Programmierung heraus. Würde seit Einführung der ersten Zweikernprozessoren in den Massenmarkt jede (wenn auch noch so unbedeutende) Applikation nahezu perfekt mit beliebig vielen Kernen skalieren, wäre diese Diskussion hinfällig, der IPC-Begriff in dieser Art seiner Verwendung ebenso.
Warum halte ich die "IPC" für ST so interessant? Weil allein daraus das Argument für die Vorzüge der neuen Prozessor-Generation gestrickt wird. Woraus auch sonst, wenn jedwede Software Jahre oder gar Jahrzehnte mit der Unterstützung neuer "Features" hinterherhängt. Bei den Bulldozer-Modulen hatten wir übrigens die Diskussion über die Leistungseinbrüche, wenn ein Modul 2 Threads verarbeitet - da muss dir also was entgangen sein.

Complicated · 21.03.2013

Danke für die Erklärungsversuche, doch ich scheine mich ungenau ausgedrückt zu haben:

Ich versuche zu erfassen wie man zwischen Singlethread und Multithread IPC unterscheiden kann und da über verschiedene Werte spekuliert? Vor allem wie das gehen soll, wenn man keinerlei Threadanzahl unter Multithread definiert.

@Fred
Ich habe mich bei der Moduldiskussion ja auch beteiligt. Nur hat dort meiner Erinnerung nach niemand den Begriff Multi-IPC verwendet. Da hat es ausgereicht dass man verstanden hat dass 2 Threads auf einem Modul ca. 180% der Performance eines Singlethreads schafften.

LoRDxRaVeN · 21.03.2013

Complicated schrieb:
Ich versuche zu erfassen wie man zwischen Singlethread und Multithread IPC unterscheiden kann und da über verschiedene Werte spekuliert? Vor allem wie das gehen soll, wenn man keinerlei Threadanzahl unter Multithread definiert.

Natürlich muss du das definieren. In letzten Fall war das einfach Sandy-Bridge i7 vs. Ivy-Bridge i7 vs. Haswell i7 - alle mit 3,5GHz und 8 Threads. Da kommt dann ein (prozentueller) Unterschiedheraus was gleich der IPC Steigerung ist (bezogen auf den ganzen Prozessor bzw. teilweise sogar auf das ganze System). Das diese IPC bzw. die Steigerung von Anwendungsfall zu Anwendungsfall teils stark unterschiedlich ist, sollte mittlerweile klar sein.

Die Unterschiede bei der Singlethread-IPC stellst du gleich fest, nur eben mit einem Anwendungsfall mit strikt einem Thread.

Wie schon sehr oft gesagt wurde: Es gibt einfach nicht die IPC, sondern diese unterscheidet sich stark von Anwendungsfall zu Anwendungsfall und so eben auch zwischen Szenarien mit wenigen oder vielen Threads.

Die eine einzelne "Multithread-IPC" gibt es natürlich nicht - es geht nur im den Vergleich unter möglichst gleichen Bedinungen (z.B. 8 Threads, 3,5GHz)

LG

Complicated · 21.03.2013

Ok, dann ist es genau so wie ich es schon vermutet habe. Nicht nur dass dieses sinnlose IPC vergleichen schon für die Katz war da nie irgendjemand irgend eine Software oder Code als Grundlage dafür definiert, jetzt wird das ganz noch sinnloser in Multithread Szenarien verwendet.

Mich würde mal interessieren wie selbige IPC Jünger diese bei einer APU und HSA optimiertem Code definieren.

LehmannSaW · 21.03.2013

LoRDxRaVeN schrieb:
Natürlich muss du das definieren. In letzten Fall war das einfach Sandy-Bridge i7 vs. Ivy-Bridge i7 vs. Haswell i7 - alle mit 3,5GHz und 8 Threads. Da kommt dann ein (prozentueller) Unterschiedheraus was gleich der IPC Steigerung ist (bezogen auf den ganzen Prozessor bzw. teilweise sogar auf das ganze System). Das diese IPC bzw. die Steigerung von Anwendungsfall zu Anwendungsfall teils stark unterschiedlich ist, sollte mittlerweile klar sein.

Die Unterschiede bei der Singlethread-IPC stellst du gleich fest, nur eben mit einem Anwendungsfall mit strikt einem Thread.

Wie schon sehr oft gesagt wurde: Es gibt einfach nicht die IPC, sondern diese unterscheidet sich stark von Anwendungsfall zu Anwendungsfall und so eben auch zwischen Szenarien mit wenigen oder vielen Threads.

Die eine einzelne "Multithread-IPC" gibt es natürlich nicht - es geht nur im den Vergleich unter möglichst gleichen Bedinungen (z.B. 8 Threads, 3,5GHz)

LG

Das kannst du auch nicht ganz vergleichen, da ein moderner Prozessor keine 8 Threads mit festen 3,5GHz hat.
Der Prozessor-Takt steigt je nach Turbo-Implementierung bei der einen Generation schneller oder hällt den Turbo länger (andere Kerne gehen schneller schlafen) oder im Raum ist es kälter etc.
Du müsstest also den Takt fest pinnen und dann Messungen durchführen, wenn du genaue instructions per cycle erhalten willst.

Grüße Lehmann

LoRDxRaVeN · 21.03.2013

Keine Frage. Das Sache genügt natürlich keine wissenschafflichen Standards. Da der Turbo aber ein Teil des Prozessor ist, wäre es auch nicht völlständig richtig, diesen abzuschalten. Deaktiviert man ihn, kommt man auf besser vergleichbare Ergebnisse bei gegeben Takt, verliert dadurch aber die "Information" über einen evt. besser funktionierenden Turbo - wie gesagt, dieser ist ja immerhin Teil des Prozessors und kann sich somit je nach Definition auch positiv auf die IPC auswirken (ja, mir ist bewusst, dass das PC meist für per cycle steht

).
Alles ein "Für" und "Wider"

Complicated · 21.03.2013

Und vor allem lässt es wie immer ausser acht wie viele Cyle pro Sekunde eine CPU schafft

Was nützt mir ein guter Durchsatz pro zyklus, wenn ich die Taktrate runter drehen muss um diesen Durchsatz zu schaffen. Unterm Strich kommt dann auch nicht mehr raus.

LoRDxRaVeN · 21.03.2013

Ist natürlich auch richtig - es bietet sich einfach bei diesem Fall - 2700k vs 3770k vs. 4770k an, da alle vom Werk aus mit der selben (Basis-)Taktfrequenz daherkommen*.
Ich sage es mal so: Beim Vergleich relativ zwischen diesen drei Prozessoren, die sich wie gesagt doch ziemlich ähnlich sind, funktioniert die Sache noch ziemlich gut, sind sich die Prozessoren nicht so ähnlich, ist der angestrebte Vergleichswert "IPC" immer weniger brauchbar.

LG

*Nachtrag: ...und exakt das selbe Segment bedienen.

Raspo · 23.03.2013

Äh, was wird nochmal in etwa der Haswell mit GT2 kosten und was ein Richland?
Schätze mal ähnliche Preise wie Ivy und Trinity.
Das sollte man berücksichtigen.
Außerdem wie siehts denn mit den Treibern bei Intel und der Qualität der Grafikeinstellungen aus?

y33H@ · 23.03.2013

Du kannst MSAA und AF einstellen, die Qualität ist auf Augenhöhe (lustigerweise filtert Intel mittlerweile fast perfekt).

~DeD~ · 23.03.2013

y33H@ schrieb:
Du kannst MSAA und AF einstellen, die Qualität ist auf Augenhöhe (lustigerweise filtert Intel mittlerweile fast perfekt).

allerdings sind die treiber so gut, dass es sehr oft eh nicht zu gebrauchen ist

Duplex · 23.03.2013

Wenn Kaveri im November kommen soll, wozu gibts dann demnächst neue Richland APUs?
Wegen 4-5 Monaten lohnt sich das nicht wirklich...

Opteron · 23.03.2013

Duplex schrieb:
Wenn Kaveri im November kommen soll, wozu gibts dann demnächst neue Richland APUs?
Wegen 4-5 Monaten lohnt sich das nicht wirklich...

Kaveri kommt erstmal nur als Desktop, die Mobilen kommen wohl in Q1. Vermutlich will AMD so schnell wie möglich ne HSA-Plattform raushauen.

Duplex · 23.03.2013

Eine HSA Plattform, interessant, mal sehen ob dadurch die Absätze höher ausfallen.

isigrim · 23.03.2013

bei den Frauen? (der war einfach zu naheliegend)

Ich denke Kaveri wird durchaus einiges Potenzial mitbringen bezüglich GPU-Performance, wenn DDR4 oder GDDR5 tatsächlich schon als System-RAM genutzt werden kann.

Duplex · 23.03.2013

Die GPU Performance von Trinity ist doch bereits nicht schlecht, man ist meilenweit vor Intel´s iGPU, viel wichtiger finde ich die CPU Performance, mit IPC + Takt Updates sind 20% nicht unrealistisch.
Und jetzt zurück zum Thema, hier geht es um Haswell.

mariahellwig · 24.03.2013

Der Zeitpunkt wann wir mit Haswell-Produkten überflutet werden scheint auch noch etwas weiter weg zu sein. Gerüchten zur Folge soll erst im 4Q Haswell die Massen erreichen.

Stryki · 24.03.2013

http://www.it-times.de/news/nachric...prozessor-soll-mitte-2013-vorgestellt-werden/

Soll zur Computex sein auch laut CT, aber an die ODM's wird die CPU vermutlich auch jetzt ausgeliefert weil die 3 Monate Vorlauf muss sein und darum ging es ja oben^^

y33H@ · 24.03.2013

mariahellwig schrieb:
Gerüchten zur Folge soll erst im 4Q Haswell die Massen erreichen.

Sprichst du von Desktop 4C, von Desktop 2C, von Mobile, von Mobile ULT oder von Mobile Tablet?

Intel Haswell - AVX2 | FMA3 | 22nm

Admiral Special

Gesperrt

Lord of the Stats, Special, ,

Admiral Special

Grand Admiral Special

Redaktion☆☆☆☆☆☆

Gesperrt

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Vice Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Admiral Special

Admiral Special

Fleet Captain Special

Admiral Special

Redaktion☆☆☆☆☆☆

Admiral Special

Grand Admiral Special

Admiral Special

Grand Admiral Special

Admiral Special

Admiral Special

Ähnliche Themen

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆