Intel Haswell - AVX2 | FMA3 | 22nm

Erstmal wird der Standard GT2 4-Kerner den Markt erreichen, etwas bis erheblich später der Rest oder nicht?
 
Kaveri-Thread:
http://www.planet3dnow.de/vbulletin/showthread.php?t=402114
und jede einzelne dort vorhandene Folie, seit über einem Jahr, sagt deutlich Launch in 2013. Wer daraus 2014 macht, der diskutiert jenseits der Faktenlage die jetzt und heute bekannt ist.

Aber DAS sollte nun wirklich nicht hier bei Haswell diskutiert werden.
 
Eigentlich sollen die GT3 genau gegensätzlich in den mobilen und Low-Power Varianten vermehrt zum Einsatz kommen.
http://www.computerbase.de/news/2012-12/haswell-gt3-grafikloesung-mit-40-eus-auch-in-15-watt-cpus/
Diese werden intern wie bisher auch mit GT1 und GT2 gekennzeichnet, hinzu kommt bei den „Haswell“ als neue Lösung erstmals GT3. Jene wird 40 EUs bieten, bei den kleineren Modellen werden es je nach Angabe 6 bis 10 (GT1) oder 16 bis 20 EUs (GT2) sein. Die GT3-Lösung wird nicht nur den High-End-Modellen vorbehalten bleiben, sondern bis hinab zu den Ultrabook-Varianten mit 15 Watt zum Einsatz kommen.
allerdings wird der Performancesprung nicht so gross sein wie die verdoppelten EUs suggerieren könnten, da Intel diese deutlich niedriger takten wird bei diesen Modellen.
 
Aber worauf bezieht sich CB in der Meldung, nur auf den einen Screenshot mit Ultrabook-CPU?

Ich fände es ja auch logisch die GT3 da zu verbauen, aber ob man sie auch in Standard-Notebooks finden wird? Denn vom Preispunkt her sind Ultrabooks für mich auch High-End. Zudem dürfte der Stromverbrauch ein gutes Stück anziehen.
 
Ich denke dass Intel den Flächenvorteil der 22nm Fertigung einfach in GPU Performance umsetzen möchte in den Sparten wo APU tatsächlich das bessere Gesamtpaket bilden. Gerade Ultrabooks benötigen mehr GPU Power bei diesem Preissegment und können keine dedizierte GPUs aufnehmen. Das wird derzeit auch als Grund für den Misserfolg der Ultrabooks gesehen trotz enormer Aufwendungen für Marketing.

@fluant
Jede deiner Quellen hat Kaveri in 2013 auf der Roadmap. Die Folie von donanimhaber, welche bei hartware.net verwendet wurde, hat sich als Fake herausgestellt, was ja dein Link zu pcper.com klar belegt - dort ist Kaveri auch auf 2013.
 
Zuletzt bearbeitet:
Hier gibt es nichts zu beschönigen. Entweder hard launch oder paper launch.

Naja. Man sollte schon berücksichtigen das wir es mit einem von Intel regulierten Markt zu tun haben. Das läuft dann eben für die Konkurrenz sehr sandig. Wenn überhaupt erscheinen die Produkte nur mit großer Verzögerung. Siehe Q572, siehe Lenovo x120, obwohl die Chips ausreichend verfügbar waren.

Im Embedded-Bereich z.B. wo der Markt nicht so reguliert ist, ist AMD sehr erfolgreich. An den Produkten und den Anforderungen kann es nicht liegen die sind sehr ähnlich.
 
Eigentlich sollen die GT3 genau gegensätzlich in den mobilen und Low-Power Varianten vermehrt zum Einsatz kommen.
http://www.computerbase.de/news/2012-12/haswell-gt3-grafikloesung-mit-40-eus-auch-in-15-watt-cpus/

allerdings wird der Performancesprung nicht so gross sein wie die verdoppelten EUs suggerieren könnten, da Intel diese deutlich niedriger takten wird bei diesen Modellen.

Der GT3 mit der Bez. 5200 taktet aber mit bis zu 1300MHz, und das ist etwas mehr als das, was GT2 an Takt hat.
 
Zuletzt bearbeitet:
Vermutlich muss man hier mal wieder zwischen der mobilen und der Desktop Version unterscheiden.
 
Oh das hatte ich bisher übersehen allerdings ging es im Link von Complicated um die 15W Modelle (offensichtlich die Ultrabook Variante ohne on package cache memory) wärend die normale Notebook Variante den Cache Speicher bekommen soll und mit Sicherheit auch höher getaktet ist.

http://www.computerbase.de/news/2013-03/vollausbau-der-haswell-grafik-als-hd-5xxx-in-notebooks/

nicht nur die 15Watt...

Die GT3-Lösung wird nicht nur den High-End-Modellen vorbehalten bleiben, sondern bis hinab zu den Ultrabook-Varianten mit 15 Watt zum Einsatz kommen.
 
Ja bei einem 47W Modell. Und der Grundtakt ist 200 MHz. Sorry, aber das wird sich wohl erst noch beweisen müssen und ein paar lesbare Infos benötigen, was Intel unter der i7 Y-Linie versteht. Und max. Frequency kann ein Turbo sein der nie erreicht wird, da die Y-Serien ja konfigurierbar sind. Alle die Fussnoten sind nicht unnötigerweise vorhanden.

Ich habe noch nie erlebt dass Nvidia oder AMD bei einer GPU den Idle Takt als Basistakt bezeichnet haben.

Und GT2 mit 20 EUs taktet anscheinend mit 1,25 Ghz
http://www.hardwareluxx.de/index.ph...-leistung-der-intel-haswell-cpu-i7-4770k.html
Im Turbo-Modus kann der i7-4770K auf bis zu 3,9 GHz übertakten und die verbaute GPU mit dem Codenamen GT2 wird mit 1,25 GHz arbeiten.
 
Zuletzt bearbeitet:
Siehe Tabelle im Computerbase Link.
Bei den Ultrabook Modellen steht zwar die GT3 Lösung drin aber nur bei den High-Performance Notebook Modellen steht die GT3 Lösung inkl. Package Cache Memory drin.
 
Um zum CPU Part nochmal zurück zu kommen.
Wenn ich mir den Test bei THG anschaue dann wundert es mich fast schon das die Änderungen an der Architektur im Zusammenhang mit SMT so gut wie keine auf die Multicore Performance haben. Scheinbar wurde das CPU Design primär für den Gebrauch von AVX und FMA erweitert, wodurch sich die IPC Steigerung abseits dieser Features recht deutlich in Grenzen hält.
 
Beispiele wie Visual Studio Compile sprechen das Gegenteil: hier kann der 6-Kerner Sandy-E voll auftrumpfen, der Haswell zeigt sich aber ebenso deutlich stärker (+13% gegenüber IVB) als in seinem Performance-Durchschnitt.
 
Es ist gut möglich das es von der deutlich höheren L1 Bandbreite profitiert, da kenne ich mich im Software Segment nicht gut genug aus. Bei Blender hält sich der Performancezuwachs mit ca. 7% allerdings sehr in Grenzen und die +3% bei Lame reißen auch niemanden vom Hocker.
Bei den Sandra 2013 Benchmarks kann man hingegen sehr deutlich erkennen wo sich etwas verändert hat allerdings kann dieses auch mit FMA und AVX umgehen. Der Vergleich zum FX-8 wäre hier sicherlich interessant gewesen.

Edit: Sagt mal habe ich einen Denkfehler oder bezieht sich FMA nicht auf die Integer- und AVX auf die Fleißkommaperformance?
Auf der deutschen seite steht es genau anders herum. oO http://www.tomshardware.de/core-i7-4770k-haswell-performance-Vorschau,testberichte-241235-2.html
 
Zuletzt bearbeitet:
Um zum CPU Part nochmal zurück zu kommen.
Wenn ich mir den Test bei THG anschaue dann wundert es mich fast schon das die Änderungen an der Architektur im Zusammenhang mit SMT so gut wie keine auf die Multicore Performance haben. Scheinbar wurde das CPU Design primär für den Gebrauch von AVX und FMA erweitert, wodurch sich die IPC Steigerung abseits dieser Features recht deutlich in Grenzen hält.
Das Backend wurde doch aber um eine skalare ALU (Legacy x86) und um ein Store erweitert. Auf SIMD/MIMD sollte das auch wenig Auswirkungen haben. Genauso wenig profitieren FP Workloads von den zwei zusätzlichen Ports. Eigentlich sollte es sich hauptsächliche auf skalare Int Workloads auswirken. Wie FredD schon andeutete, Kompilierung kann ein Anwendungsfall sein. Letztendlich wird man aber auch hier Softwareoptimierungen abwarten müssen, um das volle Potenzial auszuschöpfen.

Es ist gut möglich das es von der deutlich höheren L1 Bandbreite profitiert, da kenne ich mich im Software Segment nicht gut genug aus. Bei Blender hält sich der Performancezuwachs mit ca. 7% allerdings sehr in Grenzen und die +3% bei Lame reißen auch niemanden vom Hocker.
LAME ist ja auch singlethreaded. Das war schon vorher klar, dass sich da Verbesserungen in Grenzen halten. Dafür hatte die bisherige Pipeline schon genügend Ressourcen. Und Blender dürfte hauptsächlich FP sein.

Edit: Sagt mal habe ich einen Denkfehler oder bezieht sich FMA nicht auf die Integer- und AVX auf die Fleißkommaperformance?
FMA ist FP, AVX/AVX2 ist FP und Int.
 
Bei Lame ging es mir ja auch um die Singlethread IPC, also den Wert abseits von HTT und Co., welcher vor allem für Software mit unzureichendem Multicore Support (da wo vor allem die Bullis versagen) wichtig ist.

Ah das mit FMA und AVX hatte ich wohl falsch in der Erinnerung. THX :)
 
da es bei einigen mit einsicht und zurückhaltung nicht allzu weit her ist, hab ich hier mal großzügig aufgeräumt. :[
 
Intel's PixelSync & InstantAccess: Two New DirectX Extensions for Haswell

oit_678x452.jpg

das besondere daran ist, dass es ohne Performance-Verlust durchgeführt werden kann.

http://www.anandtech.com/show/6863/...access-two-new-directx-extensions-for-haswell
bzw.
http://www.legitreviews.com/news/15334/


Edit.:

Handbrake wird wohl in Zukunft auch per QuickSync beschleunigt werden können:
http://hothardware.com/News/Intel-D...dering-Extensions-and-Developer-Tools-at-GDC/
 
Zuletzt bearbeitet:
Interessant zu sehen, dass im zweiten Feature "InstantAccess", Haswell HSA-technisch schon mit Llano mitzieht.

The second extension, InstantAccess is simply Intel's implementation of zero copy. Although Intel's processor graphics have supported unified memory for a while (CPU + GPU share the same physical memory), the two processors don't get direct access to each others memory space. Instead, if the GPU needs to work on something the CPU has in memory, it needs to make its own copy of it first. The copy process is time consuming and wasteful. As we march towards true heterogeneous computing, we need ways of allowing both processors to work on the same data in memory. With InstantAccess, Intel's graphics driver can deliver a pointer to a location in GPU memory that the CPU can then access directly. The CPU can work on that GPU address without a copy and then release it back to the GPU. AMD introduced support for something similar back with Llano.

QuickSync: Was mich interessieren würde, ist ob weiterhin die hohe Transcode-Geschwindigkeit durch miese Bildqualität erkauft wird.
 
Solange es nicht so mies ist, wie auf auf AMD-GPUs [damit meine ich nicht OpenCL], solls mir recht sein.
 
Zurück
Oben Unten