NVIDIA - Pascal

Eine kurze Frage zu der hinter Pascal und Polaris steckenden Architektur: Wenn ich mir die Tabelle bei heise.de anschaue [1], liegt die GTX 1060 von der Rohrechenleistung ein ganzes Stück hinter der RX 480 zurück. Trotzdem rendert sie schneller.
Was ist das architektonische Zaubermittel der Nvidias, wodurch sie es schaffen ihre Rechenwerke so effizient auszulasten, dass am Ende doch noch mehr Renderleistung als bei der Radeon heraus kommt?

[1] - http://www.heise.de/newsticker/meld...r-mit-geringer-Leistungsaufnahme-3270665.html
 
Das liegt unter ander am shader/cuda Aufbau selbst AMD setzt auf viele kleine NVIDIA wenig Leistungsstärke shader Einheiten verbaut und Rohleistung ein rein berechnet wert ist kommt AMD theoretisch besser weg

Sieht man auch an der Chip Größe NVIDIA 200mm AMD 232mm bei 1000 shader mehr und breiteren speicheranbindung
 
Nee, wie ich im DX12 Thread schon erwähnte, liegt das schlicht an der Art und Weise, wie die beiden ihre Treiber optimieren.
Mit gleichen Optimierungen dürften die nVidia Karten ziemlich blöd aus der Wäsche schauen und sehr abgeschlagen sein - wie zum Beispiel es in Doom der Fall ist.
 
Was ich soweit an "Pascal" interessant finde, sind die hohen ermöglichten Takte bei niedriger Verlustleistung. Hier scheint das "16nm" Verfahren von TSCM gegenüber dem "14nm" LP node von Samsung/GF doch vorteilhafter zu sein.
Ich denke das liegt eher an der Architektur und weniger an der Fertigung. Gerüchten zufolge will Nvidia ja bei Samsung fertigen lassen, um den Lieferengpässen bei TSMC entgegenzuwirken. Das wäre sicherlich nicht möglich, wenn die Fertigung so viel ausmacht. Dann würden die Geforces zu viel Takt und Performance verlieren.


Eine kurze Frage zu der hinter Pascal und Polaris steckenden Architektur: Wenn ich mir die Tabelle bei heise.de anschaue [1], liegt die GTX 1060 von der Rohrechenleistung ein ganzes Stück hinter der RX 480 zurück. Trotzdem rendert sie schneller.
Renderperformance lässt sich nicht alleine an den FLOPS ablesen. Die GTX 1060 besitzt zB 50% mehr ROPs. Ich persönlich würde sagen, alte APIs (<=DX11 / OpenGL) sind mehr von TMUs und ROPs abhängig, bei neuen APIs (DX12 / Vulkan) kommen hingegen auch die FLOPS besser zur Geltung.
 
Zuletzt bearbeitet:
@Casi030

Schon klar. Ich hab ja jetzt auch nur die Referenzmodelle verglichen. Unter DX12/Vulkan zieht die RX 480 eh schon davon und spielt ihre Stärken aus. Irgendwie hab ich das Gefühl, dass selbst die RX 470 unter DX12/Vulkan schneller als die GTX 1060 wird, bei ähnlicher Leistungsaufnahme und ein Drittel geringerem Preis. Ist aber nur ein Gefühl. *kopfkratz
Dein Gefühlt teile ich.;)
 
Ich meine ich bin sicher kein Profi oder so aber dieser "Taktwahn" den NV aktuell hin legt lässt bei mir alle Alarmglocken leuten, aktuell ist es ja scheinbar noch so das es noch funktioniert und der ein oder andere das ausblendet, aber ich kann mich da an einen Hersteller erinnern der mal ähnliches vollbringen wollte.

Intel und ihre Netburst Architektur die auf 5GHz ausgelegt war und wie sich ja im nachhinein heraus stellte nie dort an kam und auch eine absolute Sackgasse war.

Pascal scheint da in eine ähnliche Richtung zu driften ... weniger Rechenleistung pro Takt als Maxwell und vor allem weniger als Polaris ... ich bin mir da wirklich nicht sicher ob sich NV da nicht in etwas verrennt.
Obwohl es an sich egal ist denn die NV Jünger werden dem grünen Gott weiter huldigen und egal wie groß die Probleme sind sie unter den Tisch kehren und noch größere dem Kontrahenten andichten.
 
Bei früheren Karten auf dem gleichen TSCM Prozess hatte AMD die deutlich höhere Packdichte, was - all else equal - niedrigere Takte bedingt.

Da sich aktuell sowohl Prozess als auch Architektur geändert haben, dürfte das Urteil nicht so eindeutig ausfallen.

Alles in allem kann man sich streiten über dieses Argument, daher auch meine vorsichtige Formulierung: ein Sachverhalt "scheint" bedeutet keine Tatsachenbehauptung! Die mit den neuen nodes erreichten Taktfrequenzen für GPUs (tw. Übertaktungen auf 2GHz luftgekühlt) lassen den Unterschied zwischen den GPU-Serien beider Hersteller zumindest interessant erscheinen. Ob und inwiefern der Sachverhalt vorteilhaft ist, ist dann eine andere Frage.

Dann sind wir uns ja einig ;D . Es ist eher ein schwaches Indiz als ein Beweis. Genau darauf wollte ich hinweisen. Und wie du richtig anmerkst, die Packdichte kann dann den Vergleich im selben Prozess wieder beeinflussen. Wobei man hier ja den Effekt abschätzender Weise auch "raus" rechnen können könnte...

--- Update ---

[3DC]Payne;5106529 schrieb:
Nee, wie ich im DX12 Thread schon erwähnte, liegt das schlicht an der Art und Weise, wie die beiden ihre Treiber optimieren.
Mit gleichen Optimierungen dürften die nVidia Karten ziemlich blöd aus der Wäsche schauen und sehr abgeschlagen sein - wie zum Beispiel es in Doom der Fall ist.

Das ist leider so nicht richtig. Wenn dann trifft die Aussage bezüglich Treiber im "Dx11 und davor"-Renderpfad zu. Ausgerechnet in Doom auf Vulkan stimmt deine Aussage aber überhaupt nicht mehr. Denn das ist das tolle, Treiber im klassischen Sinn wird hier nicht mehr benötigt. Daher kann man da auch nicht mehr so optimieren.... Was gut ist. Verringert schon mal die Möglichkeiten zu "tricksen".
 
Pascal scheint da in eine ähnliche Richtung zu driften ... weniger Rechenleistung pro Takt als Maxwell und vor allem weniger als Polaris ... ich bin mir da wirklich nicht sicher ob sich NV da nicht in etwas verrennt.

Pascal ist kleiner (= billiger zu fertigen!) als Polaris, kompensiert das durch wesentlich höheren Takt und zieht dabei auch noch weniger Strom. Das riecht nach einer technischen Meisterleistung.
 
Pascal ist kleiner (= billiger zu fertigen!) als Polaris, kompensiert das durch wesentlich höheren Takt und zieht dabei auch noch weniger Strom. Das riecht nach einer technischen Meisterleistung.

Und teurer dem Dau andrehen ist eine Marketing-Meisterleistung.
 
Pascal ist kleiner (= billiger zu fertigen!) als Polaris, kompensiert das durch wesentlich höheren Takt und zieht dabei auch noch weniger Strom. Das riecht nach einer technischen Meisterleistung.

Gut das mag Ansichtssache sein ob das eine Meisterleistung ist ein vorhandenes Design leicht zu überarbeiten und von 28nm auf 16nm zu verkleinern .... das Pascal billiger zu fertigen ist als Polaris seh ich aktuell nirgendwo belegt, es gibt keine offiziellen Preise zu den Fertigungskosten von daher ist das absolute Spekulation.
Das Pascal bei hohem Takt Effizient ist will ich nicht abstreiten ... das Pascal allerdings was seine Features angeht zukunftssicher ist, das auf jedenfall ...



Und teurer dem Dau andrehen ist eine Marketing-Meisterleistung.

Dem DAU? das kaufen ja nicht nur DAUs sondern auch normale Menschen, allerdings bin ich immer wieder Fasziniert das NV es schafft der Kundschafft einzureden das bestimmte Features nicht gebraucht werden sofern sie von der eigenen Hardware nicht unterstützt werden ... da stell ich mir eher die Frage nach dem Sinn von zum Beispiel nach Gameworks ... wer braucht etwas das nur von 33% der Hersteller genutzt werden kann?!?
 
Welche angeblich höhere oder gleiche Packdichte? Der Chip ist zwar ca. 15% kleiner hat aber auch ca. 25% weniger Transistoren.
Der Chip ist nur deshalb kleiner weil er z.B. fast halb so viele Shader und ein 25% kleineres Speicherinterface besitzt und seine Leistung aus der deutlich höheren Taktfrequenz holt.
Zudem hat es ja fast schon Tradition das die Karten im laufe der Zeit zurück fallen oder die Bombe zeitverzögert hoch geht.
 
Pascal ist kleiner (= billiger zu fertigen!) als Polaris, kompensiert das durch wesentlich höheren Takt und zieht dabei auch noch weniger Strom. Das riecht nach einer technischen Meisterleistung.
Wenn man rein die Dies pro Wafer ansieht, sieht das erstmal so aus, dass GP106 günstiger in der Herstellung ist:
Polaris 10: 102 dies per 200mm wafer (232mm²). GP106: 119 dies per 200mm wafer (200mm²)
Allerdings kennen wir die Wafer-Kosten nicht. Der LPP Prozess dürfte weniger Layer haben als ein Performance-Prozess und insgesamt niedrigere Wafer-Preise bedingen.
 
egal wie groß die Probleme sind sie unter den Tisch kehren
was für konkrete probleme meinst du?

Und teurer dem Dau andrehen ist eine Marketing-Meisterleistung.
verkaufen gehört halt dazu. es sind sicher viele revolutionäre ideen gegenüber einfachen lösungen verschwunden, weil man es nicht geschafft hat, die kunden zu überzeugen und die produkte an den mann zu bringen.

je mehr ich solche diskussionen verfolge, desto mehr wundere ich mich. bei nvidia ist alles mist, aber sie schaffen es immer wieder, mit technisch völlig rückständigen produkten die leistungskrone zu holen. alles ist mist, sie schaffen es aber dem kunden ihre technisch rückständigen zu völlig überzogenen preisen anzudrehen. alles ist mist, sie haben aber mittlerweise ~80% marktanteil und verdienen gutes geld.

alles sehr erstaunlich ... *suspect*
 
ich liebe es wenn man Zitiert aber nur teile eines Textes ... aber egal

es geht nicht um Aktuelle konkrete Probleme bei Pascal, NV schafft es aber das ihre Produkte gekauft werden wie blöde auch wenn sie bekannte Bugs haben wie den 3,5GB Bug ... oder sind die NV Jünger nun schon soweit das es kein Bug war sondern ein Feature?

Welches Feature hat NV denn, das sowohl sinnvoll ist als auch von allen offen genutzt werden kann das AMD nicht hat?

Aber egal es sind alles HD Karten mit denen UHD vollkommen unmöglich ist, DX12 und Vulkan existieren nur auf dem Papier und DX11 wird noch für 3-5 Jahre das Maß aller Dinge sein ... :P (Alles Aussagen von NV Jüngern, nicht unbedingt von hier aber sie wurden getätigt)
Ich gönne jedem sein Träumchen ... :)
Das die Leute die, die eine 1060 oder eine RX480 kaufen in der Regel Leute sind die ihre Karten über 4-5 Jahre nutzen interessiert die Leute auch nur so am Rande ...

Übrigens spiele sich schon seid über 12 Monaten in UHD (3840x2160) mit meiner R9 290 ... Ja manchmal muss man ein wenig an den Einstellungen spielen und ich kann nicht immer alles auf Ultra Maximum Giga Detail spielen, aber was oft einfach nicht erwähnt wird, vieles sieht in UHD wesentlich besser aus selbst wenn die Detailstufe niedriger ist ;)
Auch brauch ich keine 120FPS im schnitt, mir reichts wenn die FPS im Mittel nicht unter 30-40 FPS fallen ;)
 
Zuletzt bearbeitet:
NV Jünger ... hör doch einfach mal mit dem fanboy-vokabular auf. das nervt einfach nur ...

und eigentlich ist das thema 970 hier völlig fehl am platze.

oder sind die NV Jünger nun schon soweit das es kein Bug war sondern ein Feature?
nvidia hat seine kunden betrogen, nvidia wurde verklagt und es wird mit an sicherheit grenzender wahrscheinlichkeit eine außergerichtliche einigung für die betroffenen geben. nach dem skandal stand die 970 in den verkaufslisten trotzdem noch lange auf den vordersten plätzen, wurde also immer noch von vielen kunden gekauft.

NV schafft es aber das ihre Produkte gekauft werden wie blöde
und das ist inwiefern kritikwürdig?

Welches Feature hat NV denn, das sowohl sinnvoll ist als auch von allen offen genutzt werden kann das AMD nicht hat?
gegenfrage ... warum kaufen dann so viele kunden nvidia produkte?
 
auch wenn sie bekannte Bugs haben wie den 3,5GB Bug
Hör bitte auf von Bug zu sprechen!

Denn Bug ist das gleiche wie ein Unfall: ein unvorhergesehenes, unabsichtliches Ereignis.

Das ist hier aber definitiv NICHT der Fall, der Chip wurde absichtlich beschnitten, entsprechend kann das auch kein Bug sein, eben weil es Absicht war...
 
Sagen wir es doch mal so: Nur 3,5 GB des 4 GB großen Speichers können mit voller Geschwindigkeit angesprochen werden. Für die Restlichen 512 MB fehlt einfach der Cache. Daher ist dieser Teil des Speichers einfach viel langsamer. Man kann immer noch davon sprechen, dass die 970er Karten 4 GB Speicher habe und dieser mit 256 bit an den Chip angebunden ist. Eigentlich wären es nur 3,5 GB mit 224 bit gewesen. Ist das nicht ein Feature?

Wie auch immer. Pascal scheint ein ordentlicher Chip zu sein der derzeit bei DX11 die Nase vorn hat. Alles weitere wird sich zeigen.
 
Allerdings kennen wir die Wafer-Kosten nicht.

Ein Analyst glaubt sie für Nvidia zu kennen:
Also alles Abzocke? Nicht ganz, sagt Dr. Handel Jones, Analyst für die Auftragsfertigersparte bei Chips. Seinen Informationen nach sind die Wafer für den bei Pascal verwendeten 16-nm-Prozess von 2015 auf 2016 um 70 Prozent gestiegen - von 4557,25 USD auf 7779,22 USD. Diese enorme Preisteigerung fängt auch nicht die Tatsache auf, dass der GP106 mit 200 mm² etwas kleiner ist als der GM206 mit 228 mm². Der Pascal-Chip ist mit 33,3 USD trotzdem teurer als der Maxwell-Chip mit 19,9 USD. Laut Analyst ist die Preissteigerung des Basismaterials der Hauptgrund für die hohen Preise. Der Analyst erinnert zudem daran, dass auf der GTX 1060 die dreifache Menge an Speicher verbaut ist als auf der Standard-GTX-960, der einen Hauch schneller ist. Auch hier dürften die Preissenkungen über die Zeit nicht die Materialsteigerung auffangen.
http://www.pcgameshardware.de/GTX-10606G-OC-Grafikkarte-264696/News/Preis-teurer-Amalyst-1202092/

--- Update ---

nach dem skandal stand die 970 in den verkaufslisten trotzdem noch lange auf den vordersten plätzen, wurde also immer noch von vielen kunden gekauft.
Ich finde schlimm, dass solches Verhalten auch noch belohnt wird. Wäre in etwa so, als würden jetzt alle wie blöde manipulierte VW-Diesel kaufen...

gegenfrage ... warum kaufen dann so viele kunden nvidia produkte?
Weil es trotz allem gute Produkte mit vernünftiger Leistung sind.
 
Ich höre mit dem Fanboy vokabular auf wenn aufgehört wird wie ein Fanboy zu reden ;)

zur 970, sorry für das Wort Bug, es war ein Feature, zwar eins wo der Kunde beschissen wurde aber nun gut egal ...
ich sage nicht das es ein Kritikpunkt ist das NV trotz der ganzen nicht so nennen wir es mal netten Dinge die sie machen / gemacht haben ihre Karten gut verkaufen, ich wundere mich nur über diesen Umstand.

Als nächstes, Fragen beantwortet man nicht mit gegenfragen aber auch hier werde ich dir mal Antworten:
Es sind keine schlechten Produkte und beim besten willen auch nicht langsam, sie sind aber halt nur Stand heute was die Features angeht und nicht stand morgen so wie man es erwarten könnte bei einem so teuren Produkt, zumal der günstigere anbieter die Features von morgen schon mit an Board hat.
Jedem ist es natürlich offen sein Geld aus zu geben wo er mag. Was ich nur nicht verstehe ist immer diese Hochgelobe wo es nichts hoch zu loben gibt ... das Einzig gute an Pascal ist meiner Ansicht nach die Effizienz. Wüsste nichts was sonst für eine Pascal Karte Sprechen würde und ich wollte mir eigentlich eine holen bis klar war das Pascal keine AS besitzt und unter DX12 einfach schlecht da steht ....
 
Ums mal deutlicher zu sagen:
Die Hardware ist nicht soo das Problem, der Preis und insbesondere die Firma selbst ist das Problem...
Insbesondere aber die Fans dieser Firma...

So langsam sollten wir auch einsehen, dass nVidia nämlich die Karten sehr schnell sterben lässt und gar nichts mehr für die alten Karten macht, wenn die nächste Generation vorgestellt wird.
Das führt dann eben auch dazu, dass der Abstand zum damals gleichwertigen Gegner z.T. gewaltig ansteigt und in einigen Situationen eine Stufe runtergereicht wird, ie eine GTX 680 erreicht in einigen Spielen gerade mal die Leistung der Radeon HD7870...

Und meinereiner hat übrigens auch seit etwas über 4 Jahren eine Radeon HD 7970 und sehe immer noch keinen Grund, an diesem Zustand was zu ändern. Eher kaufe ich mir 'nen anderen Kühler für die Karte ;)
 
Wenn man rein die Dies pro Wafer ansieht, sieht das erstmal so aus, dass GP106 günstiger in der Herstellung ist:
Polaris 10: 102 dies per 200mm wafer (232mm²). GP106: 119 dies per 200mm wafer (200mm²)
Allerdings kennen wir die Wafer-Kosten nicht. Der LPP Prozess dürfte weniger Layer haben als ein Performance-Prozess und insgesamt niedrigere Wafer-Preise bedingen.

Da kommt allerdings noch das kleinere Speicherinterface, 2GB weniger RAM, und Einsparungen an Platine und Kühlung hinzu. Durch die Effizienz von GP106 kann das alles simpler ausfallen. Insofern sind die Fertigungskosten definitiv nicht höher sondern eher einen kleinen Tacken niedriger. Das gepaart mit leicht höheren Preisen ist natürlich wieder eine optimale Ausgangslage auf die Verkaufsdauer des Produktes gesehen. Auch für Notebooks und OEM Desktops ist das natürlich nicht verkehrt.

--- Update ---

[3DC]Payne;5106745 schrieb:
Ums mal deutlicher zu sagen:
Die Hardware ist nicht soo das Problem, der Preis und insbesondere die Firma selbst ist das Problem...
Insbesondere aber die Fans dieser Firma...

So langsam sollten wir auch einsehen, dass nVidia nämlich die Karten sehr schnell sterben lässt und gar nichts mehr für die alten Karten macht, wenn die nächste Generation vorgestellt wird.
Das führt dann eben auch dazu, dass der Abstand zum damals gleichwertigen Gegner z.T. gewaltig ansteigt und in einigen Situationen eine Stufe runtergereicht wird, ie eine GTX 680 erreicht in einigen Spielen gerade mal die Leistung der Radeon HD7870...

Und meinereiner hat übrigens auch seit etwas über 4 Jahren eine Radeon HD 7970 und sehe immer noch keinen Grund, an diesem Zustand was zu ändern. Eher kaufe ich mir 'nen anderen Kühler für die Karte ;)

Deswegen verdient AMD halt auch so wahnsinnig viel Geld :=).
Btw. Smartphone sind nach 2 Jahren im Prinzip erledigt. Da wird auch alle 2 Jahre nachgekauft. Zum Teil für Deutlich mehr Geld und in deutlich größeren Mengen. Spätestens nach 3 Jahren wird bei mir die Graka getauscht. Die CPU behalte ich selbstredend länger. Bringt eben nicht so viel.
 
Pascal ist kleiner (= billiger zu fertigen!) als Polaris, kompensiert das durch wesentlich höheren Takt und zieht dabei auch noch weniger Strom. Das riecht nach einer technischen Meisterleistung.
So sehe ich das auch, unterschiedliche Waferkosten pro Prozess mal außen vor. Die Frage ist, wie schaffen sie dass?
 
kompensiert das durch wesentlich höheren Takt und zieht dabei auch noch weniger Strom. Das riecht nach einer technischen Meisterleistung.
Nicht wirklich, wenn man bedenkt, dass es nach wie vor nur ein DX11 Chip ohne grossartige Computing Fähigkeiten ist. ;)
 
Wenn man rein die Dies pro Wafer ansieht, sieht das erstmal so aus, dass GP106 günstiger in der Herstellung ist:
Polaris 10: 102 dies per 200mm wafer (232mm²). GP106: 119 dies per 200mm wafer (200mm²)
Allerdings kennen wir die Wafer-Kosten nicht. Der LPP Prozess dürfte weniger Layer haben als ein Performance-Prozess und insgesamt niedrigere Wafer-Preise bedingen.

IMHO sind 30cm Wafer derzeit aktuell, nicht 20cm.
 
Nicht wirklich, wenn man bedenkt, dass es nach wie vor nur ein DX11 Chip ohne grossartige Computing Fähigkeiten ist. ;)
Jetzt mal Butter bei die Fische: Genau wieviele normale Käufer der Zielgruppe "Ich brauche eine separate leistungsfähige Grafikkarte" nutzen single oder double precision Computing auf einer Grafikkarte? Dazu kommt noch wieviele Programme können das nutzen oder sind dahin optimiert?

Die Antwort liegt irgendwo bei 1-5%. Das war es. Also nice to have, aber für den normalen Nutzer völlig irrelevant. Als DCler wäre ich natürlich geneigt dem mehr Aufmerksamkeit zu widmen. Aber in der eigentlichen Nutzung spielt es einfach keine Rolle. Da zählt nur wie lang ist der Balken.
 
Zurück
Oben Unten