DirectX 12/Vulkan Benchmark und Diskussions Thread

Für gute Laune hat bei mir dieses Zitat gesorgt

und es kommt zu so seltsamen Konstellationen, das eine Radeon R9 380 4GB im gleichen Performancefeld liegt wie eine (nominell viel schnellere) GeForce GTX 970, und darüber hinaus noch schneller herauskommt als die früheren 999-Dollar-Beschleuniger GeForce GTX Titan und Titan Black. Damit dürfte dann letztlich auch klar sein, wieso AMD so gerne auf der Performance unter Hitman (2016) herumreitet –

Die Rohleistung einer R9 380 und einer GTX970 liegen beide bei ca. 3,4 TFLOP. Weshalb eine GTX970 die nominell schnellere Wahl ist, ist nicht nachzuvollziehen.
Die GTX 970 war unter DX11 lediglich überbewertet. Irgendwie scheint man es noch nicht so recht fassen zu können wie sehr sich unter DX12 die Gewichte verschoben haben.
 
Für gute Laune hat bei mir dieses Zitat gesorgt



Die Rohleistung einer R9 380 und einer GTX970 liegen beide bei ca. 3,4 TFLOP. Weshalb eine GTX970 die nominell schnellere Wahl ist, ist nicht nachzuvollziehen.
Die GTX 970 war unter DX11 lediglich überbewertet. Irgendwie scheint man es noch nicht so recht fassen zu können wie sehr sich unter DX12 die Gewichte verschoben haben.

Tja, eben frei nach dem Motto:
Es kann nicht sein was nicht sein darf.

Wenn alles nichts hilft, dann ist letztlich wieder der Treiber Schice. *suspect*

Ist doch immer wieder lustig wie sich die Bewertungen ändern, wenn sich der Scope verschiebt.
Mullins in Tablets war irgendwie bäh (obwohl dem gar nicht so war), aber im Mini PC (wo er der gesamten versammelten ATOM Riege genauso wie in dem Tablet Bereich den Arsch versohlt) ist er auf einmal dann doch Bemerkenswert flott unterwegs (klar, jetzt wo er keine Konkurrenz/Gefahr mehr darstellt).
 
DX12 wird sicher weiter verbessert, bei dem potential optimiert man gerne! ;D

Kannst du mir auf die Sprünge helfen, sind die 200.000 "draw calls" pro Sekunde oder Frame?

Frame, wenn ich mich nicht irre ;)
 
Das ist mir irgendwie zu hecktisch. Vielleicht bin ich auch einfach nur alt. Aber die Grafik ist schon nett.
 
Zumindest sind mir in meinem Steam Ordner ein paar eigenartige Dateien aufgefallen.
Anhang anzeigen 34352
 
Zumindest sind mir in meinem Steam Ordner ein paar eigenartige Dateien aufgefallen.
Anhang anzeigen 34352
Welche Eigenarten?

stem_folder5wu8g.png
 
Angeblich soll es jetzt laufen, Benchmarks stehen aber noch aus. Das einzige was ich finde ist dieser Artikel hier:

Während die AMD-GPU Kunden erfreulicherweise 10-20 % mehr FPS bemerken, ist es bei Nvidia-Karten oftmals genau umgekehrt: Ca 10-25% weniger FPS als mit OpenGL mit Nvidia Karten der 700-800er Reihe
 
CB: Dota 2 Benchmark - Vulkan ist schneller und langsamer als DirectX 11

Bei NVidia derzeit wirklich schlechter als mit OpenGL (bei NVidia 35% schneller als DX11 und 10% schneller als Vulkan), bei AMD ist OpenGL am schlechtesten und mit Vulkan gewinnt man 13-28% bei diesem ersten Mini-Test und einer Intel-CPU. Wobei das Ergebnis mit der X4 880K CPU auch noch merkwürdig zu sein scheint.
 
Der Titel wird schlicht und einfach auf Maxwell optimiert worden sein. Glück für nVidia, Pech für AMD.

Bei Direct3D11 liegen Radeon R9 Fury X und GeForce GTX 980 Ti noch gleichauf, aber unter Vulkan sichert sich der GM200 einen souveränen Vorsprung, obwohl ihre Rohleistung niedriger ist. Die Frametimes schwanken bei der Radeon R9 Fury X obendrein stärker. OpenGL kann man bei der Betrachtung außer Acht lassen; mit dieser API haben sich die Treiberentwickler bei AMD schon immer schwer getan. Insofern würde ich aus dem Test wenig ableiten - außer dass nVidia höchstwahrscheinlich den Programmierern bei Valve nicht ganz uneigennützig unter die Arme gegriffen hat. Bei anderen Spielen mit Vulkan API kann sich das Blatt zugunsten von AMD wenden. Das schwache Abschneiden von GCN3 bei Dota 2 hat keine Aussagekraft.
 
Da scheint mir bei der Vulkan Implementierung noch einiges an Luft nach oben vorhanden zu sein. Wenn OpenGL das beste Ergebnis liefert, ist das ein grund nachdenklich zu werden.
nVidia hat das Projekt begleitet und nun weiß man auch warum die meisten Entwickler lieber wenn es um neue Schnittstellen geht mir AMD zusammen arbeiten.
 
Hier ein Überblick über die DX12/Vulkan Extensions für GCN. Auch Intrinsics genannt:
http://gpuopen.com/gcn-shader-extensions-for-direct3d-and-vulkan/

All das basiert auf AGS (AMD GPU Service), das man mittlerweile wohl als AMDs Gegenstück zu Gameworks betiteln darf.
Beispiel zur Anwendung: http://gpuopen.com/gaming-product/barycentrics12-dx12-gcnshader-ext-sample/
Also, many algorithms that were only possible in the geometry shader can now be implemented in the pixel shader. For example:
  • Parallax curvature estimation
  • (Closest) distance to edge (for AA)
  • (Closest) distance to vertex
  • Spline-interpolated normals/curvature
The new intrinsic instructions are enabled through the AMD GPU Services (AGS) library.

Allerdings geht es in diesen Quellcode-offenen Tools um den Low-Level Zugriff wie er bei Konsolen möglich ist.

Hier ein Low-Level Optimizations Guide von Michael Drobot für GCN, der das ausführlicher erläutert:
https://michaldrobot.files.wordpress.com/2014/05/gcn_alu_opt_digitaldragons2014.pdf
 
Zuletzt bearbeitet:
Nicht wirklich vergleichbar mit GameMurks. AGS stellt Extensions zur Verfügung, wie bei OpenGL/Vulkan zum Beispiel. Klar wird damit unter Umständen etwas schneller mit AMD-Karten - aber es wird niemals irgendwas auf NVidia-Karten damit ausgeführt, was dort nicht (richtig) funktioniert, und es ersetzt auch keine kompletten Engine-Teile wie die Ambient Occlusion. Das Problem bei GameMurks ist ja, dass es ein Binary Blob ist, bei keinem jemand weiß was da genau hinten rausfällt, welchen NVidia oft in letzter Minute vor Release noch ändert, und welcher tief in den gesamten Renderpfad eingreift.

Wenn überhaupt könnte man die AGS-Extensions vielleicht mit PhsyX vergleichen, wobei der CPU-only-Pfad immer noch Teil der eigentlichen Engine ist.
 
Mein Vergleich war auch aus Entwickler-Sicht in Bezug auf die Handhabung des Frameworks oder der Toolsammlung gedacht. Den Unterschied für welchen Zweck AMD es nutzt habe ich ja selber in einem Satz beschrieben. Da passt auch PhsyX nicht als Vergleich.
Allerdings geht es in diesen Quellcode-offenen Tools um den Low-Level Zugriff wie er bei Konsolen möglich ist.

--- Update ---

Übrigens auch explicit Crossfire in DX11: http://gpuopen.com/gaming-product/amd-gpu-services-ags-library/
AGS now returns a lot more information from the GPU in addition to exposing the explicit Crossfire API and other extensions for DirectX 11. Version 4.0 also exposes GCN shader extensions for both DirectX 11 and DirectX 12. Highlights include the following:

  • The initialization function can now return information about the GPU:
    • Whether the GPU is GCN or not
    • The adapter string and device id
    • The driver version is now rolled into this structure instead of a separate function call
    • Performance metrics such as the number of compute units and clock speeds
  • New explicit Crossfire API
    • Provides the ability to control resource transfers between GPUs in Crossfire™ configuration in DirectX 11
    • Allows improved performance in multi-GPU configurations
  • New GCN shader extension support
    • DirectX 11 and DirectX 12
    • Requires Radeon Software Crimson Edition 16.5.2 or later
  • AGS provides access to additional extensions available in the AMD driver for DirectX 11:
    • Quad List primitive type
    • UAV overlap
    • Depth bounds test
    • Multi-draw indirect
 
Der direkte Link hat keine Seite 39. Ist vielleicht ein dort verlinktes Dokument gemeint?
 
Ich könnt schwören, dass ich hinter dem Link eine pdf war.

Hab noch eben im Cache nachgesehen: Klick
 
Am ehesten gleicht es mir dem "Dual Core x86 Module" bei Kaveri hier:
Kaveri_Trinity_2014-01-07.jpg



Das gekippt entspricht der groben Konfiguration. Daher vermute ich eine Fotomontage von 8 Modulen um in der Präsentation CPU-Threading zu veranschaulichen.
 
Das ist ein die-shot vom Piledriver, allerdings zwei Stück nebeneinander.

Ja das dachte ich auch erst, weil ja auf den Opterons 2 Chips nebeneinander auf dem MCM sein sollen. Allerdings kam mir bei dem Die-Shot in der PDF auch seltsam vor, dass oben (evtl. auch unten) der Rand überhaupt nicht doppelt scheint.
 
Zurück
Oben Unten