Artikel AMD Mantle - Die neue API in einem ersten Test

@SPINA
Ich hab keinerlei Infos wie das funktioniert, ich hab nur eine Vermutung:
Wie kann man Kerne "abschalten" das geht am besten mit einem MOSFET, da hier kaum Schaltstrom benötigt wird.
Da der FX eh relativ groß von der Fläche her ausfällt, dachte ich mir warum nicht ein weiteren FET um die Kerne einzeln physikalisch abzuschalten.
Das kann man dann gern weiter führen und eine zweite Stufe der Spannungswandler in der CPU aufbauen.
Ich meine Intel hat das auch gemacht mit dem Haswell, also unmöglich wäre es nicht.

MfG
 
Ich meine Intel hat das auch gemacht mit dem Haswell, also unmöglich wäre es nicht.
Dem stimme ich zu, aber ob die Kosten/Nutzen-Bilanz positiv wäre? Da hätte ich meine Zweifel.

Insbesondere da die Bulldozer-Architektur ursprünglich für den Servereinsatz konzipiert wurde.
 
Trinity\Richland beherrschen Powergating nur für ganze module nicht Kerne. Für Kaveri vermute ich das selbe. Wie es bei Vishera aussieht weiß ich nicht.
 
Allen voran die shared FPU, die man nicht einfach splitten kann. Man möchte doch einen FX-Core nicht auf i486 SX Niveau herabkatapultieren.
Das ist keine "shared FPU" im klassischen sinne, AMD bezeichnet es als Flex FPU.
Wenn der FX-8 als 4 Kerner laufen soll dann auch Bitte mit 4x 256Bit (FMA4) und nicht auf 75% gedrosselt durch FMA3!
Oder wir bleiben einfach bei 8x 128Bit! ;)
Dem stimme ich zu, aber ob die Kosten/Nutzen-Bilanz positiv wäre? Da hätte ich meine Zweifel.

Insbesondere da die Bulldozer-Architektur ursprünglich für den Servereinsatz konzipiert wurde.
Das kommt ganz auf die Frequenz an, wie schnell die Kerne aus- und eingeschaltet werden können. ;D
 
Die Int-Cluster sind vom Flächenbedarf im Vergleich zum Rest des Moduls finde ich relativ klein. Ich denke nicht dass das etwas bringen würde die einzeln zu gaten, zumal dafür ja auch Fläche und zusätzliche Schalteinheiten nötig sind.
 
Das ist keine "shared FPU" im klassischen sinne, AMD bezeichnet es als Flex FPU.
Stimmt, aber um nun noch einmal den Modulbegriff von AMD aufzugreifen:

Bei den CPUs mit 6 Threads sind 3*1 und nicht 6*0,x Module aktiv.
Und bei CPUs mit 4 Threads sind es 2*1 und nicht 4*0,x Module.

Insofern wird man den sekundären Integerpfad nicht einfach "abklemmen" können.
 
Zuletzt bearbeitet:
Die Int-Cluster sind vom Flächenbedarf im Vergleich zum Rest des Moduls finde ich relativ klein. Ich denke nicht dass das etwas bringen würde die einzeln zu gaten, zumal dafür ja auch Fläche und zusätzliche Schalteinheiten nötig sind.
Daher die Frage warum ist ein FX-8 so groß? Wenn er CoreParking beherrscht, geht das nur wenn zusätzliche FETs verbaut sind!
Stimmt, aber um nun noch einmal den Modulbegriff von AMD aufzugreifen:

Bei den CPUs mit 6 Threads sind 3*1 und nicht 6*0,x Module aktiv.
Und bei CPUs mit 4 Threads sind es 2*1 und nicht 4*0,x Module.

Insofern wird man den sekundären Integerpfad nicht einfach "abklemmen" können.
Maximal die hälfte der Kerne, also müssen 4 Threads laufen, Vorzugsweiße auf Modul 1,2,3,4.
 
Das Power Gating gilt nur für ganze Module, wie ich AMD verstanden habe:

 
@SPINA
Naja, nur rein spekulativ: AVX 64Bit = 16 Einheiten pro Modul! *chatt*
Da wird wohl alles Powergegated was vorhanden ist!

Der Speicher hat im UEFI bei meinem System auch ein "Power Down Mode"...
 
Wenn der FX-8 als 4 Kerner laufen soll dann auch Bitte mit 4x 256Bit (FMA4) und nicht auf 75% gedrosselt durch FMA3!
Wat? FMA3 und FMA4 haben doch nichts mit dem theoretischen Durchsatz der FPU zu tun. Da geht es vielmehr um Operanden. Vereinfacht ausgedrückt:

FMA3: A = A * B + C
FMA4: D = A * B + C

Das heisst, mit FMA4 kann man Code flexibler gestalten und Register effizienter nutzen. Erfordert aber vermutlich auf Hardwareebene geringfügig mehr Aufwand.
 
Zitat Zitat von CosmiChaos Beitrag anzeigen

Das Tool gibs hier:

http://bitsum.com/about_cpu_core_parking.php

Für das Deaktivieren von Core Parking unter Windows 7 habe ich übrigens genau dieses Tool verwendet.

Bei meinem Alltagssystem habe ich das "damals" glaube ich über die Registry per Hand gemacht.
lol, erst jetzt gesehen, der Hoster ist der selbe wie "Process Lasso" *chatt*

boinc_wcg-mcm_lasso7duqs.jpg
 
Es gibt mehrere Stellen in Thief wo die fps niedriger liegen als im Benchmark. Ich stimme HT4U daher nicht zu ... der Benchmark ist CPU-lastiger, was Mantle entgegen kommt.
 
Es gibt mehrere Stellen in Thief wo die fps niedriger liegen als im Benchmark. Ich stimme HT4U daher nicht zu ... der Benchmark ist CPU-lastiger, was Mantle entgegen kommt.

Naja, auch wenn es Stellen gibt, wo der worst case aus dem Benchmark eintritt, dann empfinde ich die für den Benchmark gewählte Szene als "unglücklich". Der Benchmark impliziert nämlich, dass das gesamte Spiel unter DirectX bescheiden läuft - was es bis auf wenige Ausnahmen scheinbar nicht tut. Hinzu kommt, dass laut HT4U auch ein anderer Grafikumfang zum Einsatz kommen soll als im Spiel selbst.

HT4U schrieb:
Wir haben uns die Benchmark-Szene darum auch noch einmal genauer angeschaut und müssen attestieren, dass die dort gezeigte Umsetzung im Spiel so nie zu 100 Prozent anzutreffen ist. Den Benchmark zeichnen zu viel Helligkeit und selbst in fast identisch angetroffener Szene aus dem Spiel viel zu viele Menschen, zu viele Details bei Gebäuden (beispielsweise dem Turm) oder ein komplett anders verlaufender Regen (mehr Regen und dünnere Tropfen) aus.

Egal, ob gewollt oder nicht: Für meinen Geschmack kommt DirectX hier zu schlecht weg, das hätte man fairer lösen können.
 
Zuletzt bearbeitet:
Hier noch ein später Test: http://www.tweakpc.de/hardware/tests/cpu/amd-mantle/s01.php

Bemerkenswert, wie gut Star Swarm den AMD-CPUs liegt. Intel gewinnt aber trotzdem.

Wo "gewinnt" Intel denn? Reine Leistung? Nix neues. Würde mich auch sehr wundern, wenn nicht.

Preis Leistung? Keine Chance für Intel...besonders wenn man sich anschaut, wie gut sich der 7700K schlägt. Die CPU-Einheit gibts auch im 760K und die lässt sich nochmal genauso einfach Übertakten, wie Haswell. Wenn ich mir aber anguck für wie viel Geld es einen 760K schon gibt und wie viel man für einen 4670K ausgeben muss, ist das für mich ein Virtueller Schw***-Vergleich ala "Ich hab 5 Punkte mehr als du, ätschie-bätsch".

Aber muss ja jeder selbst wissen...

Mich als AMD-Fan-Käufer freuts, denn dann muss ich mir jetzt wirklich keine Sorgen machen, dass nächstes Jahr ein paar Spiele Anfangen zu ruckeln.
 
Der Kaveri schlägt sich in den Tests gar nicht so schlecht. Der 7850 könnte da sogar den i5 überholen..
 
wenn man sich anschaut, wie gut sich der 7700K schlägt. Die CPU-Einheit gibts auch im 760K
Nein, der 7700K hat Steamrollerkerne. Den 760k kann man beim 5700 sehen. Sehr eindrücklich die Mehrleistung zu den FX bei Starswarm:
star-swarm-rts_benchmark_mantle_big.jpg


Der Kaveri schlägt sich in den Tests gar nicht so schlecht. Der 7850 könnte da sogar den i5 überholen..
Ich würde sagen sehr gut. Ich schwanke nun zwischen dem 760K oder 7850K für mein neues Zweitsystem. Oder doch der 7700k? Ahhhhh...................
 
@Effe
Schade das bei dem Test von TweakPC keine genauen Angaben zu den Einstellungen gemacht wurde.
Ich kann das Bild von dir z.B. nicht wirklich einordnen, wie ist das mit "FPS*Batches" gemeint?
Was auch fehlt ist der "unit Count" also wie viel Einheiten mit eigener KI berechnet werden.

== Configuration ==========================================
API: Mantle
Scenario: ScenarioRTS.csv
User Input: Disabled
Resolution: 1920x1080
Fullscreen: True
GameCore Update: 16.6 ms
Bloom Quality: High
PointLight Quality: High
ToneCurve Quality: High
Glare Overdraw: 16
Shading Samples: 64
Shade Quality: Mid
Deferred Contexts: Disabled
Temporal AA Duration: 16
Temporal AA Time Slice: 2
Detailed Frame Info: Off
===========================================================


== Results ================================================
Test Duration: 360 Seconds
Total Frames: 8338

Average FPS: 23.16
Average Unit Count: 3829
Maximum Unit Count: 5572
Average Batches/MS: 1915.88
Maximum Batches/MS: 2575.84
Average Batch Count: 84693
Maximum Batch Count: 166789
 
schön, dass ihr auch mal ram mit getestet habt.

das fehlt leider immer noch zu oft.

mfg
 
Vielen Dank an alle, die an diesem Artikel mitgearbeitet haben. :)

Was meiner Meinung nach jedoch im Artikel fehlt (auf der Seite über die Zukunft von Mantle), ist der dezente Hinweis, wie sehr bzw. ob AMD überhaupt gewillt ist, Mantle auch auf Konsolen anzubieten. Ich weiß, dass sie es derzeit nicht vor haben (warum auch immer - technisch nicht möglich? Bezweifle ich persönlich, vom OS der Konsolen nicht? Oder den Treibern?), jedoch wenn sie die Konsolen nachrüsten würden, wäre es ein klarer Paukenschlag für Mantle, da so (reine) Konsolen-Spieleentwickler zukünftig eigentlich nur eine Schiene fahren müssten...
 
Was meiner Meinung nach jedoch im Artikel fehlt (auf der Seite über die Zukunft von Mantle), ist der dezente Hinweis, wie sehr bzw. ob AMD überhaupt gewillt ist, Mantle auch auf Konsolen anzubieten. Ich weiß, dass sie es derzeit nicht vor haben (warum auch immer - technisch nicht möglich? Bezweifle ich persönlich, vom OS der Konsolen nicht? Oder den Treibern?), jedoch wenn sie die Konsolen nachrüsten würden, wäre es ein klarer Paukenschlag für Mantle, da so (reine) Konsolen-Spieleentwickler zukünftig eigentlich nur eine Schiene fahren müssten...

AMD kann nichts auf den Konsolen anbieten. Das sind geschlossene Systeme, die von Microsoft und Sony kontrolliert werden. Zumindest DirectX 12 soll aber ja auch auf der XB1 genutzt werden - natürlich in einer für die Konsole angepassten Form. Zudem hat AMD ja gesagt, dass sie während der Entwicklung von Mantle stets in Kontakt mit MS standen. Ich denke also, dass DirectX 12 in vielerlei Hinsicht Gemeinsamkeiten mit Mantle hat. Dies dürfte auch ein Grund für die Entwickler sein, schon heute Mantle zu nutzen. Die späteren Anpassungen für DirectX 12 fallen dann nicht so groß aus und man konnte mit der neuen Art (auf der PC-Plattform) der GPU-Programmierung bereits Erfahrungen sammeln und kommerziell nutzen.

Für MS ist dies auch vorteilhaft, weil sich somit DX12 potentiell schneller auf breiter Front durchsetzen kann.
 
bzgl. MusicIsMyLifes CoreParking-Deaktivierungsprogramm:
Sind dessen Resultate unter Win7 besser als die der zwei MS-Patches ("Hotfixes")?
 
bzgl. MusicIsMyLifes CoreParking-Deaktivierungsprogramm:
Sind dessen Resultate unter Win7 besser als die der zwei MS-Patches ("Hotfixes")?
Das deaktivieren von "CoreParking" mit Win7 grenzt die Turbo Funktion ein, allerdings nicht wenn der HPC Mode aktiv ist.
Der Patch ist in sofern i.O. weil keine spürbare Leistung verschenkt wird, jedoch Messbar mit Benchmarks.

Laut Ressourcen Monitor von Win7 werden 4 Integer Kerne (1 core pro Modul) abgeschalten:

resourcenmonitor_corelzrsg.jpg
 
Zuletzt bearbeitet:
Zurück
Oben Unten