Der Cinebench 11.5 Resultate-Fred

FX-8320 @ 4.0Ghz

CB64_OS64
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 6.83 pts

AMD FX(tm)-8320 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.869.810.390.673
Ausgeführte Instruktionen = 1.564.758.001.545
Durchsatz = 0.837 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.445.821.455
Fehlzugriffe Instruction-Cache = 2.906.449.366
Ausführungs-Zeit = 63.414 ms



CB64_OS64
CINEBENCH R11.5 ResultRendering (Single CPU) : 1.04 pts

AMD FX(tm)-8320 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.587.674.841.099
Ausgeführte Instruktionen = 1.597.916.129.361
Durchsatz = 1.006 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 9.994.094.515
Fehlzugriffe Instruction-Cache = 3.121.470.960
Ausführungs-Zeit = 390.080 ms
 
8350@4Ghz NB@2,4Ghz HT@2,6Ghz TC=off

CB64_OS64
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 6.71 pts

AMD FX(tm)-8350 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.903.092.045.119
Ausgeführte Instruktionen = 1.593.403.655.652
Durchsatz = 0.837 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.537.785.869
Fehlzugriffe Instruction-Cache = 3.213.149.333
Ausführungs-Zeit = 64.054 ms

CB64_OS64
CINEBENCH R11.5 ResultRendering (Single CPU) : 1.04 pts

AMD FX(tm)-8350 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.690.071.102.100
Ausgeführte Instruktionen = 1.718.277.797.769
Durchsatz = 1.017 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 10.335.363.644
Fehlzugriffe Instruction-Cache = 3.968.680.906
Ausführungs-Zeit = 391.594 ms
 
Erstmal Danke!
Auf Wunsch eines einzelnen Herrn habe ich mir die BKDGs für Family 10h, 12h und 14h zu Gemüte geführt und das Programm erweitert (Link s.o.). Für AMD wird jetzt ab Family 10h unterstützt. Ich kann es aber nicht testen! Also wenn es jemand mal testet wäre ich über eine Rückmeldung sehr erfreut (ob es überhaupt funktioniert).
Beim Vishera wundern mich die höheren I_Cache_Misses im Single-Modus!
Danke
Helle
 
FX-6300@4.5 GHz, CPU-NB/HT-Link@2.4/2.6GHz, DDR3-2140 CL11 1T

CB64_OS64
CINEBENCH R11.5 ResultRendering (Single CPU) : 1.16 pts

AMD FX(tm)-6300 Six-Core Processor
Anzahl Threads = 6
CPU-Takte = 1.621.069.839.581
Ausgeführte Instruktionen = 1.620.464.995.648
Durchsatz = 1.000 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 10.191.578.944
Fehlzugriffe Instruction-Cache = 3.060.938.236
Ausführungs-Zeit = 348.038 MS

CB64_OS64
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 5.81 pts

AMD FX(tm)-6300 Six-Core Processor
Anzahl Threads = 6
CPU-Takte = 1.870.350.673.455
Ausgeführte Instruktionen = 1.574.646.939.778
Durchsatz = 0.842 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.510.065.984
Fehlzugriffe Instruction-Cache = 2.921.417.049
Ausführungs-Zeit = 75.598 MS

(alte Version von Helle53) Ist wohl doch schon die neue Version vom 28.4.2013 17:27.
 
Zuletzt bearbeitet:
die CPUs tun aber ganz schön falsch Springen oder wenigstens Vorhersagen

CB64_OS64
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 4.83 pts

AMD Phenom(tm) II X6 1055T Processor
Anzahl Threads = 6
CPU-Takte = 1.387.932.642.537
Ausgeführte Instruktionen = 1.580.465.175.319
Durchsatz = 1.139 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.257.294.309
Fehlzugriffe Instruction-Cache = 2.471.897.369
Ausführungs-Zeit = 103.959 ms
 
Ich habe eben mal die Gesamtsprünge (dazu zählen auch Returns) ermittelt: 190.400.000.000 (Multi-Core) bzw. 194.100.000.000 (Single-Core). Geht also eigentlich mit den Falsch-Vorhersagen. CB dürfte sehr Schleifen-lastig sein (vorausgesetzt, es wird kein Käse angezeigt ;D).
Leider ist die Anzahl der zur Verfügung stehenden Performance-Counter-Register arg begrenzt...
 
CB64_OS64
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 2.34 pts

AMD A6-3410MX APU with Radeon(tm) HD Graphics @ 2,0GHz
Anzahl Threads = 4
CPU-Takte = 1.366.280.710.996
Ausgeführte Instruktionen = 1.581.108.584.580
Durchsatz = 1.157 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.240.045.822
Fehlzugriffe Instruction-Cache = 2.568.308.507
Ausführungs-Zeit = 178.590 ms
 
Zuletzt bearbeitet:
Hab das auch mal laufen lassen:

AMD FX 8350 (Vishera) @ Core 4.8Ghz (1,416Vc), HT 2.67Ghz, NB 2.4Ghz, DDR3 2133 (24/7 x264_64 stable )

CB64_OS64
CINEBENCH R11.5 ResultRendering (Single CPU) : 1.27 pts

AMD FX(tm)-8350 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.590.646.987.273
Ausgeführte Instruktionen = 1.621.280.449.582
Durchsatz = 1.019 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 10.121.207.971
Fehlzugriffe Instruction-Cache = 3.720.307.519
Ausführungs-Zeit = 320.114 ms



CB64_OS64
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 8.23 pts

AMD FX(tm)-8350 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.868.597.803.765
Ausgeführte Instruktionen = 1.566.761.581.546
Durchsatz = 0.838 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.444.035.262
Fehlzugriffe Instruction-Cache = 3.008.150.834
Ausführungs-Zeit = 52.556 ms

Signifikant ist natürlich der deutlich höhere Durchsatz der "blauen" und wesentlich bessere Sprungvorhersage. Da müsste AMD mal ran.
 
Was verursacht eig. die Fehlzugriffe Instruction-Cache?
Wahrscheinlich mit die schlechtere Sprungvorhersage. Allgemein halt schlechtere Prefetcher. Aber die doppelte Größe hilft schon schön, AMD hat ja weniger Fehlzugriffe.
Signifikant ist natürlich der deutlich höhere Durchsatz der "blauen" und wesentlich bessere Sprungvorhersage. Da müsste AMD mal ran.
Die Sprungvorhersage ist sowas wie der heilige Gral der CPU-Entwicklung, da wird am meisten Know-How und Forschung reingesteckt. Deswegen ist Intel da AMD auch traditionell immer 1-2 Schritte voraus.
Ab Steamroller ist es neben der FPU und dem L1I-Cache dann der letzte verbliebene CMT-Vorteil. AMD verdoppelt da die Vorhersageresourcen, das ist schon ne ziemliche Größenordung. Für einen Thread allein würde sich das wohl nicht rentieren, aber für 2 kann man sichs schon leisten, insbesondere wenn man 2 INT-Cluster hat.

AMD verspricht da aber trotzdem "nur" -20%:
file.php

Rechnen wir das mal ein, dann wären wir single threaded:

Falsche Sprungvorhersagen = 10.121.207.971 - 20% = 8.096.966.376,8
Edit: Intel 3770k von Helle als Vergleich:
Falsche Sprungvorhersagen = 7.212.839.108

multi:
Falsche Sprungvorhersagen = 11.444.035.262 -20% = 9.155.228.209,6
Intel:

Die AMD Zahlen sind bei multithreaded, eventuell wirds singlethreaded noch mehr, sollte dann knapp für Intel-Niveau reichen - aber Intel wird mit Haswell sicherlich auch wieder ein paar Kohlen nachlegen und multi ist man immer noch nicht dran.
 
Da sind Sie dann zumindest auf dem "richtigen" Weg, anstatt immer gegen eine Clockwall wegen suboptimaler Fertigung anzurennen.

Wenn SR auf AM3+ läuft, dann guck ich direkt nach. 8)
 
Zuletzt bearbeitet:
Wahrscheinlich mit die schlechtere Sprungvorhersage. Allgemein halt schlechtere Prefetcher. Aber die doppelte Größe hilft schon schön, AMD hat ja weniger Fehlzugriffe.

Naja ich habe mich nur gefragt warum z.B. bei Sefegiru's 8320 nur
Fehlzugriffe Instruction-Cache = 3.121.470.960 sind
bei Atombossler und mir aber zwischen 3.720.307.519 und 3.968.680.906 aber bei der Anzahl Falscher Sprungvorhersagen alles ungefähr auf dem gleichen Niveu ist...
 
Hhmm, wir fahren beide hoehere NB und HT Takte, evtl bereits grenzwertig.
Safegiru hat das ja nicht dazu geschrieben. Waere interessant diese noch zu wissen.
Der 6300 von Wind Hund liegt ja in aehnlichen Bereichen auch mit erhoehtem
NB/HT. Koennte die Ursache sein.
--------------------------------------------
Send from SG-N7000
 
Na ich hab extra den NB/HT-Takt runtergesetzt auf standard und die etwas höhere Spannung gelassen also 4GHZ @1,37v und NB/HT 2,2Ghz (+0,05v offset) deshalb wundert mich das ja hatte auch mit mehr instabilität gerechnet durch OC aber auch ohne OC hab ich so hohe Fehlzugriffe...
 
Das sind alles nur L1-Zugriffe, NB-Takt sollte da ziemlich egal sein. Glaube eher, dass es ne Messungenauigkeit war.

Am wahrscheinlichsten wäre noch ein OS-Einfluss, denn wenn der Thread woanders weiterläuft ist der Cache natürlich erstmal nur voller Müll.

An Stelle No.2: Hintergrundprogramme, die Performance Counter unterscheiden nicht zw. den Programmen.

Ansonsten fällt mir nix ein, aber vielleicht hat Helle noch ne Erklärung parat.
 
Eigentlich wollte ich den Single-Core-Modus ganz rauslassen, weil da doch zuviel "Fremdzeug" mit reinspielen kann, allein schon durch die lange Testdauer und wie Opteron schon schrieb, durch die mehr oder weniger ständigen Core-Wechsel des Betriebssystems. Die Werte sind ja aufaddierte Werte aller vorhandenen Cores; auch im Single-Modus (notgedrungen).
Die Performance-Counter kann man programmieren für den User-Modus, OS-Modus oder beides zusammen. Das Programm verwendet den User-Modus (CPL > 0), aber die normalen User-Tasks werden mitgezählt. Für´s Testen sollte man ja eh alles Unnötige ausknipsen, aber dennoch wird einiges mitgezählt. Dies hält sich aber normalerweise im Rahmen des "Erlaubten". Ich könnte auch eine Option wie "Kalibrierung" einbauen, die nach dem Testdurchlauf nochmal die selbe Testzeit (ist dann ja bekannt) einen "Leerlauf" durchführt und seine Werte vom Testlauf subtrahiert.
Übrigens: Die Werte für die I_Cache_Misses der FX-81xx sind o.K. Habe mit PMCx082/083 getestet - keine Abweichungen.
Stutzig machte mich der hohe Anteil an Sprüngen (s.Post oben); aber Tests mit AMD ergaben identische Werte (über 190 Mrd.). Ich habe daraufhin den CB-Test-Teil durch ASM-Test-Code ersetzt (div. definierte Sprünge) und kann sagen, die Counter funktionieren, es wurde korrekt gezählt. CB ist also eine Sprung-Orgie !
 
Hmm hat nicht jede Berechnungs-Software viele Sprünge?
Müßte man mal mit den diversen Boincprojekten vergleichen. Liefe Deine Progrämmchen auch damit, oder braucht das zwingend Cinebench?
Boinc läuft ja wenn, im Hintergrund mit Volllast, da müsste man eigentlich nur nen festen Zeitraum mitloggen. Die Daten sind zwar immer unterschiedlich, aber soviel sollte das nicht ausmachen.
 
Ich hab das Programm auch mal über meine Prozzis gejagt:

AMD Phenom II 955 @3.1 GHz:
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 3.59 pts

AMD Phenom(tm) II X4 955 Processor
Anzahl Threads = 4
CPU-Takte = 1.374.498.066.392
Ausgeführte Instruktionen = 1.575.553.762.052
Durchsatz = 1.146 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.116.209.973
Fehlzugriffe Instruction-Cache = 2.365.038.425
Ausführungs-Zeit = 118.124 ms


CINEBENCH R11.5 ResultRendering (Single CPU) : 0.93 pts

AMD Phenom(tm) II X4 955 Processor
Anzahl Threads = 4
CPU-Takte = 1.442.264.955.784
Ausgeführte Instruktionen = 1.671.237.056.651
Durchsatz = 1.159 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.911.207.910
Fehlzugriffe Instruction-Cache = 2.787.421.951
Ausführungs-Zeit = 435.758 ms


AMD FX 8350 @ 4.0 GHz:
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 6.67 pts

AMD FX(tm)-8350 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.925.562.241.856
Ausgeführte Instruktionen = 1.595.439.760.000
Durchsatz = 0.829 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.602.942.255
Fehlzugriffe Instruction-Cache = 3.437.816.251
Ausführungs-Zeit = 65.084 ms


CINEBENCH R11.5 ResultRendering (Single CPU) : 1.05 pts

AMD FX(tm)-8350 Eight-Core Processor
Anzahl Threads = 8
CPU-Takte = 1.981.526.380.976
Ausgeführte Instruktionen = 1.880.785.391.237
Durchsatz = 0.949 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 11.534.913.654
Fehlzugriffe Instruction-Cache = 7.581.059.712
Ausführungs-Zeit = 385.041 ms


Intel Core i7-3720QM (Notebook)
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 6.77 pts

Intel(R) Core(TM) i7-3720QM CPU @ 2.60GHz
Anzahl Threads = 8
CPU-Takte = 1.595.363.925.717
Ausgeführte Instruktionen = 1.569.413.808.419
Durchsatz = 0.984 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 7.949.471.234
Fehlzugriffe Instruction-Cache = 4.176.605.355
Ausführungs-Zeit = 63.540 ms

CINEBENCH R11.5 ResultRendering (Single CPU) : 1.43 pts

Intel(R) Core(TM) i7-3720QM CPU @ 2.60GHz
Anzahl Threads = 8
CPU-Takte = 1.123.058.272.460
Ausgeführte Instruktionen = 1.675.267.943.565
Durchsatz = 1.492 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 7.657.909.593
Fehlzugriffe Instruction-Cache = 3.901.143.576
Ausführungs-Zeit = 284.031 ms


Die Leistung des i7-3720QM ist für ein Notebook wirklich brachial, auch wenn ich gestehen muss, dass er im singlecore mit etwa 3.4-3.5 GHz lief (Turbo).
Auch schön zu sehen ist, dass der FX nicht den Instruktionendurchsatz des Phenom erreicht und wesentlich meht Chache Fehlzugriffe hat. Bei des Sprungvorhersage scheint es etwa einen Gleichstand zu geben.
 
Eigentlich wollte ich den Single-Core-Modus ganz rauslassen, weil da doch zuviel "Fremdzeug" mit reinspielen kann, allein schon durch die lange Testdauer und wie Opteron schon schrieb, durch die mehr oder weniger ständigen Core-Wechsel des Betriebssystems. Die Werte sind ja aufaddierte Werte aller vorhandenen Cores; auch im Single-Modus (notgedrungen).
Die Performance-Counter kann man programmieren für den User-Modus, OS-Modus oder beides zusammen. Das Programm verwendet den User-Modus (CPL > 0), aber die normalen User-Tasks werden mitgezählt. Für´s Testen sollte man ja eh alles Unnötige ausknipsen, aber dennoch wird einiges mitgezählt. Dies hält sich aber normalerweise im Rahmen des "Erlaubten". Ich könnte auch eine Option wie "Kalibrierung" einbauen, die nach dem Testdurchlauf nochmal die selbe Testzeit (ist dann ja bekannt) einen "Leerlauf" durchführt und seine Werte vom Testlauf subtrahiert.
Übrigens: Die Werte für die I_Cache_Misses der FX-81xx sind o.K. Habe mit PMCx082/083 getestet - keine Abweichungen.
Stutzig machte mich der hohe Anteil an Sprüngen (s.Post oben); aber Tests mit AMD ergaben identische Werte (über 190 Mrd.). Ich habe daraufhin den CB-Test-Teil durch ASM-Test-Code ersetzt (div. definierte Sprünge) und kann sagen, die Counter funktionieren, es wurde korrekt gezählt. CB ist also eine Sprung-Orgie !

Das ist mir allerdings auch heftigst aufgefallen. Wildes Gehopse bei Single-Bench. :o
Da ist natürlich auch klar warum die "Blauen" da besser sind, weil Sie nicht so rumhopsen. ;D
Das liegt aber auch klar mit am OS.
BTW - Ich z.B. hab die Scheduler Patches nicht installiert, bringt mir nichts.

Also wenn es nur im L1 läuft muss die Abweichung von was anderem kommen.
Vergleiche gerade auch den 8350 von SemtexX, der ist noch mal ne Ecke schlechter.
Gerade auch beim Durchsatz ist das echt komisch, unsereiner mit 1.02 und seiner gerade mal mit 0.95,
doch recht viel für eine Abweichung (!?).
Interessant auch der Phenom, da lief es viel runder (laggte dafür aber an anderer Stelle).
Kann da das MoBo mit reinspielen (BIOS, AGESA, etc.)?

@ Helle53
Liesse sich sowas auch in Verbindung mit dem HD Bench (x264) realisieren?
Das würde mich wesentlich mehr interessieren.
Ergebnis dann natürlich im entsprechenden Thread ;)
 
Zuletzt bearbeitet:
Naja, für mich ist das Verhältnis Sprung-Instruktionen zu Gesamt-Instruktionen "ungesund". Und beim Dis-Assemblieren sieht es gar nicht danach aus, deshalb meine Überprüfung. Andererseits ist so ein Programm (Cinebench) natürlich nicht mit einem normalen Anwendungs-Programm zu vergleichen, da hat Opteron selbstredend recht.
Weshalb Cinebench: War glatter Zufall; habe nur ein Programm gesucht, das reproduzierbare (und vergleichbare) Resultate liefert und (in dem Fall wichtig) sich per Script steuern lässt. Mit etwas mehr Aufwand, aber dennoch relativ leicht machbar, lässt sich alles Mögliche "einmessen".
Wofür dieser Test? Mein Projekt Instruction-Counter (z.Z. nur für Intel, will es aber auch für AMD erstellen). Screenshot s. o. Link (ist dort Demo_IC).
Nochmal Danke fürs testen!
 
Auf meinem I7-3930K und I7-980x kommt leider nur die Meldung das es keine SB/IB CPU's sind.

i5-2500k 3,7 Ghz Turbo auf allen Kernen

CB64_OS64
CINEBENCH R11.5 ResultRendering (Multiple CPU) : 5.66 pts

Intel(R) Core(TM) i5-2500K CPU @ 3.30GHz
Anzahl Threads = 4
CPU-Takte = 1.047.041.247.538
Ausgeführte Instruktionen = 1.606.684.067.175
Durchsatz = 1.534 Instruktionen/CPU-Takt
Falsche Sprungvorhersagen = 7.224.917.569
Fehlzugriffe Instruction-Cache = 3.548.357.570
Ausführungs-Zeit = 76.363 ms
 
Zuletzt bearbeitet:
Das ist schon klar - die getesteten AMD CPU's sind ja auch einbaut worden.
 
Lol, logge gerade das Simapprojekt von Boinc mit ... 13% Branch Instruction Rate und nur 80% Sprungvorhersagetreffer ... das schaut noch schlimmer aus ^^
 
Zurück
Oben Unten