News Performanceprobleme mit Intels x58 Chipsatz ?

Hi,

wir haben jetzt die Resultate des x58 Boards unter Windows x86_64 mit einer NVidia GTX 275. Die Probleme sind verschwunden.

Die GTX erreicht unter Sissoft Sandra (OpenCL und Direct Compute)

CPU -> GPU : 5.57 GB/s
GPU -> CPU : 5.27 GB/s

Zum Vergleich, die 5870 erreichte unter Sandra (Stream, OpenCL, Direct Compute) und dem PCIeSpeedTest (Stream):

CPU-> GPU : ~ 4GB/s
GPU-> CPU : ~ 450 MB/s

Daher kann man sagen, das Problem wird durch einen Catalyst Teiber Bug im Zusammenhang mit dem x58 Chipsatz verursacht, denn es tritt nicht unter einem p45 oder amd Mainboard auf. Möglicherweise ein wieder auftauchendes Problem aus dem Jahre 2008: ATI Catalyst x58 Hotfix

Grüße
Jörn
 
Hi,

mittlerweile ist das Problem bei den AMD Treiberentwicklern und, durch den PC-Hersteller auch bei Intel angekommen. Man kann nur darauf hoffen, dass es einen Fix im nächsten Catalyst-Treiber etc. gibt.

joern
 
Da hier auch nen 790GX gebencht wurde mit solchen komischen Werten und Windows7 64bit hier mal paar richtige Ergebnisse wie es ausehen sollte.. Bitte beachtet das es ein Crossfire aus 2x5850 ist welche aktuell durch den 790GX mit 2x8 PCIe-Lanes angesprochen werden.

Treiber ist der Catalyst 10.2 + neuste ATI Stream

Devices found: 2

===> Testing device 0 <===
Device type: Unknown
Max resource 2D width/height: 16384/16384
Total GPU memory size: 1024 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 820 MHz
GPU memory clock: 1200 MHz
Number of timing loops: 100
[ 16 bytes] CPU->GPU= 101.324 KB/sec, GPU->CPU= 373.091 KB/sec
[ 32 bytes] CPU->GPU= 632.234 KB/sec, GPU->CPU= 864.618 KB/sec
[ 64 bytes] CPU->GPU= 704.037 KB/sec, GPU->CPU= 753.558 KB/sec
[ 128 bytes] CPU->GPU= 1.535 MB/sec, GPU->CPU= 1.568 MB/sec
[ 256 bytes] CPU->GPU= 2.972 MB/sec, GPU->CPU= 3.191 MB/sec
[ 512 bytes] CPU->GPU= 6.695 MB/sec, GPU->CPU= 5.899 MB/sec
[ 1024 bytes] CPU->GPU= 13.176 MB/sec, GPU->CPU= 13.267 MB/sec
[ 2048 bytes] CPU->GPU= 26.296 MB/sec, GPU->CPU= 26.304 MB/sec
[ 4096 bytes] CPU->GPU= 52.295 MB/sec, GPU->CPU= 52.864 MB/sec
[ 8192 bytes] CPU->GPU= 107.592 MB/sec, GPU->CPU= 107.978 MB/sec
[ 16384 bytes] CPU->GPU= 204.014 MB/sec, GPU->CPU= 212.708 MB/sec
[ 32768 bytes] CPU->GPU= 421.257 MB/sec, GPU->CPU= 256.440 MB/sec
[ 65536 bytes] CPU->GPU= 835.132 MB/sec, GPU->CPU= 856.068 MB/sec
[ 131072 bytes] CPU->GPU= 1.683 GB/sec, GPU->CPU= 1.539 GB/sec
[ 262144 bytes] CPU->GPU= 2.281 GB/sec, GPU->CPU= 2.574 GB/sec
[ 524288 bytes] CPU->GPU= 2.270 GB/sec, GPU->CPU= 2.678 GB/sec
[ 1048576 bytes] CPU->GPU= 2.450 GB/sec, GPU->CPU= 2.753 GB/sec
[ 2097152 bytes] CPU->GPU= 2.505 GB/sec, GPU->CPU= 2.805 GB/sec
[ 4194304 bytes] CPU->GPU= 2.571 GB/sec, GPU->CPU= 2.833 GB/sec
[ 8388608 bytes] CPU->GPU= 2.541 GB/sec, GPU->CPU= 2.840 GB/sec
[ 16777216 bytes] CPU->GPU= 2.553 GB/sec, GPU->CPU= 2.845 GB/sec
[ 33554432 bytes] CPU->GPU= 2.576 GB/sec, GPU->CPU= 2.846 GB/sec
[ 67108864 bytes] CPU->GPU= 2.578 GB/sec, GPU->CPU= 2.848 GB/sec
[ 134217728 bytes] CPU->GPU= 2.561 GB/sec, GPU->CPU= 2.839 GB/sec
[ 268435456 bytes] CPU->GPU= 2.621 GB/sec, GPU->CPU= 2.854 GB/sec
[ 536870912 bytes] CPU->GPU= 1.584 GB/sec, GPU->CPU= 1.711 GB/sec
[1073741824 bytes] CPU->GPU= 1.495 GB/sec, GPU->CPU= 1.667 GB/sec
Peak CPU->GPU Bandwidth = 2.621 GB/sec [data size = 268435456 bytes]
Peak GPU->CPU Bandwidth = 2.854 GB/sec [data size = 268435456 bytes]

===> Testing device 1 <===
Device type: Unknown
Max resource 2D width/height: 16384/16384
Total GPU memory size: 1024 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 820 MHz
GPU memory clock: 1200 MHz
Number of timing loops: 100
[ 16 bytes] CPU->GPU= 28.643 KB/sec, GPU->CPU= 336.936 KB/sec
[ 32 bytes] CPU->GPU= 202.257 KB/sec, GPU->CPU= 799.114 KB/sec
[ 64 bytes] CPU->GPU= 1.432 MB/sec, GPU->CPU= 1.463 MB/sec
[ 128 bytes] CPU->GPU= 2.719 MB/sec, GPU->CPU= 3.061 MB/sec
[ 256 bytes] CPU->GPU= 6.015 MB/sec, GPU->CPU= 5.844 MB/sec
[ 512 bytes] CPU->GPU= 11.647 MB/sec, GPU->CPU= 12.533 MB/sec
[ 1024 bytes] CPU->GPU= 23.687 MB/sec, GPU->CPU= 24.646 MB/sec
[ 2048 bytes] CPU->GPU= 42.332 MB/sec, GPU->CPU= 37.741 MB/sec
[ 4096 bytes] CPU->GPU= 87.924 MB/sec, GPU->CPU= 104.767 MB/sec
[ 8192 bytes] CPU->GPU= 180.147 MB/sec, GPU->CPU= 188.705 MB/sec
[ 16384 bytes] CPU->GPU= 387.678 MB/sec, GPU->CPU= 376.675 MB/sec
[ 32768 bytes] CPU->GPU= 726.805 MB/sec, GPU->CPU= 714.018 MB/sec
[ 65536 bytes] CPU->GPU= 1.330 GB/sec, GPU->CPU= 1.348 GB/sec
[ 131072 bytes] CPU->GPU= 1.153 GB/sec, GPU->CPU= 2.352 GB/sec
[ 262144 bytes] CPU->GPU= 2.359 GB/sec, GPU->CPU= 2.608 GB/sec
[ 524288 bytes] CPU->GPU= 1.525 GB/sec, GPU->CPU= 2.766 GB/sec
[ 1048576 bytes] CPU->GPU= 2.018 GB/sec, GPU->CPU= 2.854 GB/sec
[ 2097152 bytes] CPU->GPU= 2.555 GB/sec, GPU->CPU= 2.904 GB/sec
[ 4194304 bytes] CPU->GPU= 2.564 GB/sec, GPU->CPU= 2.937 GB/sec
[ 8388608 bytes] CPU->GPU= 2.590 GB/sec, GPU->CPU= 2.934 GB/sec
[ 16777216 bytes] CPU->GPU= 2.611 GB/sec, GPU->CPU= 2.947 GB/sec
[ 33554432 bytes] CPU->GPU= 2.615 GB/sec, GPU->CPU= 2.845 GB/sec
[ 67108864 bytes] CPU->GPU= 2.609 GB/sec, GPU->CPU= 2.849 GB/sec
[ 134217728 bytes] CPU->GPU= 2.615 GB/sec, GPU->CPU= 2.835 GB/sec
[ 268435456 bytes] CPU->GPU= 2.581 GB/sec, GPU->CPU= 2.854 GB/sec
[ 536870912 bytes] CPU->GPU= 1.620 GB/sec, GPU->CPU= 1.702 GB/sec
[1073741824 bytes] CPU->GPU= 1.543 GB/sec, GPU->CPU= 1.692 GB/sec
Peak CPU->GPU Bandwidth = 2.615 GB/sec [data size = 134217728 bytes]
Peak GPU->CPU Bandwidth = 2.947 GB/sec [data size = 16777216 bytes]
Man sieht das die 8 Lanes gut ausgenutzt werden. bei dem Test. mit 16 Lanes denk ich würden sich die Raten verdoppeln und an die angestrebten 5,5-6 Gb/s kommen.
 
Übrigens,

es hat sich noch nichts mit dem Catalyst 10.4 Treiber geändert, ich messe die gleichen Transferraten.

Grüße
 
Zurück
Oben Unten