News Performanceprobleme mit Intels x58 Chipsatz ?

User-News

Von Opteron

Hinweis: Diese "User-News" wurde nicht von der Planet 3DNow! Redaktion veröffentlicht, sondern vom oben genannten Leser, der persönlich für den hier veröffentlichten Inhalt haftet.
AMD hat auf seinen Entwicklerseiten ein kleines PCIe Bandbreiten Testprogramm zum Herunterladen bereitgestellt:

http://developer.amd.com/GPU/ATISTREAMPOWERTOY/Pages/default.aspx
(Registrierung erforderlich)

Im Forum selbst gibts einen entsprechenden Thread mit einigen Ergebnissen:
http://forums.amd.com/forum/messageview.cfm?catid=328&threadid=110351

ASUS P6T Deluxe, Intel i7 920, Corsair XMS3 DDR3 1600, ATI Radeon HD 4850 (512 MB)
Peak CPU->GPU Bandwidth = 4.978 GB/sec [datasize = 134217728 bytes]
Peak GPU->CPU Bandwidth = 2.185 GB/sec [datasize = 65536 bytes]
MSI K9A2 Platinum (790FX chipset), Phenom 9850
Peak CPU->GPU Bandwidth = 5.532 GB/sec [data size = 536870912 bytes]
Peak GPU->CPU Bandwidth = 5.992 GB/sec [data size = 8388608 bytes]
Sollten diese stimmen, scheint der x58 Chipsatz ein Problem zu haben. Eventuell sieht man hier auch den Grund weswegen Intel den QPI Takt bei den aktuellen i7 CPUs auf 6,4 GT/s angehoben hat.

Wer eine Ati Karte hat, möge das bitte nachtesten und die Ergebnisse hier posten :)

Benötigt wird ein aktueller Catalyst Treiber (atical, anstatt amdcal). Die Milkyway Leute wissen Bescheid :)


ciao

Alex
 
Ich komme schon mit Onboard-HD3300 zu besseren GPU-->CPU Werten, um die 4,6 GB/sec. In dem Bereich bewegt sich auch der Wert zur GPU hin, allerdings ist der Wert nicht vergleichbar, da wie gesagt onboard...
 
Asus Maximus Formula
q6600 @ 3200 Mhz
8GB DDR2 - 800 Geil
HD 4870X2
2x Samsung 2693HM
Creative X-FI Fatality Pro
OCZ Vertex 120 GB
2x Raptor 150 GB Raid 0
2x Samsung 1TB Spinpoint F1
usw...


Sind meine Ergebnisse nun gut oder schlecht?
In dem AMD Developer Forum spricht man über die Payloadsize, kann man die verändern?

Gruß

Code:
Devices found: 2

===> Testing device 0 <===
Device type: RV770
Max resource 2D width/height: 8192/8192
Total GPU memory size: 1024 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 750 MHz
GPU memory clock: 900 MHz
Number of timing loops: 100
[        16 bytes] CPU->GPU= 363.527 KB/sec, GPU->CPU 673.394 KB/sec
[        32 bytes] CPU->GPU=   1.290 MB/sec, GPU->CPU   1.086 MB/sec
[        64 bytes] CPU->GPU=   2.650 MB/sec, GPU->CPU   2.440 MB/sec
[       128 bytes] CPU->GPU=   5.194 MB/sec, GPU->CPU   5.238 MB/sec
[       256 bytes] CPU->GPU=   9.695 MB/sec, GPU->CPU   9.858 MB/sec
[       512 bytes] CPU->GPU=  16.565 MB/sec, GPU->CPU  21.057 MB/sec
[      1024 bytes] CPU->GPU=  38.424 MB/sec, GPU->CPU  41.801 MB/sec
[      2048 bytes] CPU->GPU=  63.502 MB/sec, GPU->CPU  78.980 MB/sec
[      4096 bytes] CPU->GPU= 166.682 MB/sec, GPU->CPU 162.323 MB/sec
[      8192 bytes] CPU->GPU= 334.409 MB/sec, GPU->CPU 330.874 MB/sec
[     16384 bytes] CPU->GPU= 656.993 MB/sec, GPU->CPU 502.649 MB/sec
[     32768 bytes] CPU->GPU=   1.315 GB/sec, GPU->CPU   1.350 GB/sec
[     65536 bytes] CPU->GPU=   2.339 GB/sec, GPU->CPU   2.052 GB/sec
[    131072 bytes] CPU->GPU=   2.963 GB/sec, GPU->CPU   4.203 GB/sec
[    262144 bytes] CPU->GPU=   3.078 GB/sec, GPU->CPU   4.683 GB/sec
[    524288 bytes] CPU->GPU=   4.066 GB/sec, GPU->CPU   5.336 GB/sec
[   1048576 bytes] CPU->GPU=   4.428 GB/sec, GPU->CPU   5.647 GB/sec
[   2097152 bytes] CPU->GPU=   4.470 GB/sec, GPU->CPU   5.874 GB/sec
[   4194304 bytes] CPU->GPU=   4.793 GB/sec, GPU->CPU   6.139 GB/sec
[   8388608 bytes] CPU->GPU=   4.743 GB/sec, GPU->CPU   6.328 GB/sec
[  16777216 bytes] CPU->GPU=   4.847 GB/sec, GPU->CPU   5.890 GB/sec
[  33554432 bytes] CPU->GPU=   4.859 GB/sec, GPU->CPU   5.884 GB/sec
[  67108864 bytes] CPU->GPU=   4.862 GB/sec, GPU->CPU   5.890 GB/sec
[ 134217728 bytes] CPU->GPU=   4.836 GB/sec, GPU->CPU   5.873 GB/sec
[ 268435456 bytes] CPU->GPU=   4.809 GB/sec, GPU->CPU   5.862 GB/sec
[ 536870912 bytes] CPU->GPU=   2.983 GB/sec, GPU->CPU   3.027 GB/sec
[1073741824 bytes] CPU->GPU=   2.942 GB/sec, GPU->CPU   3.014 GB/sec
Peak CPU->GPU Bandwidth =   4.862 GB/sec [data size = 67108864 bytes]
Peak GPU->CPU Bandwidth =   6.328 GB/sec [data size = 8388608 bytes]

===> Testing device 1 <===
Device type: RV770
Max resource 2D width/height: 8192/8192
Total GPU memory size: 1024 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 750 MHz
GPU memory clock: 900 MHz
Number of timing loops: 100
[        16 bytes] CPU->GPU= 398.898 KB/sec, GPU->CPU 616.355 KB/sec
[        32 bytes] CPU->GPU=   1.217 MB/sec, GPU->CPU   1.245 MB/sec
[        64 bytes] CPU->GPU=   2.359 MB/sec, GPU->CPU   2.396 MB/sec
[       128 bytes] CPU->GPU=   4.973 MB/sec, GPU->CPU   5.029 MB/sec
[       256 bytes] CPU->GPU=   9.905 MB/sec, GPU->CPU  10.059 MB/sec
[       512 bytes] CPU->GPU=  18.905 MB/sec, GPU->CPU  18.800 MB/sec
[      1024 bytes] CPU->GPU=  39.129 MB/sec, GPU->CPU  39.986 MB/sec
[      2048 bytes] CPU->GPU=  79.741 MB/sec, GPU->CPU  73.318 MB/sec
[      4096 bytes] CPU->GPU= 148.711 MB/sec, GPU->CPU 159.376 MB/sec
[      8192 bytes] CPU->GPU= 316.615 MB/sec, GPU->CPU 320.883 MB/sec
[     16384 bytes] CPU->GPU= 581.217 MB/sec, GPU->CPU 614.254 MB/sec
[     32768 bytes] CPU->GPU=   1.234 GB/sec, GPU->CPU   1.203 GB/sec
[     65536 bytes] CPU->GPU=   2.440 GB/sec, GPU->CPU   2.347 GB/sec
[    131072 bytes] CPU->GPU=   2.780 GB/sec, GPU->CPU   4.441 GB/sec
[    262144 bytes] CPU->GPU=   3.472 GB/sec, GPU->CPU   5.219 GB/sec
[    524288 bytes] CPU->GPU=   4.408 GB/sec, GPU->CPU   5.876 GB/sec
[   1048576 bytes] CPU->GPU=   4.592 GB/sec, GPU->CPU   6.304 GB/sec
[   2097152 bytes] CPU->GPU=   4.785 GB/sec, GPU->CPU   6.534 GB/sec
[   4194304 bytes] CPU->GPU=   4.870 GB/sec, GPU->CPU   6.637 GB/sec
[   8388608 bytes] CPU->GPU=   4.898 GB/sec, GPU->CPU   6.692 GB/sec
[  16777216 bytes] CPU->GPU=   4.963 GB/sec, GPU->CPU   5.900 GB/sec
[  33554432 bytes] CPU->GPU=   4.919 GB/sec, GPU->CPU   5.881 GB/sec
[  67108864 bytes] CPU->GPU=   4.934 GB/sec, GPU->CPU   5.861 GB/sec
[ 134217728 bytes] CPU->GPU=   4.794 GB/sec, GPU->CPU   5.876 GB/sec
[ 268435456 bytes] CPU->GPU=   4.832 GB/sec, GPU->CPU   5.877 GB/sec
[ 536870912 bytes] CPU->GPU=   3.052 GB/sec, GPU->CPU   2.998 GB/sec
[1073741824 bytes] CPU->GPU=   2.925 GB/sec, GPU->CPU   2.973 GB/sec
Peak CPU->GPU Bandwidth =   4.963 GB/sec [data size = 16777216 bytes]
Peak GPU->CPU Bandwidth =   6.692 GB/sec [data size = 8388608 bytes]
 
Zuletzt bearbeitet:
Das ist etwas, das ich schon länger vermutet habe, schön, das es jetzt ein Tool gibt, das meine Vermutung bestätigt.

Ich erinnere an dieser Stelle mal an das CF/SLI Review von Tommies Hardware...
 
1 GB oder Vielfache davon herkommen sollen,
um die wohin auch immer über den PCIe Bus zu schaufeln .....
scheint AMD wieder einmal irgendeine Ebse zu suchen:
Vielleicht kreiert AMD den GB from CPU to GPU over PCIe Bus Transport per Watt per Dollar Index ?
Darauf bezogen ist dann sichen ein AMD K6 das non plus ultra.


Vielleicht konzentriert sich AMD mal darauf mir für meine HD2400 eine XP _x64 XCODE SW zu compilieren.
 
Wie wird den SLI auf den X58 Intel-Platinen ermöglicht, nach meinem letzten Stand per Freischaltung für den Chipsatz im NV-Treiber, ohne Hardwaremanipulationen am Intel-Chipsatz durch Einbau von Nvidia Bauteilen in Form eines NV-100(200)er Chipsatz, oder spez. Teile wie PCIe Brückenchips.

Erklärt das evt. auch, warum die Nehalem Plattform bei Spielen schlechter abschneidet, als die AMD oder Intel Core Duo Plattform ?
 
Vielleicht konzentriert sich AMD mal darauf mir für meine HD2400 eine XP _x64 XCODE SW zu compilieren.

Gibt es doch. Was kann denn AMD dafür, wenn du deren Webseiten zu flüchtig liest ?

Gruß Pegasus
 
Habe mit nem 790GX (HD3300) / SB750 Board und nem Phenom II, 720 BE unter Win XP x64:
CPU->GPU Peak 4GB/s
GPU->CPU Peak 3.8GB/s

dann werd ich Abend mal noch mit ner HD4870 schauen.. gleiches Board :)

"interessant" sind die PCIe Probleme dann, wenn i5 und i3 über PCIe angebunden werden und diese Anbindung schwächelt...
 
Zuletzt bearbeitet:
Das Tool wäre doch glatt was für unsere Mainboardtests......
 
Sind meine Ergebnisse nun gut oder schlecht?
In dem AMD Developer Forum spricht man über die Payloadsize, kann man die verändern?
Die sind sehr gut, liegen am Maximum. Ändern kann man nichts, dass sind Hardwareparameter.

Erklärt das evt. auch, warum die Nehalem Plattform bei Spielen schlechter abschneidet, als die AMD oder Intel Core Duo Plattform ?
Könnte ein Punkt sein - einer von vielen.
Aber zuerst sollte man i7 Werte abwarten, ob sich die wirklich bewahrheiten. Ausrutscher gibts immer mal, vielleicht war das nur irgendein Bug bei den bisher getesteten Maschinen. Insbesondere Ergebnisse mit 6,4 GT/s QPI sind interessant.

Das Tool wäre doch glatt was für unsere Mainboardtests......
Gute Idee ;-)
Gleichzeitig läuft das auch noch unter Stabilitätstest, das Teil ist ziemlich zickig ;-)

ciao

Alex
 
Aber zuerst sollte man i7 Werte abwarten, ob sich die wirklich bewahrheiten. Ausrutscher gibts immer mal, vielleicht war das nur irgendein Bug bei den bisher getesteten Maschinen. Insbesondere Ergebnisse mit 6,4 GT/s QPI sind interessant.
Ja, nee, is klar.
Bei Intel kanns nur ein versehen sein, die stehen ja schließlich für Qualität und Stabilität...

Deswegen kackt der i7 auch hier überhaupt nicht ab, bei 4 Karten...

Ist IMO sehr deutlich zu sehen, das es hier ein Problem bei der Verbindung von CPU zu GPU gibt, kannst auch in anderen Reviews sehen, das die I7 die lahmsten sind, wenn die GPU limitiert.
 
Das Tool stürzt bei mir leider nach ca. 15 Sekunden ab (Win 7 RC1 x64).

Das gleiche bei mir.

System:
AMD Phenom II 940BE
GA-MA69G-S3H
4x 1024MB RAM (MDT PC2-800)

Sapphire Radeon HD 3870X2

Windows XP x64
 
Hier mal ein Ergebnis mit einer 8800GT - gemessen mit BandwidthTest.exe aus dem CUDA 2.1 SDK (x64 Version).

Mein Sys: Gigabyte GA-EX58-UD4P, Corei7 920, 3x 2GB DDR3-1066, nVidia 800GT, Vista X64


Running on......
device 0:GeForce 8800 GT
Quick Mode
Host to Device Bandwidth for Pageable memory
.
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 4585.2

Quick Mode
Device to Host Bandwidth for Pageable memory
.
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 4094.4
 
Habe mit nem 790GX (HD3300) / SB750 Board und nem Phenom II, 720 BE unter Win XP x64:
CPU->GPU Peak 4GB/s
GPU->CPU Peak 3.8GB/s

dann werd ich Abend mal noch mit ner HD4870 schauen.. gleiches Board :)

"interessant" sind die PCIe Probleme dann, wenn i5 und i3 über PCIe angebunden werden und diese Anbindung schwächelt...


So.. nun teste ich grad mit fast gleicher Konfig wie oben:
790GX (HD3300) / SB750 Board (Asrock), Ph II 720 BE, Radeon 4870 512MB, und Windows 7 RC1 x64.
Der Test dauert auf diesem System eeeewig lange (Minuten)! Auf dem obengenannten mit Onboard und XP x64 dauert er nur ein paar Sekunden.

Das Resultat:
Code:
Microsoft Windows [Version 6.1.7100]
Copyright (c) 2009 Microsoft Corporation.  All rights reserved.

PCIeSpeedTest
Devices found: 1

===> Testing device 0 <===
Device type: RV770
Max resource 2D width/height: 8192/8192
Total GPU memory size: 512 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 750 MHz
GPU memory clock: 900 MHz
Number of timing loops: 100
[        16 bytes] CPU->GPU= 196.720 KB/sec, GPU->CPU 449.141 KB/sec
[        32 bytes] CPU->GPU= 655.695 KB/sec, GPU->CPU 869.162 KB/sec
[        64 bytes] CPU->GPU=   1.319 MB/sec, GPU->CPU   2.201 MB/sec
[       128 bytes] CPU->GPU=   4.729 MB/sec, GPU->CPU   5.106 MB/sec
[       256 bytes] CPU->GPU=  10.015 MB/sec, GPU->CPU  11.511 MB/sec
[       512 bytes] CPU->GPU=  19.331 MB/sec, GPU->CPU  19.712 MB/sec
[      1024 bytes] CPU->GPU=  43.294 MB/sec, GPU->CPU  46.778 MB/sec
[      2048 bytes] CPU->GPU=  89.267 MB/sec, GPU->CPU  82.417 MB/sec
[      4096 bytes] CPU->GPU= 167.036 MB/sec, GPU->CPU 170.039 MB/sec
[      8192 bytes] CPU->GPU= 325.946 MB/sec, GPU->CPU 133.951 MB/sec
[     16384 bytes] CPU->GPU= 578.892 MB/sec, GPU->CPU 450.127 MB/sec
[     32768 bytes] CPU->GPU= 832.278 MB/sec, GPU->CPU 538.720 MB/sec
[     65536 bytes] CPU->GPU=   2.257 GB/sec, GPU->CPU 622.210 MB/sec
[    131072 bytes] CPU->GPU=   3.141 GB/sec, GPU->CPU 684.888 MB/sec
[    262144 bytes] CPU->GPU=   4.411 GB/sec, GPU->CPU 715.902 MB/sec
[    524288 bytes] CPU->GPU=   4.643 GB/sec, GPU->CPU 705.668 MB/sec
[   1048576 bytes] CPU->GPU=   4.653 GB/sec, GPU->CPU 713.423 MB/sec
[   2097152 bytes] CPU->GPU=   4.699 GB/sec, GPU->CPU 724.226 MB/sec
[   4194304 bytes] CPU->GPU=   4.737 GB/sec, GPU->CPU 726.047 MB/sec
[   8388608 bytes] CPU->GPU=   4.762 GB/sec, GPU->CPU 729.589 MB/sec
[  16777216 bytes] CPU->GPU=   4.073 GB/sec, GPU->CPU 731.754 MB/sec
[  33554432 bytes] CPU->GPU=   4.100 GB/sec, GPU->CPU 726.036 MB/sec
[  67108864 bytes] CPU->GPU=   4.054 GB/sec, GPU->CPU 727.415 MB/sec
[ 134217728 bytes] CPU->GPU=   4.026 GB/sec, GPU->CPU 726.898 MB/sec
[ 268435456 bytes] CPU->GPU=   1.196 GB/sec, GPU->CPU 591.879 MB/sec
[ 536870912 bytes] CPU->GPU=   1.155 GB/sec, GPU->CPU 572.936 MB/sec
[ 536870912 bytes] CPU->GPU= 524.078 MB/sec, GPU->CPU 260.577 MB/sec
Peak CPU->GPU Bandwidth =   [b]4.762 GB/sec[/b] [data size = 8388608 bytes]
Peak GPU->CPU Bandwidth = [b]731.754 MB/sec[/b] [data size = 16777216 bytes]

Also wesentlich schlechter... zudem ruckelt das System während des Testens...

EDIT: selbiges System unter Xp x64:
CPU->GPU Max auf 5.4GB/sec , GPU-> CPU aber unverändert.
 
Zuletzt bearbeitet:
Hmm, da ist da irgendwas aber Oberfaul, würde ich sagen ............also mal das System quasi zerlegen und den Fehler suchen, evt. findest du ihn und kannst sagen, woran es gelegen hat.
 
Ist der GPU Takt bzw GPUMEM Takt dabei wichtig?
Hab seit ein paar Tagen neue HW, oben hatte ich mit einem x38 Q6600@ 3,2 Ghz und einer ATI 4870 X2 getestet

Nun hab ich ein Ramapage II Extreme 12 GB OCZ DDR 3 1600 CL8
und einen Intel Core i7 975 extreme Edition @ 4,00 Ghz.

Ich habe mein Ati Bios so modifiziert das es im idle auf 300/300 taktet, ich frage mich gerade ob das Einfluss auf das Ergebnis hat und ob die Karte beim Benchmark hochtaktet.
.
EDIT :
.

So das mit dem 2d/3d Takt hat sich erledigt.
Ich hab ein interessantes Ergebnis....
GPU 1 weicht stark von GPU2 ab, wieso?!


Code:
Devices found: 2

===> Testing device 0 <===
Device type: RV770
Max resource 2D width/height: 8192/8192
Total GPU memory size: 1024 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 750 MHz
GPU memory clock: 900 MHz
Number of timing loops: 100
[        16 bytes] CPU->GPU= 460.343 KB/sec, GPU->CPU 691.151 KB/sec
[        32 bytes] CPU->GPU=   2.318 MB/sec, GPU->CPU   2.467 MB/sec
[        64 bytes] CPU->GPU=   4.542 MB/sec, GPU->CPU   4.897 MB/sec
[       128 bytes] CPU->GPU=   8.663 MB/sec, GPU->CPU   9.766 MB/sec
[       256 bytes] CPU->GPU=  15.006 MB/sec, GPU->CPU  19.845 MB/sec
[       512 bytes] CPU->GPU=  35.424 MB/sec, GPU->CPU  22.826 MB/sec
[      1024 bytes] CPU->GPU=  73.140 MB/sec, GPU->CPU  79.162 MB/sec
[      2048 bytes] CPU->GPU= 144.877 MB/sec, GPU->CPU 157.637 MB/sec
[      4096 bytes] CPU->GPU= 283.842 MB/sec, GPU->CPU 310.382 MB/sec
[      8192 bytes] CPU->GPU= 538.274 MB/sec, GPU->CPU 585.980 MB/sec
[     16384 bytes] CPU->GPU= 577.624 MB/sec, GPU->CPU 912.082 MB/sec
[     32768 bytes] CPU->GPU=   1.624 GB/sec, GPU->CPU   1.480 GB/sec
[     65536 bytes] CPU->GPU=   2.280 GB/sec, GPU->CPU   1.699 GB/sec
[    131072 bytes] CPU->GPU=   2.361 GB/sec, GPU->CPU   1.462 GB/sec
[    262144 bytes] CPU->GPU=   3.463 GB/sec, GPU->CPU   1.360 GB/sec
[    524288 bytes] CPU->GPU=   4.041 GB/sec, GPU->CPU   1.323 GB/sec
[   1048576 bytes] CPU->GPU=   4.328 GB/sec, GPU->CPU   1.346 GB/sec
[   2097152 bytes] CPU->GPU=   4.638 GB/sec, GPU->CPU   1.383 GB/sec
[   4194304 bytes] CPU->GPU=   4.715 GB/sec, GPU->CPU   1.391 GB/sec
[   8388608 bytes] CPU->GPU=   4.740 GB/sec, GPU->CPU   1.389 GB/sec
[  16777216 bytes] CPU->GPU=   4.762 GB/sec, GPU->CPU   1.393 GB/sec
[  33554432 bytes] CPU->GPU=   4.736 GB/sec, GPU->CPU   1.386 GB/sec
[  67108864 bytes] CPU->GPU=   4.699 GB/sec, GPU->CPU   1.395 GB/sec
[ 134217728 bytes] CPU->GPU=   4.686 GB/sec, GPU->CPU   1.409 GB/sec
[ 268435456 bytes] CPU->GPU=   4.674 GB/sec, GPU->CPU   1.417 GB/sec
[ 536870912 bytes] CPU->GPU=   1.849 GB/sec, GPU->CPU   1.692 GB/sec
[1073741824 bytes] CPU->GPU=   1.803 GB/sec, GPU->CPU   1.708 GB/sec
Peak CPU->GPU Bandwidth =   4.762 GB/sec [data size = 16777216 bytes]
Peak GPU->CPU Bandwidth =   1.708 GB/sec [data size = 1073741824 bytes]

===> Testing device 1 <===
Device type: RV770
Max resource 2D width/height: 8192/8192
Total GPU memory size: 1024 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 750 MHz
GPU memory clock: 900 MHz
Number of timing loops: 100
[        16 bytes] CPU->GPU= 242.477 KB/sec, GPU->CPU 685.240 KB/sec
[        32 bytes] CPU->GPU=   1.192 MB/sec, GPU->CPU   1.433 MB/sec
[        64 bytes] CPU->GPU=   1.800 MB/sec, GPU->CPU   2.864 MB/sec
[       128 bytes] CPU->GPU=   5.349 MB/sec, GPU->CPU   5.722 MB/sec
[       256 bytes] CPU->GPU=   8.720 MB/sec, GPU->CPU  11.388 MB/sec
[       512 bytes] CPU->GPU=  18.804 MB/sec, GPU->CPU  22.764 MB/sec
[      1024 bytes] CPU->GPU=  41.793 MB/sec, GPU->CPU  45.163 MB/sec
[      2048 bytes] CPU->GPU=  83.806 MB/sec, GPU->CPU  90.132 MB/sec
[      4096 bytes] CPU->GPU= 137.624 MB/sec, GPU->CPU 179.374 MB/sec
[      8192 bytes] CPU->GPU= 317.464 MB/sec, GPU->CPU 356.272 MB/sec
[     16384 bytes] CPU->GPU= 513.485 MB/sec, GPU->CPU 645.690 MB/sec
[     32768 bytes] CPU->GPU=   1.028 GB/sec, GPU->CPU   1.142 GB/sec
[     65536 bytes] CPU->GPU=   1.482 GB/sec, GPU->CPU   1.830 GB/sec
[    131072 bytes] CPU->GPU=   2.298 GB/sec, GPU->CPU   2.573 GB/sec
[    262144 bytes] CPU->GPU=   3.141 GB/sec, GPU->CPU   3.273 GB/sec
[    524288 bytes] CPU->GPU=   3.652 GB/sec, GPU->CPU   3.900 GB/sec
[   1048576 bytes] CPU->GPU=   4.023 GB/sec, GPU->CPU   4.269 GB/sec
[   2097152 bytes] CPU->GPU=   4.236 GB/sec, GPU->CPU   4.561 GB/sec
[   4194304 bytes] CPU->GPU=   4.368 GB/sec, GPU->CPU   4.651 GB/sec
[   8388608 bytes] CPU->GPU=   4.431 GB/sec, GPU->CPU   4.605 GB/sec
[  16777216 bytes] CPU->GPU=   4.518 GB/sec, GPU->CPU   1.264 GB/sec
[  33554432 bytes] CPU->GPU=   4.608 GB/sec, GPU->CPU   1.201 GB/sec
[  67108864 bytes] CPU->GPU=   4.638 GB/sec, GPU->CPU   1.203 GB/sec
[ 134217728 bytes] CPU->GPU=   4.665 GB/sec, GPU->CPU   1.201 GB/sec
[ 268435456 bytes] CPU->GPU=   4.521 GB/sec, GPU->CPU   1.196 GB/sec
[ 536870912 bytes] CPU->GPU=   2.477 GB/sec, GPU->CPU   1.691 GB/sec
[1073741824 bytes] CPU->GPU=   2.412 GB/sec, GPU->CPU   1.685 GB/sec
Peak CPU->GPU Bandwidth =   4.665 GB/sec [data size = 134217728 bytes]
Peak GPU->CPU Bandwidth =   4.651 GB/sec [data size = 4194304 bytes]
 
Dann will ich auch einmal. AMD Phenom X4 9550, nVidia nForce 750a SLI, ATi Radeon HD 4830:
Device type: RV770
Max resource 2D width/height: 8192/8192
Total GPU memory size: 512 MB
Total CPU cached space size: 2047 MB
Total CPU uncached space size: 2047 MB
GPU engine clock: 575 MHz
GPU memory clock: 250 MHz
Number of timing loops: 100
[ 16 bytes] CPU->GPU= 90.681 KB/sec, GPU->CPU 173.055 KB/sec
[ 32 bytes] CPU->GPU= 392.509 KB/sec, GPU->CPU 546.665 KB/sec
[ 64 bytes] CPU->GPU= 776.658 KB/sec, GPU->CPU 1.657 MB/sec
[ 128 bytes] CPU->GPU= 2.580 MB/sec, GPU->CPU 3.555 MB/sec
[ 256 bytes] CPU->GPU= 5.799 MB/sec, GPU->CPU 6.951 MB/sec
[ 512 bytes] CPU->GPU= 12.052 MB/sec, GPU->CPU 13.831 MB/sec
[ 1024 bytes] CPU->GPU= 24.303 MB/sec, GPU->CPU 26.283 MB/sec
[ 2048 bytes] CPU->GPU= 43.098 MB/sec, GPU->CPU 51.578 MB/sec
[ 4096 bytes] CPU->GPU= 90.104 MB/sec, GPU->CPU 98.571 MB/sec
[ 8192 bytes] CPU->GPU= 204.534 MB/sec, GPU->CPU 190.121 MB/sec
[ 16384 bytes] CPU->GPU= 396.212 MB/sec, GPU->CPU 335.964 MB/sec
[ 32768 bytes] CPU->GPU= 882.046 MB/sec, GPU->CPU 699.185 MB/sec
[ 65536 bytes] CPU->GPU= 1.497 GB/sec, GPU->CPU 876.848 MB/sec
[ 131072 bytes] CPU->GPU= 2.672 GB/sec, GPU->CPU 969.797 MB/sec
[ 262144 bytes] CPU->GPU= 4.241 GB/sec, GPU->CPU 1.005 GB/sec
[ 524288 bytes] CPU->GPU= 4.832 GB/sec, GPU->CPU 1.057 GB/sec
[ 1048576 bytes] CPU->GPU= 4.966 GB/sec, GPU->CPU 1.042 GB/sec
[ 2097152 bytes] CPU->GPU= 5.115 GB/sec, GPU->CPU 1.086 GB/sec
[ 4194304 bytes] CPU->GPU= 5.204 GB/sec, GPU->CPU 1.065 GB/sec
[ 8388608 bytes] CPU->GPU= 5.255 GB/sec, GPU->CPU 1.053 GB/sec
[ 16777216 bytes] CPU->GPU= 3.843 GB/sec, GPU->CPU 1.048 GB/sec
[ 33554432 bytes] CPU->GPU= 3.737 GB/sec, GPU->CPU 1.058 GB/sec
[ 67108864 bytes] CPU->GPU= 3.708 GB/sec, GPU->CPU 1.060 GB/sec
[ 134217728 bytes] CPU->GPU= 3.574 GB/sec, GPU->CPU 1.062 GB/sec
[ 268435456 bytes] CPU->GPU= 1.157 GB/sec, GPU->CPU 784.110 MB/sec
[ 536870912 bytes] CPU->GPU= 1.128 GB/sec, GPU->CPU 792.850 MB/sec
[ 536870912 bytes] CPU->GPU= 578.100 MB/sec, GPU->CPU 395.484 MB/sec
Peak CPU->GPU Bandwidth = 5.255 GB/sec [data size = 8388608 bytes]
Peak GPU->CPU Bandwidth = 1.086 GB/sec [data size = 2097152 bytes]
Ich musste es allerdings unter Windows Vista x64 laufen lassen. Unter Windows XP x86 kamen immer VPU Recovery Meldungen.
 
Schade das die Intel Herren dieses Thema totgeschwiegen haben.
 
Zuletzt bearbeitet:
Schade das die Intel Herren dieses Thema totgeschwiegen haben.
Gab doch ne Frage dazu und die wollten sich erkundigen?! Wenn natürlich zu Ungunsten Intels ausfallen sollte, dann würde kein Marketing-Chef der Welt ein offizielles Statement erlauben solane es nicht bitter notwendig ist. Es geht halt immer auch um Marktanteile und Börsenkurse.
 
Schade das die Intel Herren dieses Thema totgeschwiegen haben.
Hey, ist doch normal, das sowas bei Intel totgeschwiegen wird und letztendlich durch die Intel Fans klein-/weggeredet wird.

Siehe den On-Off-On Bug der ganzen LGA775 Chipsätze seit dem P965...
Ist das eigentlich mittlererweile behoben oder starten die aktuellen Intel Boards auch noch mehrmals??
 
Wenn du dir mal die ganzen Benchmarks angeschaut hättest. wäre dir aufgefallen das auch AMD Systeme davon betroffen, oder das Tools ist *Murks*

Wenn es beim Core 5i der kein "HT" hat und der PCIe Express Controller in der CPU sitzt nicht diese Probleme hat, kann ja weiter spekuliert werden.
 
Das selbe in Grün unter Linux (Kernel 2.6.31-12, Catalyst 10.3) mit einem Asus P6T SE und Core i7 950, 12 GB DDR3:

Devices found: 1

===> Testing device 0 <===
Device type: Unknown
Max resource 2D width/height: 16384/16384
Total GPU memory size: 1024 MB
Total CPU cached space size: 508 MB
Total CPU uncached space size: 1279 MB
GPU engine clock: 900 MHz
GPU memory clock: 1300 MHz
Number of timing loops: 100
[ 16 bytes] CPU->GPU= 800.000 KB/sec, GPU->CPU= 1.600 MB/sec
[ 32 bytes] CPU->GPU= 457.143 KB/sec, GPU->CPU= 3.200 MB/sec
[ 64 bytes] CPU->GPU= 1.600 MB/sec, GPU->CPU= 2.133 MB/sec
[ 128 bytes] CPU->GPU= 3.200 MB/sec, GPU->CPU= 4.267 MB/sec
[ 256 bytes] CPU->GPU= 8.533 MB/sec, GPU->CPU= 8.533 MB/sec
[ 512 bytes] CPU->GPU= 12.800 MB/sec, GPU->CPU= 7.314 MB/sec
[ 1024 bytes] CPU->GPU= 34.133 MB/sec, GPU->CPU= 34.133 MB/sec
[ 2048 bytes] CPU->GPU= 68.267 MB/sec, GPU->CPU= 68.267 MB/sec
[ 4096 bytes] CPU->GPU= 136.533 MB/sec, GPU->CPU= 204.800 MB/sec
[ 8192 bytes] CPU->GPU= 273.067 MB/sec, GPU->CPU= 273.067 MB/sec
[ 16384 bytes] CPU->GPU= 546.133 MB/sec, GPU->CPU= 546.133 MB/sec
[ 32768 bytes] CPU->GPU= 1.092 GB/sec, GPU->CPU= 655.360 MB/sec
[ 65536 bytes] CPU->GPU= 2.185 GB/sec, GPU->CPU= 595.782 MB/sec
[ 131072 bytes] CPU->GPU= 3.277 GB/sec, GPU->CPU= 504.123 MB/sec
[ 262144 bytes] CPU->GPU= 3.745 GB/sec, GPU->CPU= 468.114 MB/sec
[ 524288 bytes] CPU->GPU= 4.033 GB/sec, GPU->CPU= 468.114 MB/sec
[ 1048576 bytes] CPU->GPU= 4.194 GB/sec, GPU->CPU= 457.893 MB/sec
[ 2097152 bytes] CPU->GPU= 4.194 GB/sec, GPU->CPU= 449.069 MB/sec
[ 4194304 bytes] CPU->GPU= 4.280 GB/sec, GPU->CPU= 443.373 MB/sec
[ 8388608 bytes] CPU->GPU= 4.215 GB/sec, GPU->CPU= 441.273 MB/sec
[ 16777216 bytes] CPU->GPU= 4.226 GB/sec, GPU->CPU= 442.437 MB/sec
[ 33554432 bytes] CPU->GPU= 4.067 GB/sec, GPU->CPU= 450.395 MB/sec
[ 67108864 bytes] CPU->GPU= 4.067 GB/sec, GPU->CPU= 461.420 MB/sec
[ 134217728 bytes] CPU->GPU= 4.091 GB/sec, GPU->CPU= 480.207 MB/sec
[ 268435456 bytes] CPU->GPU= 4.123 GB/sec, GPU->CPU= 492.841 MB/sec
calResAllocLocal2D() returned an error when trying to allocate 536870912 bytes!
Peak CPU->GPU Bandwidth = 4.280 GB/sec [data size = 4194304 bytes]
Peak GPU->CPU Bandwidth = 655.360 MB/sec [data size = 32768 bytes]

siehe auch hier:
 
Zuletzt bearbeitet:
hmm...täuscht das, oder ist die einzige Konstante bei dem Drama die ATI-GPU? - mit geforce scheint das problem nicht aufzutreten, wohl aber mit ATI-GPUs auch auf Phenom-Systemen.
Scheint also eher entweder im ATIschen Treiber der Wurm drin zu sein oder die rv770er sind da irgendwi "problematisch"... aber wohl weniger die Nehalems selber... (schade eigentlich :P )
 
Ich kann jetzt übrigens die Transferraten auch unter Windows 7 x86_64 bestätigen. Habe dort mit Sissoft Sandra (OpenCL/ATI Stream) als auch mit PCIe Speed Test v0.2 gemessen. Es kommt das gleiche Ergebnis raus:

CPU -> GPU : ca. 4.3 GB/s
GPU ->CPU : ca. 450 MB/s mit ATI-Stream
GPU->CPU : ca. 1 GB/s mit OpenCL

In allen anderen Bechmarks: CPU-Speicherbandbreite, GPU und CPU-Performance ist das System spitze. Nur eben nicht in den für uns wichtigem Device-to-Host Transfer!

Bevor Fragen aufkommen, wir haben die neusten Treiber verwendet (Intel Chipsatz, ATI Catalyst etc.) als auch das neuste Bios aufgespielt. Auch habe ich ein bisschen mit den BIOS-Einstellungen gespielt: manuell den Speicher eingestellt, den QPI-Link manuell festgelegt, die C-States ausgeschaltet etc. -> keine Verbesserung.

Naja, am Montag bauen wir jedenfalls eine GTX275 ein. Falls die schneller sein sollte, scheint es an ATI zu liegen.

Grüße
Jörn
.
EDIT :
.

Die PCIe Probleme liegen scheinbar am X58 Chipsatz oder hängen mit den ATI-Treibern unter diesem Chipsatz zusammen, hier ein Zitat aus dem AMD Forum:

Hi Joern,

Thanks for the information.

I tried to install a HD4870 on the P55 mainboard. The result is as slow as the 5870.

I also intalled the 5870 on a P45 mainboard. The CPU->GPU/GPU->CPU speed can reach ~5GB/s.


Siehe auch: AMD Developer Forum

Grüße
Joern
 
Zuletzt bearbeitet:
Zurück
Oben Unten