für alle die denken ihr speicher rennt mit 1:1....

iam.cool schrieb:
Das ist aber auch "humbug" :] Hab zwar nen XP aber bei zb sinkt der Speicherdurchsatz bei höherem Takt obwohl der FSB gleich bleibt.
Hier geht's um den K8 im DualChannel. ;)

Du hast ja auch 'ne Sockel A Plattform mit FSB-Limit. Du kommst ja bei 200 MHz im DualChannel niemals auf 6400 MB/s von Speicher zu CPU (zwar 6400 MB/s von Speicher zu Northbridge, aber nur 3200 MB/s von Northbridge zu CPU). Von daher interessiert es die CPU nicht, ob nun 3000-3100 MB/s ankommen - da limitiert der Speicherhals und die CPU kann die Bandbreite noch gut nutzen.

Der A64 hat den Speichercontroller integriert und somit eine um Welten bessere Speicherauslastung.
 
iam.cool schrieb:
Das ist aber auch "humbug" :] Hab zwar nen XP aber bei zb sinkt der Speicherdurchsatz bei höherem Takt obwohl der FSB gleich bleibt.

Beispiel:

11x200 ergeben bei mir cirka 3-5% mehr Speicherdurchsatz als 12x200 obwohl es eigendlich umgekehrt sein müste ???
......


Du verlierst nur 3-5%? Ich verliere bei 12x200 im Vergleich zu 11x200 ca.20%!!!
Ich hab mir sagen lassen, daß die L2-ECC Korrektur häufiger greift!

TNB_Stoerck schrieb:
Der Cache läuft mittlerweile ja immer 1:1 im Takt, nur verkraftet er es häufig nicht so gut, wie der eigentliche CPU-Core. Die ersten Athlons konnte man wunderbar "kastrieren" beim oc'en *ggg*
 
So, das Prog selbst ist erstmal fertig. Gibt einfach einen Wert als Speicherlatenz aus, bei mir (noch unter Linux) 363 Takte +/- 3.
Die hohen Werte kommen zustande, weil in einem festgelegten Muster innerhalb von 128MB zugegriffen wird, und das ist nicht gerade ein kleiner Bereich. Außerdem hängen die Zugriffe alle voneinander ab (aus dem vorherigen ergibt sich der nächste), wesswegen die Zugriffe alle nacheinander stattfinden müssen.

Wichtig sind aber vor allem die Zeiten, die Latenztakte ändern sich ja. Mein K7 läuft auf 2.2GHz, was also im Schnitt 165ns Latenz macht (363/2.2e9).

Ich werd die Sache jetzt noch durch DJGPP jagen und dann hier reinstellen. Source gibts auf Wunsch, ist aber eine einfache Sache (140 Codezeilen).

Zum Benchmarken selbst: Wie schon gesagt, bitte nicht unter Win - das versaut die Ergebnisse. Am besten so: DOS Floppy erstellen, Benchmark draufkopieren. Dann booten, und ohne Umschweife direkt den Bench ausführen. Dann irgendwie den Multi verstellen und selbe Prozedur nochmal, möglichst genau so wie vorher (damit's im Speicher auch wieder genauso aussieht).
 
So, fettich.

http://www.i-hasser.net/bench_memlat/memlat.tar.gz

Ich war jetzt zu faul noch irgend einen anderen Packer zu installieren/mir die Parameter anzugucken, mit tar.gz sollte sowas wie WinRar oder WinAce aber eigenltich klar kommen.

Was enthält das Archiv:
- memlat.exe, das ist die Benchmark Binary
- cwsdpmi.exe, das wird gebraucht damit der Bench unter Dos läuft, und
- memlat.img ist ein fertiges Floppy Image (muss nur noch mit irgendeinem Prog wie zB. RAWrite auf die Floppy gebannt werden), mit OpenDOS und dem Benchmark druff.

Das Floppy Image hab ich dazugepackt, weil mir aufgefallen ist, dass Win2k garkeine bootfähigen Disks erstellen kann. Wenn ihr selbst eine Floppy macht, gibts ein paar Dinge zu beachten:

Der Bench benutzt DPMI - das ist eine Schnittstelle, damit 32Bit Code auch unter DOS läuft (der Vorteil ist, dass da kein störendes Betriebssystem drumherum ist, was sich laufend Rechenzeit krallt). Dummerweise (naja, eigentlich schönerweise) stellen auch EMM386 und afaik HIMEM.SYS eine DPMI Schnittstelle bereit, allerdings mit einigen Einschränkungen. Das betrifft zum Beispiel den Speicherausbau, meines Wissens kranken beide an mehr als 64MB Speicher. Die CWSDPMI.EXE stellt auch nur eine DPMI Schnittstelle bereit, die aber kein Problem mit mehr Speicher haben sollte (habs allerdings nur in einem emulierten Rechner mit 256MB getestet).

Also bei selbsterstellten Bootfloppies (wenn das OS anbietet eine bootfähige Floppy zu erstellen sicherlich der einfachere Weg als erst ein Image-Tool für Floppies runterzuladen) weder himem.sys, noch irgendeinen EMS Manager (wie emm386) laden. Nur die cwsdpmi.exe und memlat.exe drauf.
Linuxer/Unixer sind wie immer fein raus, ein 'dd if=memlat.img of=/dev/fd0' schreibt das Image auf eine Floppy (bei anderen Unixen dürfte sich /dev/fd0 ändern).


Hmm... glaub das wars. Wäre vielleicht erstmal als Test nicht schlecht, das Prog 2mal laufen zu lassen (also booten, laufen lassen, rebooten nochmal laufen lassen) und die Ergebnisse zu posten. Nur um mal zu gucken, wie reproduzierbar die Ergebnisse sind.

Zur weiteren Verwendung: Allgemein dürfte man das Prog auch gut zur Latenzzeitmessung einsetzen können, also wer wegen ein paar MHz mehr Speichertakt mal ein Timing entschärfen muss, der Benchmark zeigt was es bringt.

Ach ja - hatte doch was vergessen. Bei Programmstart komm die Fehlermeldung, dass er irgend'n Swap nicht erstellen konnte (weil der Bench auf der Floppy liegt, und die ihm wohl zu klein ist). Macht aber nix, würde er swappen, wäre das Ergebnis sowieso unbrauchbar (oder als HDD Benchmark zu gebrauchen :P).

Viel Spaß beim Benchen ;).

PS Aufruf vom Bench über memlat.exe, der holt sich die cwsdpmi.exe dann schon von selbst
 
Seance schrieb:
Genau das ist doch schon seit Ewigkeiten bekannt.
Sofern die CPU den RAM Durchsatz limitiert, wird dieser mit erhöhter CPU Frequenz steigen, bis dann irgendwann Schluss ist.
Ich kann mich noch gut daran erinnern, als ich mit mein Nforce2 Board geholt hab und ich den maximalen Ramtakt austesten wollte.
Also 217 * 7 "reingehauen" gebencht und stabilät kontrolliert. Schon wunderte ich mich über den niedrigen Durchsatz. Also hab ich das mal weiter ausgetest mit den Multis 8, 9, 10 und 11 und siehe da der RAM Durchsatz stieg stetig an.
Das was du hier erzählst kann ich dir nicht so recht glauben.

Seance

genauso isses, die niedriger getaktete cpu kann die bandbreite einfach nicht ausreizen. aaalter hut


SKYNET schrieb:
das hatte ich auf sockel A nicht, und auf sockel 754 auch nicht.

das ist afaik nur ein problem des S939(940 ?).

tjo, der SoA und 754 stellt ja auch nicht annähend soviel bandbreite zur verfügung, wie ein 939 im DC, hast das nicht gewusst ;)
 
darkcrawler schrieb:
genauso isses, die niedriger getaktete cpu kann die bandbreite einfach nicht ausreizen. aaalter hut




tjo, der SoA und 754 stellt ja auch nicht annähend soviel bandbreite zur verfügung, wie ein 939 im DC, hast das nicht gewusst ;)


das ist falsch, theoretisch liefert sockel A im DC die gleiche bandbreite wie S939.... aber der sockel A athlon unterstützt es nicht. :P ;)



p.s.

beispiel:

ramteiler 1:1
den durchsatz müsste man haben(abzüglich 5-12% differenz)

7*343 = 2400MHz = 10976MB
8*300 = 2400MHz = 9600MB
9*267 = 2400MHz = 8544MB
10*240 = 2400MHz = 7680MB
11*218 = 2400MHz = 6976MB

aber, ihr werdet immer auf den gleichen durchsatz kommen, und zwar den von den 218MHz...
ggf. ein wenig(1-2%) mehr weil die latenzen kleiner durch den erhöhten HT.

ihr verstehn ?


daher: CPU takt durch 11.1 teilen = takt mit dem der ram angesprochen wird von der CPU b.z.w. takt mit dem der speicher effektiv rennt. :-*
 
tjo is das gleiche in grün
aufm SoA kann die cpu ebenfalls die bandbreite nich ausreizen, da der fsb nur mit 200mhz /400ddr angebunden is, ob die bandbreite nun von der CPU zur NB fehlt, oder von der NB zum RAM is ja wohl gehüpft wie gesprungen.

liegt also ebenfalls an der cpu bzw deren anbindung an die NB ;)

mehr weil die latenzen kleiner durch den erhöhten HT.

was hat der HT mit dem speicher zu tun? nix
 
darkcrawler schrieb:
tjo is das gleiche in grün
aufm SoA kann die cpu ebenfalls die bandbreite nich ausreizen, da der fsb nur mit 200mhz /400ddr angebunden is

liegt also ebenfalls an der cpu bzw deren anbindung an die NB ;)



was hat der HT mit dem speicher zu tun? nix


nix, oder steht da was von den latenzen beim speicher ? :]
aber gibt noch sowas wie nen referenztakt von der CPU mit dem der speichercontroller angesprochen wird.
 
tja, wenn du referenztakt meinst, solltest nicht HT schreiben, denn das ist etwas anderes ;)


ich merke hier mit nem gigabyte k8ns s939 und dem winnie NULL unterschied, ob ich nun

9x 200 = 1800mhz cpu / 200 mhz ram oder
7x 257 = 1800mhz cpu / 200 mhz ram (set 166)
6x 300 = 1800mhz cpu / 200 mhz ram (set 133) fahre

durchsatz ist absolut identisch, die paar mb-chen fallen unter messungenauigkeit :]
 
Zuletzt bearbeitet:
SKYNET schrieb:
das ist falsch, theoretisch liefert sockel A im DC die gleiche bandbreite wie S939.... aber der sockel A athlon unterstützt es nicht. :P ;)

Lötzinn! Der FSB des Socket A liefert nur 64bit x Takt x 2 an Bandbreite. Im 1:1-Modus IMMER nur die Hälfte dessen, was die Speichermodule per DC theoretisch liefern könnten. Einzig der Speicherbus liefert die theoretisch gleiche Bandbreite,


SKYNET schrieb:
beispiel:

ramteiler 1:1
den durchsatz müsste man haben(abzüglich 5-12% differenz)

7*343 = 2400MHz = 10976MB
8*300 = 2400MHz = 9600MB
9*267 = 2400MHz = 8544MB
10*240 = 2400MHz = 7680MB
11*218 = 2400MHz = 6976MB

aber, ihr werdet immer auf den gleichen durchsatz kommen, und zwar den von den 218MHz...
ggf. ein wenig(1-2%) mehr weil die latenzen kleiner durch den erhöhten HT.

ihr verstehn ?

Das würde ich gerne mal sehen.

Vielleicht kann ja jemand mal bei 2400MHz CPU-Takt eine Messkurve für 8*300, 9*267, ... bis 12*200 und 1:1-Betrieb fahren.

Würde gerne selber, leider ist mein GSkill-Speicher wegs RMA außer Haus. :-[

Gruß, Flox
 
darkcrawler schrieb:
ich merke hier mit nem gigabyte k8ns s939 und dem winnie NULL unterschied, ob ich nun

9x 200 = 1800mhz cpu / 200 mhz ram oder
7x 257 = 1800mhz cpu / 200 mhz ram (set 166)
6x 300 = 1800mhz cpu / 200 mhz ram (set 133) fahre

durchsatz ist absolut identisch, die paar mb-chen fallen unter messungenauigkeit :]

Das ist ja auch klar... (bis auf einige 1:1-Junkies vielleicht! ;D)

Den Versuch hab ich bei 7*328 und 9*255 (letzterer 1:1) auch einmal durchgeführt. Sandra, SuperPi und 3DM2k1 lieferten praktisch identische Ergebnisse mit Abweichungen <1%.
 
Flox schrieb:
Würde gerne selber, leider ist mein GSkill-Speicher wegs RMA außer Haus. :-[
Was is denn damit passiert?
 
SKYNET schrieb:
für alle die denken ihr speicher rennt mit 1:1....

ihr müsst den CPU-takt durch 11.1 teilen, dann habt ihr den echten ramtakt, könnt ihr auch selber testen indem ihr mal eure bandbreite checkt.

beispiel:
ihr habt 2400MHz CPU-Takt mit 9*266.67, ihr müsstet also wenn der speicher tatsächlich mit 1:1 rennt eine theoretische bandbreute von 8544MB haben(minus ca. 300MB tolleranz).

aber ihr habt nur ca. 6600MB(+/- paar zerquetschte)...

das liegt dadrann:
2400 / 11.1 = 216.21MHz
216.21 x 32 = 6919MB theoretisches maximum.

kurz: alle die denken sie hätten ja so einen geilen speicher takt... kommt mal auf den boden der tatsachen zurück. *suspect*


p.s. zum speicher durchsatz testen eignet sich am besten sisoft sandra oder ScienceMark2, everrest misst nämlich anders und ist darum nicht dafür zu gebrauchen. :-X

stimmt, wenn man nen 3000+ hat und den Speicher mit ddr333-teiler betreibt *chatt*

was soll der Unsinn
 
SKYNET schrieb:
das ist falsch, theoretisch liefert sockel A im DC die gleiche bandbreite wie S939.... aber der sockel A athlon unterstützt es nicht. :P ;)

.......

ihr verstehn ?


daher: CPU takt durch 11.1 teilen = takt mit dem der ram angesprochen wird von der CPU b.z.w. takt mit dem der speicher effektiv rennt. :-*

Der Frontsidebus limitiert auf theoretisch maximal 3,2gb/s
 
Kamui schrieb:
Was is denn damit passiert?

Hatte den Speicher bis vor kurzem in einem nForce2 laufen und konnte ihn nicht auf seine spezifizierten 275MHz/2.5-3-3-7-1T testen.

Tja, und nachdem ich ihn kürzlich in mein aktuelles DFI eingebaut hatte, lief er mit maximal 260MHz/2.5-3-3-7-1T fehlerfrei.

Mail an GSkill, hab ihn dann eingeschicken sollen und vorgestern kam die Bestätigung, dass die Module alleine zwar ordentlich laufen, im Dual-Channel aber dann nicht mehr.

Bekomme jetzt ein neues 1GB-Kit.

Gruß, Flox
 
darkcrawler schrieb:
tja, wenn du referenztakt meinst, solltest nicht HT schreiben, denn das ist etwas anderes ;)


ich merke hier mit nem gigabyte k8ns s939 und dem winnie NULL unterschied, ob ich nun

9x 200 = 1800mhz cpu / 200 mhz ram oder
7x 257 = 1800mhz cpu / 200 mhz ram (set 166)
6x 300 = 1800mhz cpu / 200 mhz ram (set 133) fahre

durchsatz ist absolut identisch, die paar mb-chen fallen unter messungenauigkeit :]


du sollst 1:1 testen, das gilt alles nur für speicher 1:1 !

soll ichs für dich nochmal auf russisch, spanisch, italienisch, englisch, fanzösisch und niederländisch schreiben ?
japanisch & thailändisch bekomme ich auch noch hin. )((
 
ich glaube, leute wie skynet waren es, denen wir so bloedsinn wie glauben an goetter zu verdanken haben, weil sie sich nicht erklaeren konnten, warum es blitzt und donnert. danke skynet.
 
Kranke tiere werden doch erschossen, um sie von ihren leiden zu erlösen!
Ich lasse das jetzt mal so im raum stehen 8)
 
SKYNET schrieb:
du sollst 1:1 testen, das gilt alles nur für speicher 1:1 !

soll ichs für dich nochmal auf russisch, spanisch, italienisch, englisch, fanzösisch und niederländisch schreiben ?
japanisch & thailändisch bekomme ich auch noch hin. )((

nö, brauchste nich, wennde ref-takt und HT schon in nen topf wirft, macht das wenig sinn (dann isses auf russisch immer noch falsch), drück dich verständlich aus und gut is &nich gleich aufregen ;) :]
 
Zuletzt bearbeitet:
SKYNET schrieb:
du sollst 1:1 testen, das gilt alles nur für speicher 1:1 !

Niemand mit einem 3500+, der sowas mal machen könnte?

Mein 3000+ ist für sowas nicht so ganz geeignet, da der maximale x9er Multi für so einen Test denkbar ungünstig ist. Ich kann sonst "nur" mit 2GHz testen und das ist mir zu wenig, um eine CPU-Limitierung auszuschließen.

Ein 3500x könnte mal mit:

11*236/2.5-3-3-7 vs 9*289/3-4-4-9 laufen. Freiwillige? ;)

EDIT:
Andererseits: ob ich 9*289 takte und dann den 11er RAM-Teiler benutze, macht auch keinen Unterschied, von daher werd ich das mal probieren, falls mein Speicher heute noch kommt.

Gruß, Flox
 
Zuletzt bearbeitet:
also ich hab das mal so erklärt bekommen:

wenn ma den speicher im bios auf "200" fixed dann sollte der wie skynet meint 1:1 laufen.....

berechnet wird euer ramtakt folgendermassen:

CPU(MHZ) : MULTI = RAMTAKT zB.: 200x10= 2000mhz : 10 = 200 DDR400 PC3200 Ram :)

oder 2200 : 11 = 200 DDR400 PC3200 Ram (11x200 zB 3500+)
oder 2400 :12 = 200 DDR400 PC3200 Ram (12x200 zB3800+)

check it?!


im cpu z ist euer teiler für die ram angegebn wird aber nicht immer richtig ausgelesen.

seEn
 
Zurück
Oben Unten