17. Pentathlon 2026 - Sprint (NFS@Home)

FritzB

Grand Admiral Special
★ Themenstarter ★
Mitglied seit
25.12.2002
Beiträge
3.973
Renomée
2.709
Standort
Märkisch Kongo
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2012
  • SETI@Home Wow!-Event 2019
  • SETI@Home Intel-Race II
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
  • BOINC Pentathlon 2022
  • BOINC Pentathlon 2023
  • BOINC Pentathlon 2024
  • BOINC Pentathlon 2025
  • BOINC Pentathlon 2026
Für alle Fragen, die zum Sprint (NFS@home) im Rahmen des Pentathlon 2026 auftreten, soll dieser Thread dienen.

Zeitraum:
Start: 16.05.2026 um 00:00 Uhr UTC bzw. 02:00 Uhr (MESZ) Ende: 19.05.2026 00:00 Uhr UTC bzw. 02:00 Uhr (MESZ)


Ankündigung der Pentathlon-Initiatoren:

Projektseite:
http://escatter11.fullerton.edu/nfs/

Konto erstellen:
https://escatter11.fullerton.edu/nfs/create_account_form.php?next_url=home.php


Unser Team mit Beitrittslink:
https://escatter11.fullerton.edu/nfs/team_display.php?teamid=626
Unserem Team bitte beitreten bevor die Disziplin startet bzw. bevor Punkte erzielt wurden. Dazu auf der Teamseite ins Projekt einloggen und dann "Team beitreten (join team)" wählen. Teamwechsel während des Wettkampfes sind verpönt!

Wer nicht extra einen eigenen Account bei dem Projekt erstellen will kann über den schwachen Kontoschlüssel des P3D Cluster mitrechnen.

Schwachen Schlüssel für den P3D Cluster:
20314_1a8933dcee46fc1f04b7860b5a0cceea

Code:
<account>
<master_url>http://escatter11.fullerton.edu/nfs/</master_url>
   <authenticator>20314_1a8933dcee46fc1f04b7860b5a0cceea</authenticator>
</account>

Datei als account_escatter11.fullerton.edu_nfs.xml speichern unter:
Win C:\ProgramData\BOINC\
Linux /var/lib/boinc-client/


Besonderheiten des Projekts:
  • Quorum 1
  • Unter Linux hat NFS eine AVX512 Anwendung für Linux (nativ). Diese läuft nicht in einer Linux-VM unter Windows, weil VirtualBox AVX512 nicht unterstützt.
  • Windows läuft bei nicht-AVX512 Anwendungen schneller als Linux
  • 16e V5 bringen am meisten Credits/Zeit, haben aber einen hohen RAM Verbrauch >1,2GB/WU.
  • wenn mehrere Instanzen genutzt werden, muss dafür zwingend ein eigener Name vergeben werden. Die fertigen WUs verschwinden sonst!

Hosteintrag für totalen Kommunikationstop nach dem Vollsaugen:
Code:
#NFS@Home
127.0.0.1 escatter11.fullerton.edu
::1 escatter11.fullerton.edu


Bunkern per Instanzen statt via Hostseintrag (empfohlen):
 
Lasse hier schonmal vorglühen, ist bunkern erlaubt?
 
Bei mir wird das irgendwie nichts...
Code:
Do 14 Mai 2026 10:55:43 CEST |  | [error] Can't create HTTP response output file projects/escatter11.fullerton.edu_nfs/S3p767.poly
Hat Irgendjemand eine Ahnung, was da schief läuft?

OK, das war ein Berechtigungsproblem, aber jetzt das...
Do 14 Mai 2026 11:02:43 CEST | NFS@Home | [error] exceeded limit of 2400 slot directories

WTF??

Boah, auch das war ein Berechtigungsproblem... BOINC und Tumbleweed sind wirklich keine guten Freunde...
 
Zuletzt bearbeitet:
hm 16GB reicht mit win11 nicht für 16Wus 16e ... unter Linux recht es ....
 
Mein 3950X braucht für die WUs mit nahezu 100% Auslastung bei 4GHz um die 90 Minuten.
Der 3900 schafft das mit 3,5GHz, ebenfalls fast 100% Auslastung in 60 Minuten.
Irgendwie merkwürdig.
Beides rechnen 16e Lattice Sieve V5 v1.11 x86_64-pc-linux-gnu
Der 16-Kerner hat einen recht aktuellen Boinc-Manager (8.2.12). Der 12-Kerner krebst noch mit 7.24.1 herum.
Ansonsten ist auch der Benchmark vom 3950X relativ gering
ermittelte Geschwindigkeit für Gleitkommazahlen 6.39 Milliarden Operationen/Sek
ermittelte Geschwindigkeit für ganze Zahlen 69.45 Milliarden Operationen/Sek
Könnte es am RAM-Speed liegen? Wenn die WUs viel Speicher brauchen, muss der womöglich auch noch schnell sein?
 
Zuletzt bearbeitet:
hm MagicEye04 läuft der 3950x im Eco modus? Mein 4750pro braucht auch 60min je wus (16) aber unter win.
ich hatte schon bei SRbase gesehen das das PPT schnell erreicht war und daher die CPU sehr gedrosselt wurde, schlimmer wie bei Prime.
 
Ja gut, auf dem 3900 gibts pro Kern etwas mehr L3.
Aber ich hab ja noch nen 5950X und der hat genau so viel L3 wie der 3950X und der 5950X ist auch deutlich flotter.
 
hm MagicEye04 läuft der 3950x im Eco modus? Mein 4750pro braucht auch 60min je wus (16) aber unter win.
ich hatte schon bei SRbase gesehen das das PPT schnell erreicht war und daher die CPU sehr gedrosselt wurde, schlimmer wie bei Prime.
Ja, aber die sind alle gedrosselt und die (realen) Taktfrequenzen hab ich auch dazu geschrieben.
 
ich fragte ja ob der vielleicht nicht die Tack rate hält, der 5950x sollte eigentlich nur sehr wenig schneller sein
 
Ich lass mir den Takt aller Kerne im Sekundentakt ausgeben. Der bleibt relativ konstant.
 
Zuletzt bearbeitet:
Pro 4650G @45W + 16GB RAM, Debian: 55min bis ca. 1h 05min bei 100% Auslatung (= 12 Threads)
3900x + 32Gb RAM, Windows: 42 bis 55min bei 12 Threads; die anderen Threads unterstützen noch etwas bei MilkyWay und ich Arbeite nebenher noch etwas.
 
Mein 3950X braucht für die WUs mit nahezu 100% Auslastung bei 4GHz um die 90 Minuten.
Der 3900 schafft das mit 3,5GHz, ebenfalls fast 100% Auslastung in 60 Minuten.
Ich vermute beim 3950X reichen die 32GB Speicher für 32 WUs nicht mehr aus und es wird ausgelagert.
Versuch es mal mit einer oder zwei WU weniger.
 
Es sind ohnehin nur 30 WUs. 2 hatte ich für Einstein frei gehalten.
Sieht auch nicht wirklich überfüllt aus, zumal im BM das Speicherlimit auf 80% gestellt war. Der würde dann eher pausieren als auslagern.
MiB Spch : 31997,4 total, 7295,1 free, 22836,0 used, 2310,7 buff/cache
MiB Swap: 8192,0 total, 7703,8 free, 488,2 used. 9161,4 avail Spch

Ich halte trotzdem mal noch 2 weitere WUs an.

Da ich eh gerade wieder die GPU zurückgewechselt habe, hab ich mal nachgeschaut - der 3900 hat 3600er Speicher. Das dürfte schon deutlich mehr speed als bei den Anderen sein. Hab dann gleich mal noch 10W mehr für die CPU erlaubt. Damit läuft der jetzt auch auf 4GHz.
 
Zuletzt bearbeitet:
Oder stell das Speicherlimit im BM höher.
Beim 7945HX schaut das mit 32WU so aus, mit kurzen Spitzen zwischendurch im Speicherverbrauch:
MiB Spch : 61992,3 total, 30913,2 free, 28197,4 used, 3598,5 buff/cache
MiB Swap: 2048,0 total, 2048,0 free, 0,0 used. 33794,9 avail Spch
 
Das schon krass, da ist ja mein Mac von 2015 (Dual Core i5) gar nicht sooooo lahm wie ich dachte ;)
Beispiel WU
Der knuspert die mit seinen 1,6GHz auch in 87 Minuten weg.
 
@ MagicEye04

Ich vermute, dass SMT bei den älteren Ryzen-CPUs die Laufzeit stark herunterzieht.

R3 2200G / 4 Cores - kein SMT @ 3,55 GHz --> ca. 37-45 Min. / WU
R7 1700X / 8 Cores / 16 Threads @ 3,4 GHz --> ca. 55-70 Min. / WU
TR 1920X / 12 Cores / 24 Threads @ 3,5 GHz --> ca. 58-82 Min. / WU

Dein 3900X liegt auf dem gleichen Level, wie meiner.

__

Krümel hatte auch neulich angemerkt, dass sein TR 3960X total lahm unterwegs ist.

Der ist ungefähr auf dem Level von deinem 3950X.


Vermutlich wurde bei Zen 3 irgendetwas optimiert, sodass der 5950X dann mit SMT besser performt, als der Vorgänger.
 
Also der 3950X hat 3200er RAM und der 5950X sogar nur 2666. Damit würde ich den RAM-Speed mal als vernachlässigbar ansehen.

Ja, wenn ich nur 50% der Kerne auslaste, dann geht die Geschwindigkeit deutlich nach oben. Aber auch nicht auf das Doppelte oder so. Ich teste es jetzt noch mal aus, aus Neugierde.
 
Ja, wenn ich nur 50% der Kerne auslaste, dann geht die Geschwindigkeit deutlich nach oben. Aber auch nicht auf das Doppelte oder so. Ich teste es jetzt noch mal aus, aus Neugierde.
Bringt nix. Der Takt geht minimal hoch, die Zeit etwas runter. Aber keine 50%. Also mache ich wieder mit 99% weiter.
 
Das ist doch auch ziemlich logisch das mit SMT die Rechenzeit bei Singlecore WUs hoch geht, schließlich müssen sich dann 2 WUs die Recheneinheiten des Kerns teilen.
Daher ist es auch eher ein Lückenfüller für die Pipeline.
 
Das ist doch auch ziemlich logisch das mit SMT die Rechenzeit bei Singlecore WUs hoch geht, schließlich müssen sich dann 2 WUs die Recheneinheiten des Kerns teilen.
Daher ist es auch eher ein Lückenfüller für die Pipeline.
Das habe ich ja auch nicht angezweifelt. Aber es geht nicht in dem Maße, wie ich es erwartet oder erhofft habe.
Manchmal ist die Rechenzeit dann wirklich nur noch die Hälfte oder im Extremfall sogar noch weniger.
 
@MagicEye04
Das ist auch relativ normal denn je weniger Auslastungslücken in der Pipeline desto weniger kann durch den zusätzlichen Thread gewonnen werden. Mit SMT ist also von einer gleich bleibenden Rechenzeit bis hin zu einer Verdoppelung alles drin.
Im schlimmsten Fall kann man sogar Leistung verlieren. Entweder wegen dem erhöhten Verwaltungsaufwand oder weil mit dem zweiten Thread der Cache des Kerns zu klein wir. Wenn es richtig dumm läuft quillt der L3 Cache über, was seinerzeit für den TR 2990WX eine mittlere Katastrophe war weil 2 der 4 DIE keine direkte RAM Anbindung hatten. So etwas hatte ich mal vor ein paar Jahren bei einem Projekt allerdings platzte da der L3 aus allen Nähten und spätestens mit SMT vervielfachte sich bei dem die Rechenzeit. Leider weiß ich nicht mehr welches Projekt das war.
 
Also der 3950X hat 3200er RAM und der 5950X sogar nur 2666. Damit würde ich den RAM-Speed mal als vernachlässigbar ansehen.

Ja, wenn ich nur 50% der Kerne auslaste, dann geht die Geschwindigkeit deutlich nach oben. Aber auch nicht auf das Doppelte oder so. Ich teste es jetzt noch mal aus, aus Neugierde.

Ich kenne deine Systeme nicht so genau, aber soweit ich das jetzt rausgelesen habe laufen der 3950X und der 5950X beide im Eco Modus (mit 65 Watt)

da der 5950X mit 2666er RAM betrieben wird gehe ich mal davon aus das die SOC Spannung bei 1 V liegen wird, da der 3950X mit 3200er RAM läuft wäre es (je nach Board) möglich das die SOC Spannung auf 1.1V erhöht wurde.
Gerade etwas günstigere Boards die an den Spannungswandlern sparen machen dies gerne.

Dadurch kann es aber dazu kommen das bei Vollauslastung der Takt der Kerne gesenkt wird um immer noch in das 65W "Fenster" zu passen, bei meinem 5950X macht dies je nach Projekt bis zu 300MHz Taktunterschied auf allen Kernen aus (je nachdem ob ich 3200er RAM mit 1 V SOC Spannung oder 3600er RAM mit 1.1V SOC Spannung nutze)

Ich weiss nicht ob dies dein Problem löst, aber vielleicht hilft es trotzdem jemandem :)


Mit freundlichen Grüßen
AMDuzer
 
Zurück
Oben Unten