App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
- Foren
- Planet 3DNow! Community
- Planet 3DNow! Distributed Computing
- Mathematik und Kryptographie
- Collatz Conjecture
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Optimierung der Collatz-WUs
- Ersteller Sabroe SMC
- Erstellt am
koschi
Grand Admiral Special
- Mitglied seit
- 11.11.2001
- Beiträge
- 5.816
- Renomée
- 775
- Standort
- 0511
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- sieher Banner
- Lieblingsprojekt
- WCG, Einstein, Universe
- Meine Systeme
- R7 3900X @ 85W + 2 x Vega 56, 8 x Odroid C2, 8 x Odroid XU4, 4 x Odroid N2, 3 x Nvidia Jetson TK1
- BOINC-Statistiken
- Folding@Home-Statistiken
- Prozessor
- R9 3900X
- Mainboard
- Asus PRIME X370 PRO
- Kühlung
- Thermalright Le Grand Macho RT
- Speicher
- 2x32 GB DDR4 Corsair Vengeance LPX 3200@3200
- Grafikprozessor
- 2 x Sapphire Pulse Vega 56
- Display
- LG UltraFine 32UN880-B
- SSD
- Samsung EVO Plus 870 1TB & 850 500GB, Crucial MX500 1TB
- Optisches Laufwerk
- PIONEER BDR-209DBK
- Soundkarte
- Nubert nuPro A-20 (USB), Pioneer SE-MS7BT(K) (BT)
- Gehäuse
- Fractal Design Define R5 PCGH
- Netzteil
- BeQuiet! StraightPower 11 850W
- Betriebssystem
- Ubuntu LTS
- Internetanbindung
- ▼220 ▲40
Mit erhöhter sieve_size konnte ich auf GTX1060 und GT730 gegenüber den Empfehlungen im anderen Thread noch einiges herausholen:
GTX1060 (gemittelt über viele dutzend WUs)
ALT: 837 Sekunden, 29227 Credits
NEU: 780 Sekunden, 28030 Credits
Laufzeitreduzierung: ~7%
GT730 (jeweils nur einige WUs)
ALT: 14711 Sekunden, 30806 Credits
NEU: 13708 Sekunden, 28842 Credits
Laufzeitreduzierung: ~7%
lut_size größer 17 wurde eher langsamer, threads 6 oder 10 ebenso, sieve_size=31 ergibt computation error, kernels_per_reduction auf 24 oder 56 ohne Effekt...
Schade dass die Credits mit den Laufzeiten sinken, dadurch werden die Gewinne größtenteils wieder aufgefressen.
GTX1060 (gemittelt über viele dutzend WUs)
ALT: 837 Sekunden, 29227 Credits
NEU: 780 Sekunden, 28030 Credits
Laufzeitreduzierung: ~7%
GT730 (jeweils nur einige WUs)
ALT: 14711 Sekunden, 30806 Credits
NEU: 13708 Sekunden, 28842 Credits
Laufzeitreduzierung: ~7%
verbose=1
kernels_per_reduction=48
threads=8
lut_size=17
sleep=1
reduce_cpu=0
sieve_size=30
lut_size größer 17 wurde eher langsamer, threads 6 oder 10 ebenso, sieve_size=31 ergibt computation error, kernels_per_reduction auf 24 oder 56 ohne Effekt...
Schade dass die Credits mit den Laufzeiten sinken, dadurch werden die Gewinne größtenteils wieder aufgefressen.
FritzB
Grand Admiral Special
- Mitglied seit
- 25.12.2002
- Beiträge
- 3.348
- Renomée
- 1.922
- Standort
- Märkisch Kongo
- Aktuelle Projekte
- WCG, GPUGrid
- Lieblingsprojekt
- gute Frage
- Meine Systeme
- 3x Ryzen 7950X, 9950X, 4800H, 7945HX, RTX 4070 Ti, RTX 4070 Ti Super, GTX 1650 Ti, RTX 4090, Radeon Pro VII
- BOINC-Statistiken
- Mein Desktopsystem
- mehrere
- Mein Laptop
- Lenovo ideapad 3, Ryzen 7 4800H, 1650 Ti
- Prozessor
- 7950X, 9950X, 7945HX
- Mainboard
- jeweils eins
- Kühlung
- BQ Silent Loop 2 280, Arctic Liquid Freezer II 240, Scythe Fuma 3
- Speicher
- ganz viel DDR4 und DDR5
- Grafikprozessor
- GeForce 4090, 4070 Ti Super, 4070 Ti
- Display
- LG UltraGear 27GP850-B
- SSD
- diverse
- Optisches Laufwerk
- hatter
- Gehäuse
- Nanoxia Deep Silence 5, BQ Silent Base 500/600 u.a.
- Netzteil
- Corsair, Seasonic, BQ...
- Betriebssystem
- Windows 11 x64/Pro, Linux Mint 21.x
Ich meine es war ein FB Race in diesem Jahr, wo das nochmal auf den Tisch kam. Die Optimierungen bringen einen Zeitgewinn, reduzieren gleichzeitig aber die Credits. Unterm Strich war es mit Optimierungen aber immer noch besser.
Hi torsam, bei mir sieht das so aus (VII):
Laufzeit unter 6 Minuten bei 1200MHz. Credits liegen so zwischen 29000-30000.
(alles gute noch nachträglich zum Geburtstag ! )
verbose=1
kernels_per_reduction=64
threads=8
lut_size=18
sieve_size=30
sleep=1
cache_sieve=1
reducecpu=0
Laufzeit unter 6 Minuten bei 1200MHz. Credits liegen so zwischen 29000-30000.
(alles gute noch nachträglich zum Geburtstag ! )
Zuletzt bearbeitet:
thorsam
Grand Admiral Special
- Mitglied seit
- 05.04.2003
- Beiträge
- 2.737
- Renomée
- 972
Was ich bis jetzt eingetragen habe:
Ok, danke. Dann füge ich noch die lut_size=18 und cache_sieve=1 ein.
Im Augenblick liefert die VII alle 9:15 Minuten 2 WUs ab.
Bei 1.200 MHz GPU-Takt? Ich habe sie gerade per amdgpu-utils auf ~ 1.900 MHz laufen.
Den VRAM-Takt fasse ich mal besser nicht an.
Vielen Dank für die Glückwünsche. Ich freue mich schon aufs Grillen.
--- update ---
Wow, mein lieber Kukuschinski. Das hat doch glatt nochmal 2 Minuten gebracht.
Sind Sie beeindruckt? Wir sind beeindruckt!
verbose=1
items_per_kernel=20
kernels_per_reduction=64
threads=8
sleep=1
build_options=-Werror
reduce_cpu=0
sieve_size=30
Ok, danke. Dann füge ich noch die lut_size=18 und cache_sieve=1 ein.
Im Augenblick liefert die VII alle 9:15 Minuten 2 WUs ab.
Bei 1.200 MHz GPU-Takt? Ich habe sie gerade per amdgpu-utils auf ~ 1.900 MHz laufen.
Den VRAM-Takt fasse ich mal besser nicht an.
Vielen Dank für die Glückwünsche. Ich freue mich schon aufs Grillen.
--- update ---
Wow, mein lieber Kukuschinski. Das hat doch glatt nochmal 2 Minuten gebracht.
Sind Sie beeindruckt? Wir sind beeindruckt!
Zuletzt bearbeitet:
thorsam
Grand Admiral Special
- Mitglied seit
- 05.04.2003
- Beiträge
- 2.737
- Renomée
- 972
Gerade bin ich mit der Vega64 am rumspielen.
Auf jeden Fall reicht hier eine WU, um die GPU-Auslastung bei 100% zu halten.
Mit 2 WUs und den gleichen Einstellungen wie für die VII, steigt die Grafikkarte aus.
Lute_size=17, GPU-Takt bei 1.580 MHz = 5:30 Minuten. amdgpu-utils sagt: 330 Watt
Lute_size=18, GPU-Takt bei 1.570 MHz = 5:10 Minuten. amdgpu-utils sagt: 345 Watt
Der Wert 18 erzeugt nur mehr Wärme. Punkte sind in etwas gleich.
Auf jeden Fall reicht hier eine WU, um die GPU-Auslastung bei 100% zu halten.
Mit 2 WUs und den gleichen Einstellungen wie für die VII, steigt die Grafikkarte aus.
Lute_size=17, GPU-Takt bei 1.580 MHz = 5:30 Minuten. amdgpu-utils sagt: 330 Watt
Lute_size=18, GPU-Takt bei 1.570 MHz = 5:10 Minuten. amdgpu-utils sagt: 345 Watt
Der Wert 18 erzeugt nur mehr Wärme. Punkte sind in etwas gleich.
Zuletzt bearbeitet:
Die lut_size (nicht lute_size) beschreibt die Ausnutzung des L2 Caches.
Bei 18 hätte laut Berechnung ( (2^18)*8/1024 ) 2048 KB.
19 = 4096
18 = 2048
17 = 1024
16 = 512
15 = 256
Wenn man nun z.B eine R9 380 mit nem Antigua-Chip rechnen läst, der nur 768Kb L2 Cache hat, wäre eine lut_size=17 zu groß. Also wählt man 16.
Wie sich da zwei WUs gleichzeitig den Cache teilen, keine Ahnung.
Bei 18 hätte laut Berechnung ( (2^18)*8/1024 ) 2048 KB.
19 = 4096
18 = 2048
17 = 1024
16 = 512
15 = 256
Wenn man nun z.B eine R9 380 mit nem Antigua-Chip rechnen läst, der nur 768Kb L2 Cache hat, wäre eine lut_size=17 zu groß. Also wählt man 16.
Wie sich da zwei WUs gleichzeitig den Cache teilen, keine Ahnung.
TAL9000
Grand Admiral Special
- Mitglied seit
- 20.03.2007
- Beiträge
- 5.947
- Renomée
- 659
- Standort
- nähe Giessen
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- was halt so geht, bervozuge aber Bio/Physik/Astronomie Projekte
- Lieblingsprojekt
- SIMAP, danach kam mMn nichts mehr direkt produktives
- Meine Systeme
- Ryzen 3700X; 4650G; Radeon RX6950XT; RX6500XT
- BOINC-Statistiken
- Folding@Home-Statistiken
- Mein Laptop
- Fujitsu LifeBook E546 FJNB291
- Prozessor
- AMD Ryzen 7 3700X // Ryzen 5 4650G // Intel Core i7-3770 + i5-3570K
- Mainboard
- MSI B350 PC Mate // ASRock A300-STX // 2x Intel DH77EB
- Kühlung
- Arctic Liquid Freezer 240 + 2x SilverStone FW121 // Noctua NH-L9a // AC Freezer 7 // Intel E41759
- Speicher
- 2x16GB DDR4-3200 // 2x8GB DDR4-3200 // 2x8GB DDR3-1600 // 4x4GB DDR3-1600
- Grafikprozessor
- PowerColor Radeon RX 6950 XT Red Devil 16G // AMD IGP // Sapphire Pulse RX 6500 XT 4G // Intel IGP
- Display
- 24" Lenovo ThinkVision LT2452p 1920x1200
- SSD
- WD_BLACK SN750 500GB // Transcend MTE110S 256GB // Canvas SL308 250GB // Crucial MX500 250GB
- HDD
- MG06ACA800E 8TB // Z5K1000 1TB // HDWA120EZSTA 2TB // HD153UI 1,5TB
- Optisches Laufwerk
- - // - // LiteOn iHAS120 DVD-RW // LG DVD-RW
- Soundkarte
- OnBoard
- Gehäuse
- Enermax iVektor schwarz // AsRock DeskMini // Chenbro PC31031 // TFX Desktop
- Netzteil
- be quiet! Dark Power Pro 11 650W // ex 19V // FSP Hexa 85+ Pro 450W // Seasonic SS-300TFX
- Tastatur
- Qpad 3202-MK85 Cherry MX-Brown
- Maus
- VERTI WM25
- Betriebssystem
- Win10pro x64 // Ubuntu Xfce (Mint) // Win10pro x64 // Ubuntu Xfce (Mint)
- Webbrowser
- Firefox
- Verschiedenes
- Danke thorsam & JagDoc, KVM ATEN CS1764 4-fach Desktop , USV 2xAPC BR900GI, NAS QNAP TS-431P2-8G + TS-462-16G je 4x4TB
- Internetanbindung
-
▼50 MBit
▲10 MBit
Da ich mich wunderte warum die Berechnungszeiten so schwanken, habe ich bei den Linux Systemen 2 verschieden Anwendungen und damit Files gefunden
Collatz Sieve v1.40 (opencl_ati_gpu) x86_64-pc-linux-gnu
collatz_sieve_1.40_x86_64-pc-linux-gnu__opencl_ati_gpu.config
Collatz Sieve v1.40 (opencl_ati) x86_64-pc-linux-gnu
collatz_sieve_1.40_x86_64-pc-linux-gnu__opencl_ati.config
Mal so als Tipp in beide die Optimierungen reinschreiben... muss ich noch bei mind. fünf System tun, VPN läuft noch nicht, also muss ich das Local machen.
Collatz Sieve v1.40 (opencl_ati_gpu) x86_64-pc-linux-gnu
collatz_sieve_1.40_x86_64-pc-linux-gnu__opencl_ati_gpu.config
Collatz Sieve v1.40 (opencl_ati) x86_64-pc-linux-gnu
collatz_sieve_1.40_x86_64-pc-linux-gnu__opencl_ati.config
Mal so als Tipp in beide die Optimierungen reinschreiben... muss ich noch bei mind. fünf System tun, VPN läuft noch nicht, also muss ich das Local machen.
Zuletzt bearbeitet:
Ähnliche Themen
- Antworten
- 7
- Aufrufe
- 2K
- Antworten
- 55
- Aufrufe
- 20K