Projektnews Poem@Home: GPU app release windows

Wenn man das ganze aber aus der Credit/Watt Sicht betrachtet ist Poem derzeit unschlagbar. ;)
 
Idle 77W
Collatz 130-133W GPU 95% Temp Gpu 51 nach ca. 5 min. CPU load weit unter 8%
Milkyway geht mit Hd 5770 nicht
POEM 6x GPU 150W GPU 83% Temp GPU 47 CPU load 3 Task 60-80% da 0,5 CPU nutzung GPU client.


Netzteil Cougar A 400 oder 350 , Board ASUS M5A78L LE, CPU AMD x4 910e


grüße
joe


Die Werte sind Richtig aber der Rechner nicht
NT FSP Aurum 400 , Asrock A770DE+ ,CPU AMD X6 1055T 95 W

Ich weiß auch nicht was mich geritten hat?

joe
 
Wie lange Laufzeiten habt ihr?

Bei mir dauern 6 WUs jeweils ~ 1h 20min
Sind das schon zuviel oder kann ich auf 8 hochgehen?

System:
Phenom II X6 1090t 50-60% Auslastung
Radeon HD 6970 62% Auslastung 70°C

appinfo: 1 CPU und 0,16 GPUs pro WU.
 
Zuletzt bearbeitet:
HD5770 + Heon X3350
brauche ich für 5 WU´s 2h10min
CPU 0,5
 
So jetzt laufen 8

CPU unverändert. Jedoch springt die Auslastung teilweise auf 97%.
GPU zwischen 64 und 66%.
Also irgendwie glaube ich, die App hat noch einigen Optimierungsbedarf. Anders kann ich mir den geringen Auslastungszuwachs nicht erklären.

CPU 0,75 GPU 0,12

EDIT:
Die WUs laufen nun etwas langsamer schätze 2 h 30 für ein 8er Paket
 
Zuletzt bearbeitet:
Sorry wenn ich das frage aber wie muss ich die xml so einstellen, dass ich 4 wus auf der GPU rechne?
Ich habe einen X4 und eine HD5770, was wäre dafür eigentlich die optimale Einstellung?
 
Zuletzt bearbeitet:
Meine app_info.xml erklärt


<app_info>

<app>
<name>poemcl</name>
<user_friendly_name>POEM++ OpenCL</user_friendly_name>
</app>

<file_info>
<name>poemcl_0.1_windows_intelx86__opencl_ati_100</name>
<executable/>
</file_info>

<app_version>
<app_name>poemcl</app_name>
<version_num>1</version_num>
<plan_class>opencl_ati_100</plan_class>
<avg_ncpus>0.75</avg_ncpus>
<max_ncpus>0.75</max_ncpus>

<flops>2.1e10</flops>
<coproc>
<type>ATI</type>
<count>0.12</count>

</coproc>
<cmdline></cmdline>
<file_ref>
<file_name>poemcl_0.1_windows_intelx86__opencl_ati_100</file_name>
<main_program/>
</file_ref>
</app_version>

</app_info>

ncpus sagt boinc wieviele cpus er pro WU nehmen darf. Also 0.75 bei 6 Kernen und 8 WUs.
ATI count gibt an wieviele WUs er auf die Karte packt. In meinem Fall sind es 8. Daher pro WU ein Achtel = 0.12(5). Immer auf 2 Stellen genau und bitte immer abrunden, weil BOINC auf 0.13 aufrundet und nur 7 WUs ausgeführt werden. (100/12 = 8,3; 100/13=7,7)

Für einen X4 und eine 5770 würden glaube ich 4 optimal sein:
In deinem Fall daher
ncpus jeweils auf 1
und bei ATi count auf 0.25
d.h. pro Viertel-GPU nimmt er einen Thread zum füttern. Sollte wenn ich die Ergebnisse von Makso richtig interpretiere eine Laufzeit von ca. 2 Stunden pro 4er Paket ergeben.
Habs mal für Dich gemacht:
<app_info>

<app>
<name>poemcl</name>
<user_friendly_name>POEM++ OpenCL</user_friendly_name>
</app>

<file_info>
<name>poemcl_0.1_windows_intelx86__opencl_ati_100</name>
<executable/>
</file_info>

<app_version>
<app_name>poemcl</app_name>
<version_num>1</version_num>
<plan_class>opencl_ati_100</plan_class>
<avg_ncpus>1</avg_ncpus>
<max_ncpus>1</max_ncpus>
<flops>2.1e10</flops>
<coproc>
<type>ATI</type>
<count>0.25</count>
</coproc>
<cmdline></cmdline>
<file_ref>
<file_name>poemcl_0.1_windows_intelx86__opencl_ati_100</file_name>
<main_program/>
</file_ref>
</app_version>

</app_info>

Das speicherst Du bitte als app_info.xml in C:\ProgramData\BOINC\projects\boinc.fzk.de_poem

Ich hoffe das hat Dir geholfen

lg pollux
 
Zuletzt bearbeitet:
Ist der Wert für die CPUs unbedingt auf 1 gesetzt nicht besser ihn auf 0,5 zu setzen?
 
0,5 reicht auch.
Hab es auch bei so jetzt eingestellt und merke keinen Unterschied.
Gruß
 
Mir ist beim Experimentieren aufgefallen, dass wenn die OpenCL App nicht genug CPU bekommt, die Performance ziemlich stark einbricht. Ich habe deswegen versucht ihm so viel CPU-Leistung wie möglich zu lassen. Ich galube, die App gehört noch etwas optmiert (siehe oben). Dann wird sie vielleicht so wie Collatz mit 0.01 CPUs auskommen. Aber die POEM-CL Anwendung steckt ja noch in den Kinderschuhen deswegen bin ich recht zuversichtlich was zukünftige Leistungs-/Effizeinzsteigerungen angeht.
 
Zuletzt bearbeitet:
Also Ich hab kein Bock mehr auf Poem. Sauer erarbeitete CPU-Credits sind fürn Arsch! Und ich hab echt mal schwer keine Lust ein Fernstudium zu machen nur nur eine GPU zum rechnen zu bringen.

uglyaldi.gif
 
Zuletzt bearbeitet:
@MrBad

Ich versteh dich, aber man kann ja nichts dagegen machen. Nur hoffen das die CPU & GPU Credits getrennt werden!
 
Eine Petition muss her ;)
 
Naja, bei den anderen Projekten ist das doch auch so, dass nach einführung einer GPU-App die CPU-Credits relativ wertlos werden. Dann geht man halt mit und steigt auf GPU um und alles ist prima (siehe Milkyway). Ich hab z.B. bei Poem ca. 100k Credits mit der CPU berechnet (davon ca. 55k mit nem Core 2 Duo). Hab dann aber aufgehört, weil die GPU-App für die nahe Zukunft angekündigt war. Ist insgesamt nix weltbewegens, sondern eher der Lauf der Dinge wie ich finde. Es gibt ja genug CPU-Projekte, denen man sich zuwenden kann.

Ich finde es jedenfalls gut, dass es ein wirklich sinnvolles GPU-Projekt gibt. Das werde ich verstärkt rechnen.
 
Zuletzt bearbeitet:
Hier mal meine Zeiten:
2:16:30 für 8 WUs bei 1 CPU-Core/WU.
FX-8150: ~25-55% Auslastung
HD 5870: ~65% Auslastung und ~45°C
8GB RAM, davon 2,6GB ausgelastet
dezente 290 Watt ;D

Gruß,
Ritschie
 
Graka nimmt er die dedizierte mit 160SE und nicht die vom iGP vom Llano die hat nämlich 320SE.

Im BOINC-Hauptverzeichnis (üblicherweise C:\ProgramData\BOINC) eine Datei mit Namen cc_config.xml erstellen.

Folgendes reinschreiben:
Code:
<cc_config>
   <options>
       <use_all_gpus>1</use_all_gpus>
   </options>
</cc_config>

Jetzt sollten Beide genutzt werden.
 
@Ishtel

Danek werde es ausprobieren!
 
Nun will ich auch meine HD4670 auf POEM loslassen. Ich habe Win 7 x64, BOINC 7.0.3, und Catalyst 11.11 installiert. Die WUs resetten nach einigen Sekunden und die Laufzeit beginnt wieder bei 0 Sekunden. Fehlt noch irgend etwas?
 
@camo
Hab genau das gleiche Problem wie du! Komme auch nicht drauf woran es liegt!

@Ishtel

Danke nochmals funktioniert einwandfrei.
Gruß
 
ich bin mit der 4800er zurück zu 11.10 gegangen und hab keinerlei probleme mehr diezbezüglich.
 
@ camo und Makso

Meine HD 4890 wollte auch nicht. Ich kann mir nur vorstellen, dass es daran liegt, dass die HD 4000 Serie nicht für OpenCL ausgelegt war und der Support nur über teilweise Emulation der local memory in der global memory erreicht wurde.

holomatix,
This is entirely dependent on how you coded the kernel and what OpenCL features you are using. There are known performance issues for HD4XXX series of cards on OpenCL and there is currently no plan to focus exclusively on improving performance for that family. The HD4XXX series was not designed for OpenCL whereas the HD5XXX series was. There will be performance improvements on this series because of improvements in the HD5XXX series, so it will get better, but it is not our focus.

For example, if you are using local memory, they are all currently emulated in global memory. So it is possible you are going out to main memory twice as often as you do on NVidia. This can cause a fairly large performance hit if the application is memory bound. On the HD5XXX series, local memory is mapped to hardware local and thus is many times faster than the HD4XXX series.

Quelle: http://forums.amd.com/devforum/messageview.cfm?catid=390&threadid=123857

Ist aber nur eine Vermutung
 
ich bin mit der 4800er zurück zu 11.10 gegangen und hab keinerlei probleme mehr diezbezüglich.

Mit dem 11.10 ändert sich bei mir nichts, die ständigen Neustarts bleiben.

@ camo und Makso

Meine HD 4890 wollte auch nicht. Ich kann mir nur vorstellen, dass es daran liegt, dass die HD 4000 Serie nicht für OpenCL ausgelegt war und der Support nur über teilweise Emulation der local memory in der global memory erreicht wurde.
[...]
Ist aber nur eine Vermutung

Hm schade, ne neue Graka kommt mir erst in den Rechner, wenn mich die kommende Mittelklasse der neuen 7er-Reihe überzeugt. *noahnung*
 
An die Posts von gestern anschließend, möchte ich noch eine Übersicht der Laufzeiten posten:

1 WU mit 1.00 CPUs Kern 44 min
4 WUs mit 1.00 CPUs 1h 20min
8 WUs mit 0.75 CPUs 2 h 26 min

Alles bei 250 Watt an der Dose.
 
@ camo und Makso

Meine HD 4890 wollte auch nicht. Ich kann mir nur vorstellen, dass es daran liegt, dass die HD 4000 Serie nicht für OpenCL ausgelegt war und der Support nur über teilweise Emulation der local memory in der global memory erreicht wurde.

...

Ist aber nur eine Vermutung

Meine ATi 4770 funktioniert jetzt 'eigentlich' ganz gut..
Das einzige was mich eben 'eigentlich' stört ist, daß der Bonicmanager sich erst dann neue WUs holt, wenn das oder die bearbeiteten Projekte soweit fertig sind, daß auf einmal ein Kern arbeitslos werden würde.. davor ist er nicht dazu zu bringen, sich welche zu holen. 10 min später, wenn also ein Kern arbeitslos wird, holt er sich - z.B. im Falle von Docking endlich mal wieder ca 60 WUs.. die eben diese 10 min davor nicht benötigt wurden.. *noahnung*

Die ATi arbeitet genauso.. für mich scheint das ein 7.0.3-Bug zu sein.. oder irre ich mich? Jedenfalls arbeitet meine HD4770 ohne Probleme.. die OpenCL-Treiber gibts offiziell auch auf der AMD-Seite für die HD4000-Reihe
 
Zurück
Oben Unten