News SETI.Germany : MLC@Home: einjähriges Jubiläum

P3D-Bot

Redaktion
☆☆☆☆☆☆
★ Themenstarter ★
Mitglied seit
09.04.2006
Beiträge
17.726
Renomée
110
Standort
Das Boot 3.0
In der letzten Woche wurde MLC@Home ein Jahr alt. Zu diesem Anlass seien die (inzwischen monatlich erscheinenden) Notizen des Projektadministrators übersetzt, die eine Zusammenfassung des bisher Erreichten und der Pläne für das nächste Jahr beinhalten:

[TMIM Notes] 1. Juli 2021 --- einjähriges Jubiläum von MLC@Home!
This Month in MLC@Home

Notizen vom 1. Juli 2021
Eine monatliche Zusammenfassung von Neuigkeiten und Notizen zu MLC@Home

Zusammenfassung
Alles Gute zum ersten Geburtstag, MLC@Home! Dieses Projekt startete am 1. Juli 2020 und hat in der BOINC-Gemeinschaft schnell Fuß gefasst. Wir haben uns auf unser Ziel konzentriert, nämlich die Black Box der neuronalen Netzwerke aufzubrechen, um zu erklären, warum sie Entscheidungen so treffen, wie sie es tun. Das ist so wichtig, weil maschinelles Lernen mehr und mehr in unseren Alltag vordringt; von autonomen Autos über Entscheidungen von Banken bis zu medizinischen Diagnosen. Wir müssen forschen, um zu verstehen, wie wir Verzerrungen aus diesen Systemen heraushalten.

Wir sind auch das erste und bisher einzige öffentliche BOINC-Projekt mit Fokus auf maschinelles Lernen (ML). Das bedeutet, dass wir zwar BOINC zur Aufgabenverwaltung nutzen konnten, aber das meiste der ML-Anwendungsinfrastruktur von Grund auf aufbauen müssen. Das lief nicht immer glatt, aber wir haben dennoch viel im letzten Jahr erreicht.

Im letzten Jahr haben wir:
  • Unterstützung von mehr als 2500 Freiwilligen mit mehr als 9200 Rechnern erhalten
  • über 3,4 Millionen BOINC-WUs bearbeitet
  • über 1,1 Millionen neuronale Netzwerke zur Analyse dreier verschiedener Datensätze trainiert, welche die größten Datensätze ihrer Art sind
  • mehr als 4,3 TB Daten zur Auswertung erzeugt
  • einen Fachartikel veröffentlicht (weitere folgen...)
  • beim BOINC Workshop 2021 vorgetragen
  • 47 Anwendungsversionen für drei verschiedene CPU- und zwei GPU-Architekturen sowie mehrere Versionen von Windows und Linux veröffentlicht
  • innerhalb der ersten paar Monate die Kapazitäten des ursprünglichen Servers überschritten!


Ich bin überwältigt von unserer Gemeinschaft und dem, was wir gemeinsam erreicht haben. Wir haben schon gezeigt, dass mit denselben Daten trainierte Netzwerke im Gewichtsraum eine Ballung zeigen, trotz der Zufälligkeit beim Trainieren neuronaler Netzwerke. Wir haben auch gezeigt, dass wir diese Ballungen nutzen können, um Netzwerke zu finden, die mit vergifteten statt sauberen Daten trainiert wurden; eine wichtige Entdeckung in diesem Forschungsgebiet.

Aber es gibt noch soo viel mehr zu tun! Daher lasst uns, während wir anerkennen und feiern wollen, was wir bisher gemeinsam erreicht haben, auch nach vorne schauen und einige lose Ziele für das nächste Jahr bei MLC@Home setzen:

  • MLDS wird kurzfristig weitergehen!
    Der vierte Datensatz (DS4) ist (fast) fertig und erweitert den Datensatz um gefaltete neuronale Netzwerktypen (engl. Convolutional Neural Network, CNN) zusätzlich zu rückgekoppelten neuronalen Netzwerken (engl. Recurrent Neural Network, RNN), die in DS1-3 verwendet werden. DS5 wird wahrscheinlich leicht die Form und Größe jedes Netzwerks variieren, um zu sehen, ob es auch zu Ballungen kommt, wenn die Form variiert. Zukünftige MLDS-Arbeit über DS5 hinaus steht noch nicht fest, aber wir gehen davon aus, dass es viele DS4/DS5-WUs für viele Monate geben wird. Wir planen, den Artikel im nächsten Monat mit den neuesten Durchläufen zu aktualisieren.

  • Wir möchten über MLDS hinaus expandieren!
    Wir sind das erste Projekt, das ML in BOINC-Größenordnung durchführt. Wir möchten auch andere Forschungsbereiche unterstützen und uns festlegen, mindestens ein weiteres ML-Projekt innerhalb des nächsten Jahres ans Netz zu bringen. Bitte kontaktiert uns, wenn ihr eine Forscherin seid, die daran interessiert ist, mit der Plattform zu arbeiten!

  • Wir müssen die technische Seite des Projekts verbessern
    Von der Unterstützung von AMD-GPUs und macOS über Optimierung der Auslastung von Grafikkarten bis zu einem besseren Validierungsvorgang für die WUs gibt es eine lange Liste technischer Angelegenheiten, an denen wir arbeiten möchten, dies aber in den letzten drei Monaten nicht effektiv getan haben. Wir stoßen auch auf einige seltene Probleme der BOINC-Software, die schwer zu umschiffen sind. Falls ihr Entwickler seid und helfen möchtet, würden wir die Unterstützung sehr begrüßen.

  • Wir möchten unsere Reichweite verbessern
    Um mehr Leute zur Teilnahme zu bewegen, möchten wir einige kurze Videos über das Projekt, was wir gefunden haben und wie andere helfen können, erstellen. Diese sollten kurz, einfach zugänglich und einfach zu teilen sein. Wir möchten wenigstens eins davon in den nächsten 6 Monaten erstellen.


Dies sind lose Ziele, aber sie sollten euch eine Idee vermitteln, worauf wir unsere Arbeiten im nächsten Jahr konzentrieren werden. Wenn ihr weitere Hinweise habt, teilt sie bitte hier oder auf Discord.

Danke nochmal für die Unterstützung von MLC@Home und auf viele weitere Jahre erfolgreicher, wichtiger Forschung auf einem wichtigen Gebiet.

Weitere Neuigkeiten
  • DS3 ist fast abgeschlossen (nur noch die letzten gut 130 WUs tröpfeln ein!). Ich sehe DS3 als den wichtigsten Datensatz an und kann es nicht erwarten, die Auswertung des ganzen Datensatzes laufen zu lassen!
  • Von jetzt an werden wir DS1- (und danach DS2-)WUs in die Warteschlangen für sowohl GPUs als auch CPUs hauen, bis diese abgeschlossen sind und/oder DS4 fertig vorbereitet ist. Wir werden versuchen, diese schnellstmöglich über den Berg zu bringen.
  • Eine frohe Nachricht! Der MLC-Discord-Teilnehmer Tankbuster hat unsere Bannergrafik aktualisiert! Ihr könnt das aktualisierte Banner auf den Projektseiten und der Startseite sehen!
  • Noch spannender: Tankbuster hat einen Prototypen für eine Grafikausgabe von MLC@Home erstellt! Auf dem MLC-Discord-Server (Link am Ende der Nachricht) könnt ihr Entwürfe und Videos sehen und die Diskussion darüber verfolgen. Screenshot:
    mlcgraphics.png
  • Zur Erinnerung: die MLC-Anwendung ist quelloffen und hat eine Liste offener Probleme auf gitlab. Falls ihr Programmierer oder Datenwissenschaftlerinnen seid und helfen möchtet, seid ihr eingeladen, einen Blick auf die Probleme zu werfen und Änderungsvorschläge einzureichen.


Momentaufnahme des Projektstatus:
(diese Zahlen sind Näherungen)
project-summary-2021-07-01.png

mlds-live-status-2021-07-01.png


Letzte Ausgabe der TMIM Notes: 08.06.2021 (engl.)

Nochmals vielen Dank allen unseren Freiwilligen!

-- Der/die MLC@Home-Admin(s)
Homepage: https://www.mlcathome.org/
Einladung zu Discord: https://discord.gg/BdE4PGpX2y
Twitter: @MLCHome2
02.07.2021, 2:40:09 MEZ


Originaltext:
https://www.mlcathome.org/mlcathome/...ead.php?id=212

Lese weiter bei SETI.Germany....
 
Oben Unten