Projektnews MLC@Home : [TMIM Notes] July 1 2021 --- Celebrating 1 year of MLC@Home!

P3D-Bot

Bot von P3D
Mitglied seit
09.04.2006
Beiträge
47.067
Renomée
170
Standort
Das Boot 3.0
This Month in MLC@Home
Notes for July 1 2021
A monthly summary of news and notes for MLC@Home

Summary
Happy first birthday to MLC@Home! This project went live on July 1, 2020, and caught on pretty quickly in the BOINC community. We've remained focused on our goal, which is breaking open the black box of neural networks to explain why they make the choices they do. This is so important as machine learning permeates more and more of our everyday life; from autonomous cars, to banking decisions, and medical diagnoses. We need research to understand how to keep bias out of these systems.

We are also the first, and to date only, public machine learning focused BOINC project. This means that while we could leverage the BOINC framework for job management, we have to build most of the ML client infrastructure from the ground up. This hasn't always been smooth, but we've accomplished so much in the past year regardless.

In the past year, we have:

  • Received contributions from over 2500+ volunteers and 9200+ hosts
  • Processed over 3.4 million BOINC workunits
  • Trained over 1.1 million neural networks for analysis over 3 different datasets, the largest datasets of their kind
  • Generated over 4.3TB of data for analysis
  • Published one academic paper (more coming..)
  • Presented at the 2021 BOINC Workshop
  • Released 47 client versions targeting 3 different CPU architectures, 2 GPU architectures, and multiple versions of Windows and Liunx.
  • Outgrew the initial server within the first few months!



  • I'm overwhelmed by our community and what we've accomplished together. We've already shown that networks trained with the same data cluster together in weight space, despite the randomness associated with neural network training. We've also shown we can use this clustering to detect networks trained with poisoned data versus clean data, a significant finding in the field.

    But there's still soo much more to do! So while we want to acknowledge and celebrate what we've jointly accomplished so far, let's also look forward and set some loose goals for the next year of MLC@Home:
    • MLDS will continue near term!
      DS4 is (almost) ready and expands the dataset to include CNN network types as well as RNNs used in DS1-3. DS5 will likely vary the shape and size of each network slightly to see if clustering still happens when shape is varies. Future MLDS work beyond DS5 is TBD, but we expect there to be plenty DS4/DS5 WUs for many months to come. We expect to update the paper with the latest runs over the next month.

    • We'd like to expand beyond MLDS!
      We are the first project to do ML on a BOINC-sized scale. We would like to expand to supporting other areas of research, and want to commit to bringing at least one other ML project online within the next year. Please contact us if you are a researcher who is interested in working with the platform!

    • We need to improve the technical side of the project
      From the client supporting AMD GPUs and OSX to optimizing utilization of graphics cards to a better validation process for WUs, there's a laundry list of technical issues we'd like to address, and have not done so effectively in the past three months. We're also hitting some corner-cases of the BOINC software stack that are tricky to work around. If you are a developer and want to help, we'd welcome the support.

    • We'd like to improve outreach
      To get more people involved, we'd like to produce a few short videos about the project, what we've found and how others can help. These should be short, easily accessible, and easy to share. We'd like to produce at least one of these within the next 6 months.


    • These are loose goals but should give you an idea where we're concentrating our efforts for the next year. If you have further insights, please share them below or on Discord.

      Thanks again for supporting MLC@Home, and here to many more years of successful, important research in an important field.

      Other News
      • DS3 is all but complete (just a last few 130+ trickling in!). I consider DS3 to be the most important dataset and can't wait to run our analysis on the whole thing!
      • From now on we'll be blasting DS1 (then DS2) WUs into both the GPU and CPU queues until that completes and/or until DS4 is ready. We'll try to get those over the hump ASAP.
      • Some fun news! MLC Discord user Tankbuster has updated our banner graphic! See the updated banner on project and home pages!
      • Even more exciting, Tankbuster built a prototype graphics app for MLC@Home! You can see mockups and videos and follow the discussion at the MLC Discord server (link at the bottom). Screenshot:
      • Reminder: the MLC client is open source, and has an issues list at gitlab. If you're a programmer or data scientist and want to help, feel free to look over the issues and submit a pull request.



      • Project status snapshot:
        (note these numbers are approximations)

        project-summary-2021-07-01.png


        mlds-live-status-2021-07-01.png



        Last month's TMIM Notes: Jun 8 2021

        Thanks again to all our volunteers!

        -- The MLC@Home Admins(s)
        Homepage: https://www.mlcathome.org/
        Discord invite: https://discord.gg/BdE4PGpX2y
        Twitter: @MLCHome2

Lese weiter bei MLC@Home ....
 
Dieser Monat in MLC@Home
Notizen für den 1. Juli 2021
Eine monatliche Zusammenfassung von Nachrichten und Notizen für MLC@Home


Zusammenfassung

Alles Gute zum ersten Geburtstag für MLC@Home! Dieses Projekt ging am 1. Juli 2020 an den Start und hat sich in der BOINC-Community ziemlich schnell herumgesprochen. Wir haben uns auf unser Ziel konzentriert, die Blackbox der neuronalen Netze aufzubrechen, um zu erklären, warum sie die Entscheidungen treffen, die sie treffen. Das ist so wichtig, da maschinelles Lernen mehr und mehr in unseren Alltag eindringt; von autonomen Autos über Bankentscheidungen bis hin zu medizinischen Diagnosen. Wir brauchen Forschung, um zu verstehen, wie man Verzerrungen aus diesen Systemen heraushalten kann.

Wir sind auch das erste und bisher einzige öffentliche BOINC-Projekt, das sich auf maschinelles Lernen konzentriert. Das bedeutet, dass wir zwar das BOINC-Framework für das Job-Management nutzen können, aber den Großteil der ML-Client-Infrastruktur von Grund auf neu aufbauen müssen. Das war nicht immer reibungslos, aber wir haben im letzten Jahr trotzdem viel erreicht.

Im vergangenen Jahr haben wir:

  • Beiträge von über 2500+ Freiwilligen und 9200+ Hosts erhalten
  • Über 3,4 Millionen BOINC-Workunits verarbeitet
  • Über 1,1 Millionen neuronale Netze für die Analyse von 3 verschiedenen Datensätzen trainiert, die größten Datensätze ihrer Art
  • Generierung von über 4,3 TB an Daten für die Analyse
  • Ein akademisches Paper veröffentlicht (mehr dazu in Kürze...)
  • Präsentiert auf dem BOINC-Workshop 2021
  • Veröffentlicht 47 Client-Versionen für 3 verschiedene CPU-Architekturen, 2 GPU-Architekturen und mehrere Versionen von Windows und Liunx.
  • Der anfängliche Server wuchs innerhalb der ersten Monate über sich hinaus!


Ich bin überwältigt von unserer Community und dem, was wir gemeinsam erreicht haben. Wir haben bereits gezeigt, dass Netzwerke, die mit denselben Daten trainiert wurden, im Gewichtsraum zusammen clustern, trotz der Zufälligkeit, die mit dem Training neuronaler Netzwerke verbunden ist. Wir haben auch gezeigt, dass wir dieses Clustering nutzen können, um Netzwerke zu erkennen, die mit vergifteten Daten im Vergleich zu sauberen Daten trainiert wurden - eine wichtige Erkenntnis auf diesem Gebiet.

Aber es gibt noch soo viel mehr zu tun! Während wir also anerkennen und feiern wollen, was wir bisher gemeinsam erreicht haben, lassen Sie uns auch nach vorne schauen und einige lockere Ziele für das nächste Jahr von MLC@Home setzen:
MLDS wird kurzfristig fortgesetzt!
DS4 ist (fast) fertig und erweitert den Datensatz um CNN-Netzwerktypen sowie um die in DS1-3 verwendeten RNNs. DS5 wird wahrscheinlich die Form und Größe jedes Netzwerks leicht variieren, um zu sehen, ob das Clustering immer noch stattfindet, wenn die Form variiert wird. Zukünftige MLDS-Arbeiten jenseits von DS5 sind noch offen, aber wir erwarten, dass es in den nächsten Monaten noch viele DS4/DS5-WUs geben wird. Wir erwarten, dass wir das Papier im Laufe des nächsten Monats mit den neuesten Läufen aktualisieren werden.
Wir würden gerne über MLDS hinaus expandieren!
Wir sind das erste Projekt, das ML in einem BOINC-Maßstab durchführt. Wir würden gerne expandieren, um andere Forschungsbereiche zu unterstützen, und wollen uns verpflichten, mindestens ein weiteres ML-Projekt innerhalb des nächsten Jahres online zu bringen. Bitte kontaktieren Sie uns, wenn Sie ein Forscher sind, der an der Arbeit mit der Plattform interessiert ist!
Wir müssen die technische Seite des Projekts verbessern
Vom Client, der AMD-GPUs und OSX unterstützt, über die Optimierung der Auslastung von Grafikkarten bis hin zu einem besseren Validierungsprozess für WUs gibt es eine lange Liste von technischen Problemen, die wir gerne angehen würden und in den letzten drei Monaten nicht effektiv gelöst haben. Wir stoßen auch auf einige Ecken des BOINC-Software-Stacks, die schwierig zu umgehen sind. Wenn Sie ein Entwickler sind und helfen wollen, würden wir uns über Unterstützung freuen.
Wir würden gerne die Reichweite verbessern
Um mehr Leute zu involvieren, würden wir gerne ein paar kurze Videos über das Projekt produzieren, was wir gefunden haben und wie andere helfen können. Diese sollten kurz, leicht zugänglich und einfach zu teilen sein. Wir würden gerne mindestens eines davon innerhalb der nächsten 6 Monate produzieren.

Dies sind lose Ziele, aber sie sollten Ihnen eine Vorstellung davon geben, worauf wir unsere Bemühungen für das nächste Jahr konzentrieren werden. Wenn Sie weitere Erkenntnisse haben, teilen Sie diese bitte unten oder auf Discord mit.

Nochmals vielen Dank für die Unterstützung von MLC@Home, und auf viele weitere Jahre erfolgreicher, wichtiger Forschung in einem wichtigen Bereich.

Andere Neuigkeiten
  • DS3 ist so gut wie fertig (nur noch ein paar letzte 130+ rieseln herein!). Ich halte DS3 für den wichtigsten Datensatz und kann es kaum erwarten, unsere Analysen mit dem ganzen Ding durchzuführen!
  • Von nun an werden wir DS1 (und dann DS2) WUs sowohl in die GPU- als auch in die CPU-Warteschlange schießen, bis das fertig ist und/oder bis DS4 fertig ist. Wir werden versuchen, diese so schnell wie möglich über den Haufen zu werfen.
  • Einige lustige Neuigkeiten! Der MLC-Discord-Benutzer Tankbuster hat unsere Bannergrafik aktualisiert! Sehen Sie das aktualisierte Banner auf den Projekt- und Home-Seiten!
  • Noch aufregender ist, dass Tankbuster einen Prototyp einer Grafik-App für MLC@Home gebaut hat! Sie können Mockups und Videos sehen und die Diskussion auf dem MLC-Discord-Server verfolgen (Link ganz unten).

Screenshot:


  • Zur Erinnerung: der MLC-Client ist Open Source und hat eine Issues-Liste bei gitlab. Wenn Sie ein Programmierer oder Datenwissenschaftler sind und helfen wollen, können Sie sich die Probleme ansehen und einen Pull-Request einreichen.



  • Project status snapshot:
(note these numbers are approximations)

project-summary-2021-07-01.png


mlds-live-status-2021-07-01.png



TMIM-Notizen des letzten Monats: Jun 8 2021


Nochmals vielen Dank an alle unsere Freiwilligen!

-- The MLC@Home Admins(s)
Homepage: https://www.mlcathome.org/
Discord invite: https://discord.gg/BdE4PGpX2y
Twitter: @MLCHome2

Lese weiter bei MLC@Home ....

Übersetzt mit www.DeepL.com/Translator (kostenlose Version)
 
Zurück
Oben Unten