Wie wäre es, wenn man auf fast 100 fertig eingerichtete und einsatzbereite Machine-Learning-Instanzen als Beispiele zum Herumprobieren und Forschen zur Verfügung hätte? Klingt gut? Genau das bietet Google mit seinem Projekt Seedbank unter dem Namen Collection of Interactive Machine Learning Examples an. Schauen wir uns an, was es da so gibt und wie man da loslegen kann.
Das, was die Google-Ingenieure einen Seed nennen bezeichnet ein Machine-Learning-Beispiel, das bereits fertig eingerichtet ist, so dass eine Anwenderin oder ein Anwender einfach anfangen kann. 90 dieser Seeds stehen bereit und decken dabei unterschiedliche Themenfelder ab: Bilder und Filme, Klänge und Musik, Text und Sprache, aber auch unterschiedliche maschinelle Herangehensweisen wie unbeaufsichtigtes maschinelles Lernen (Unsupervised) oder Klassifizierung und weitere stehen zur Verfügung. Um den Überblick nicht zu verlieren, kann man Filter verwenden, die die Ergebnismenge entsprechend einschränken.
Interessant ist das Ganze, wenn man nur eine vage Idee hat, wie das eigene Problem zu lösen sein könnte und man schnell viele verschiedene Ansätze ausprobieren möchte. Technisch basieren die Seeds auf der Jupyter-Umgebung, die von Google unter dem Namen Colaboratory zur Verfügung gestellt werden. Diese Umgebung läuft vollständig im Browser, so dass eine Anwenderin oder ein Anwender keinerlei Zusatzsoftware installieren oder konfigurieren muss. Die mit Colab erstellten Notizbücher werden im Google Drive gespeichert. Als Rechenknecht stellt Google kostenlos Grafikprozessoren bereit.
In einem eigenen Tutorial kann man als Neuling die Bedienung der Seedbank lernen. Hat man sich ein Beispiel ausgesucht, wählt man es aus und es öffnet sich in Colab. Damit es funktioniert müssen third-party cookies im Browser erlaubt sein. Die Beispiele sind ausführlich beschrieben und mit funktionierenden Code-Stellen versehen, die die Anwenderin oder der Anwender anpassen kann. Häufig wird das Ganze durch weiterführende Literatur abgerundet.