Google Landmarks: Riesiges Datenmaterial zur Bilderkennung für Machine Learning

Als Machine-Learning-Enthusiasten sind wir quasi immer auf der Suche nach Datenmaterial, das wir in unseren Experimenten der maschinellen Bilderkennung verwenden können. Mit Google Landmarks haben wir über vier Millionen Bilder zu Sehenswürdigkeiten weltweit zur Verfügung, die uns hilfreiche Erkenntnisse liefern können.

„Google Landmarks: Riesiges Datenmaterial zur Bilderkennung für Machine Learning“ weiterlesen

Was sind praktische Probleme von Machine Learning?

Ein gutes Ergebnis auf Basis von Machine-Learning-Modellen steht und fällt mit der Qualität der zur Verfügung stehenden Daten. Im Folgenden finden sich einige praktische Probleme, die im Alltag beim Einsatz von Machine Learning auftreten.

Unvollständige Daten

Es ist weder ungewöhnlich noch unwahrscheinlich, dass bei einer Menge von tausenden Datenerhebungen einige Werte fehlen oder offensichtlich fehlerhaft sind. Beispielsweise lassen manche Teilnehmerinnen und Teilnehmer einer Befragung das Feld für das „Einkommen“ oder das „Alter“ leer. Oder es gibt Missverständnisse beim Ausfüllen eines Befragungsbogens, so dass im Feld „Alter“ beispielsweise „Hannover“ steht, weil die befragte Person beim Ausfüllen in der Zeile verrutscht ist. „Was sind praktische Probleme von Machine Learning?“ weiterlesen