Was sind praktische Probleme von Machine Learning?

Ein gutes Ergebnis auf Basis von Machine-Learning-Modellen steht und fällt mit der Qualität der zur Verfügung stehenden Daten. Im Folgenden finden sich einige praktische Probleme, die im Alltag beim Einsatz von Machine Learning auftreten.

Unvollständige Daten

Es ist weder ungewöhnlich noch unwahrscheinlich, dass bei einer Menge von tausenden Datenerhebungen einige Werte fehlen oder offensichtlich fehlerhaft sind. Beispielsweise lassen manche Teilnehmerinnen und Teilnehmer einer Befragung das Feld für das „Einkommen“ oder das „Alter“ leer. Oder es gibt Missverständnisse beim Ausfüllen eines Befragungsbogens, so dass im Feld „Alter“ beispielsweise „Hannover“ steht, weil die befragte Person beim Ausfüllen in der Zeile verrutscht ist. „Was sind praktische Probleme von Machine Learning?“ weiterlesen

Was sind grundsätzliche Probleme von Machine Learning?

Schauen wir uns einmal das Diagramm oben an.

Die Zahl der Störche steigt, die Zahl der geborenen Kinder ebenfalls. In manchen Jahren fällt die Zahl der gesichteten Störche allerdings und die Zahl der geborenen Kinder sinkt in diesen Zeiträumen proportional.

Schaut man sich die Daten an, so ist alles korrekt: Die Zahlen stimmen, die Zuordnung zu den Jahren ist auch richtig. Kein Zweifel: Unser Diagramm zeigt deutlich einen Zusammenhang zwischen der Zahl der Geburten und der Anzahl der Störche. Stimmt es also doch? Bringen Störche die Kinder? Natürlich nicht. „Was sind grundsätzliche Probleme von Machine Learning?“ weiterlesen