Ein gutes Ergebnis auf Basis von Machine-Learning-Modellen steht und fällt mit der Qualität der zur Verfügung stehenden Daten. Im Folgenden finden sich einige praktische Probleme, die im Alltag beim Einsatz von Machine Learning auftreten.
Unvollständige Daten
Es ist weder ungewöhnlich noch unwahrscheinlich, dass bei einer Menge von tausenden Datenerhebungen einige Werte fehlen oder offensichtlich fehlerhaft sind. Beispielsweise lassen manche Teilnehmerinnen und Teilnehmer einer Befragung das Feld für das „Einkommen“ oder das „Alter“ leer. Oder es gibt Missverständnisse beim Ausfüllen eines Befragungsbogens, so dass im Feld „Alter“ beispielsweise „Hannover“ steht, weil die befragte Person beim Ausfüllen in der Zeile verrutscht ist. „Was sind praktische Probleme von Machine Learning?“ weiterlesen