Im folgenden sind 20 kostenlose Bücher zur Datenanalyse und Datenauswertung verknüpft, die Anfängern und Fortgeschrittenen helfen, sich in das maschinelle Lernen einzuarbeiten. Alle Bücher sind auf Englisch. Manche der Bücher liegen als PDF vor, andere wiederum lassen sich auf ihrer jeweiligen Web-Seite lesen. Nicht alle Werke richten sich an Anfänger, aber bei 20 unterschiedlichen Links sollte für jede und jeden etwas dabei sein.
Die Themen reichen von Machine Learning über explorativer Datenanalyse bis hin zur Datenauswertung mit Big Data im Unternehmensumfeld. Viele Bücher sind dabei im Hinblick auf den praktischen Einsatz der vorgestellten Techniken in Algorithmen verfasst. Es gibt allerdings auch mehrere Werke, die für einen theoretischen Unterbau der Datenauswertung sorgen. Dabei verwenden die praktischen Exemplare nicht immer Python als Programmiersprache, sondern auch R.
Die Bücher sind in zwei Kategorien unterteilt: Die ersten Werke richten sich eher an Einsteiger ins Machine Learning. Aus den Büchern der zweiten Kategorie werden eher Menschen einen Nutzen ziehen, die sich bereits mit Machine Learning beschäftigt haben und nun weiterführende Informationen suchen.
I. Für Anfänger geeignet
1. An Introduction to Statistical Learning: with Applications in R
Wie der Titel bereits andeutet wird hier mit der Programmiersprache R eine Einführung ins statistische Lernen gezeigt. Vorgeführt wird die explorative Datenanalyse am Beispiel großer Datenmengen.
- Data Science for Business: What you need to know about data mining and data-analytic thinking [Link derzeit defekt]
Verschiedene Datenauswertungsansätze werden hier in der Praxis gezeigt, wobei auch der theoretische Unterbau nicht zu kurz kommt. Richtet sich an Anfänger und Fortgeschrittene.
3. Data Mining: Practical Machine Learning Tools and Techniques
Eine sehr gute Einführung in die Praxis des maschinellen Lernens. Hier werden mit echten Daten die Werkzeuge eingesetzt, mit denen man von A bis Z Ordnung in die Datenmassen bringen kann.
4. Machine Learning – Wikipedia Guide
Die allseits bekannte Wikipedia bietet eine tolle Einführung in Machine Learning. Hier finden sowohl Anfänger als auch Fortgeschrittene nützliche Tipps.
5. An Introduction to Data Science
Die US-amerikanische Universität Syracuse bietet hiermit insbesondere für Anfänger einen Einstieg in die wichtigsten Aspekte der Datenanalyse.
6. Introduction to Machine Learning
Ein sehr klares Buch, das sich in erster Linie an Anfänger richtet und die Vielzahl der Ansätze und Algorithmen des Machine Learning vorstellt.
7. Introduction to Python for Computational Science and Engineering (A beginner’s guide)
Mehr als die Datenanalyse steht hier der Umgang mit der Programmiersprache Python im Zusammenhang mit der Datenauswertung im Vordergrund. Wie bereits der Titel klarstellt, handelt es sich hier um ein Werk für Einsteiger – das ideale Buch, um mit Python und Machine Learning zu beginnen.
II. Eher für Fortgeschrittene geeignet
1. Modeling With Data
In diesem Buch stehen insbesondere die Werkzeuge im Fokus, die bei der Analyse großer Datenmengen eingesetzt werden können.
2. Data Mining and Analysis: Fundamental Concepts and Algorithms
Auch hier stehen Theorie und Praxis nebeneinander: Der Leser erfährt Grundsätzliches über die Ideen und Konzepte der explorativen Datenanalyse und der Datenauswertung.
3. Probabilistic Programming & Bayesian Methods for Hackers
Dank dieses Buchs erfährt man von Möglichkeiten, sehr komplexe Probleme mit Hilfe von Bayes-Netzwerken zu lösen. Zusätzlich lernt man den Einsatz von Python bei der Implementierung der Lösungsansätze.
4. The Elements of Statistical Learning: Data Mining, Inference, and Prediction
Die Basis von Machine Learning liegt in der Statistik, daher liegt es nahe, sich mit der Rolle der Statistik bei der automatisierten Datenanalyse und Datenauswertung zu beschäftigen.
5. Mining of Massive Datasets
Hier erlernen Leserinnen und Leser das Wissen und Methoden mit sehr großen Datenmengen umzugehen. Auch der Einsatz von Datenbanken beim Verarbeiten der Daten steht hier im Fokus.
6. A Programmer’s Guide to Data Mining
Gerade Menschen aus der Praxis werden hier fündig: Das Buch betrachtet die Datenanalyse aus der Sicht der Programmierung. An verschiedenen praktischen Beispielen werden Methoden gezeigt und geübt, die bei der Datenauswertung helfen.
7. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery
Der richtige Umgang mit Daten will gelernt sein, und dieses Buch hat sich zur Aufgabe gemacht, die Leserschaft darüber zu informieren. Im Mittelpunkt stehen praktische Ansätze mit der Programmiersprache R und der darauf aufsetzenden grafischen Oberfläche Rattle. Rattle wird vielerorts in der Praxis verwendet, um schnell zu Ergebnissen bei vorhandenem Datenmaterial zu kommen. Insbesondere in der Lehre findet es häufigen Einsatz.
8. Machine Learning, Neural and Statistical Classification
Statistische Methoden beim Einsatz verschiedener Machine-Learning-Techniken bilden den Hauptaspekt dieses Buchs. Ein Blick hinein lohnt sich.
9. Information Theory, Inference, and Learning Algorithms
Im maschinellen Lernen kommt häufig das Wesen des Lernens zu kurz. Diese Lücke schließt dieses Buch und beleuchtet das Lernen selbst. Dabei hat auch das Praktische der Datenauswertung seinen Platz. Ein im Bereich der Machine-Learning-Literatur außergewöhnlicher Blickwinkel.
10. Machine Learning
Hier werden verschiedene Machine-Learning-Methoden vorgestellt, die sich kapitelweise als PDF laden lassen. Dabei erstrecken sich die Themen von Informationstheorie über E-Mail-Sicherheit bis hin zu linguistischen Untersuchungen. Fortgeschrittene werden hier fündig.
11. Think Bayes, Bayesian Statistics Made Simple
In diesem Buch nimmt die Programmiersprache Python wieder Raum ein. Mit Python werden Beispiele aus dem echten Leben gezeigt und mit Simulationen werden Vorhersagetechniken ausprobiert.
12. Bayesian Reasoning and Machine Learning
Einmal mehr spielt Bayes eine große Rolle: Hier wird der Bayes-Ansatz im Machine Learning im Detail aufgezeigt und angewandt.
13. Gaussian Processes for Machine Learning
In der Statistik ist Gauss einer der großen Namen. Hinsichtlich Machine Learning spielen seine Wahrscheinlichkeitsrechnungen ebenfalls eine große Rolle. Dieses Buch liefert die dazugehörige Theorie, zeigt aber auch deutlich den Zusammenhang zu Machine Learning.