Lineare Regression ist ein Werkzeug, das wir verwenden, um zu verstehen, wie zwei Daten miteinander verbunden sind. Wir nehmen an, dass es eine lineare Beziehung zwischen ihnen gibt, was bedeutet, dass, wenn sich eine Sache ändert, die andere Sache in einer gleichbleibenden Art und Weise ändert.
„Lineare Regression: Verstehen, wie Dinge miteinander verbunden sind“ weiterlesenSchlagwort: Statistik
Altair statt Matplotlib als Visualisierungstool von Daten für Machine Learning in Python
Geht es um die Visualisierung von Daten, greifen wir schnell zum Matplotlib-Modul. Das ist auch in Ordnung, aber es gibt daneben weitere Visualisierungstools für die Darstellung von Daten für Machine Learning in Python. Eines davon ist Altair und das sehen wir uns hier genauer an.
„Altair statt Matplotlib als Visualisierungstool von Daten für Machine Learning in Python“ weiterlesenBuchempfehlungen: R lernen auf Deutsch
Hier nun eine Liste mit Büchern, mit denen man die insbesondere die für statistische Berechnungen geeignete Sprache R lernen kann. Das Besondere dieser Liste ist, dass die Bücher allesamt deutschsprachig sind.
R für Einsteiger: Einführung in die Statistiksoftware für die Sozialwissenschaften. Mit Online-Material
Dieses Buch ist eine gute Einführung in R, richtet sich aber in erster Linie an Psychologinnen sowie Psychologen und hat daher deren spezifische Ansprüche im Fokus. Daher ist das Buch etwas speziell, aber zum Erlernen der Sprache ist es dennoch empfehlenswert.
von Maike Luhmann (Autorin) | Verlagsgruppe Beltz | Preis: 34,95 EUR
Link zum Buch bei Amazon
Einführung in R: Ein Kochbuch zur statistischen Datenanalyse mit R
Der Begriff „Kochbuch“ ist hier tatsächlich Programm. Nicht in dem Sinne, dass etwas auf dem Herd zubereitet wird, sondern dass es um die Anwendung und die Praktik anhand von Anleitungen geht. Günter Faes fängt ganz am Anfang an, so dass man auch ohne Vorkenntnisse loslegen kann.
von Günter Faes (Autor) | Books On Demand | Preis: 25,50 EUR
Link zum Buch bei Amazon
Stochastik in den Ingenieurwissenschaften: Eine Einführung mit R (Statistik und ihre Anwendungen)
Die Wahrscheinlichkeitsrechnung und Statistik spielt in den Ingenieur- und Naturwissenschaften eine große Rolle und diese Rolle beleuchtet Christine Müller in ihrem Einführungswerk näher. Auch wenn die Einführung in R kurz gehalten ist, helfen die Übungsaufgaben, das Gelesene einzuüben.
von Christine Müller (Autorin) | Springer | Preis: 32,99 EUR
Link zum Buch bei Amazon
Statistik mit R: Eine praxisorientierte Einführung in R
Die Einführung in die statistische Arbeit mit R von Joachim Zuckarelli bietet einen umfassenden Überblick, bei dem die praktische Anwendung einen angemessenen Raum einnimmt. Neben den verschiedenen Analyse-Ansätzen geht der Autor auch auf die Präsentation der Ergebnisse ein.
von Joachim Zuckarelli (Autor) | O’Reilly | 32,90 EUR
Link zum Buch bei Amazon
Einführung in die Statistik mit R
Bei diesem Buch stehen die Wirtschafts- und Sozialwissenschaften an zentraler Stelle. Die beiden Autoren stellen statistische Methoden vor und zeigen deren Anwendung mithilfe von R. Dabei gehen sie über die Grundlagen hinaus und zeigen auch Ansätze zur Optimierung.
von Andreas Behr (Autor), Ulrich Pötter (Autor) | Franz Vahlen | 24,80 EUR
Link zum Buch bei Amazon
R in 10 Schritten: Einführung in die statistische Programmierumgebung
Einmal mehr steht die Anwendung der Statistik in der Psychologie im Vordergrund. Autor Rainer Alexandrowicz erklärt die Bedienung und die Programmierung von R. Bereits vorliegende Kenntnisse in der Statistik sind hier von Vorteil, wobei Abschnitte, in denen insbesondere auf die Hintergründe eingegangen wird, gekennzeichnet sind.
von Rainer Alexandrowicz (Autor) | UTB | 27,99 EUR
Link zum Buch bei Amazon
Angewandte Statistik: Methodensammlung mit R
Biowissenschaften und die Medizin hatten die beiden Autoren im Sinn, als sie dieses umfassende Werk zu R erstellt haben. Es bietet Studenten und Dozenten aber auch Praktikern anderer Richtungen notwendige Methoden zur gezielten und umsichtigen Datengewinnung. Es handelt sich hier um ein Standardwerk, das bereits in der 16. Auflage erschienen ist.
von Jürgen Hedderich (Autor), Lothar Sachs (Autor) | Springer | 59,99 EUR
Link zum Buch bei Amazon
Einführung in die nichtparametrische Statistik mit SAS und R: Ein anwendungsorientiertes Lehr- und Arbeitsbuch
Wer neben R auch einmal in andere Sprachen wie beispielsweise in SAS hineinschauen möchte, ist hier richtig. Die Autorin hat die verschiedenen statistischen Verfahren im Blick, zeigt dann auch deren Anwendung mit den beiden genannten Programmiersprachen. Grundkenntnisse der Statistik sind bei der Lektüre wünschenswert.
von Christine Duller (Autorin) | Springer | 34,99 EUR
Link zum Buch bei Amazon
Angewandte Statistik mit R: Eine Einführung für Ökonomen und Sozialwissenschaftler
Autor Reiner Hellbrück betrachtet R hierbei als Werkzeug für die Betriebswirtschaft. Insbesondere die Datenpflege und Aufbereitung spielt eine große Rolle, wobei der Autor hier zeigt, wie man in der Tabellenkalkulation die vorhandenen Daten sinnvoll bearbeitet, um mithilfe von R den maximalen Erkenntnisgewinn zu erzielen.
von Reiner Hellbrück (Autor) | Springer | 34,99 EUR
Link zum Buch bei Amazon
Statistikübungen für Bachelor- und Masterstudenten: Ein Arbeitsbuch mit einer Einführung in R
Für Interessierte in Statistik und ihre Anwendung steht dieses kompakte Übungsbuch bereit. Es bietet eine Reihe von Übungsaufgaben samt Lösungen und neben einer Formelsammlung auch Programmierbeispiele in R.
von Fred Böker (Autor), Stefan Sperlich (Mitwirkende), Walter Zucchini (Mitwirkende) | Springer | 32,99 EUR
Link zum Buch bei Amazon
Induktive Statistik: Eine Einführung mit R und SPSS
Die Statistik-Software SPSS und die Programmiersprache R sollen die Leserinnen und Leser hierbei lernen. Dabei dienen praxisnahe Beispiele, um die Konzepte der Datenverwaltung zu vermitteln. Abgerundet wird das Buch mit zahlreichen Übungsaufgaben und deren Lösungen.
von Helge Toutenburg (Autor) | Springer | 34,99 EUR
Link zum Buch bei Amazon
Mathematik für Ingenieure und Naturwissenschaftler: Lineare Algebra und Analysis in R
Für Studierende und Dozierende der Ingenieurs- und Naturwissenschaften bieten die beiden Autoren einen guten Zugang in die Mathematik und zeigen anhand von vielen Beispielen die Anwendung der gewonnenen Erkenntnisse.
von Wilhelm Merz (Autor), Peter Knabner (Mitwirkende) | Springer | 34,99 EUR
Link zum Buch bei Amazon
Endlich gelöst! Aufgaben zur Mathematik für Ingenieure und Naturwissenschaftler: Lineare Algebra und Analysis in R
Dieses Buch gehört direkt zum Werk darüber, denn es bietet für die beeindruckende Zahl von 430 Aufgaben Musterlösungen, bei manchen Aufgaben gibt es sogar mehrere aufgezeigte Lösungswege.
von Wilhelm Merz (Autor), Peter Knabner (Mitwirkende) | Springer | 29,99 EUR
Link zum Buch bei Amazon
Mathematische Methoden in den Biowissenschaften: Eine Einführung mit R
Auch wenn hier insbesondere die Biowissenschaften im Vordergrund stehen, bietet das Buch auf 472 Seiten eine Vielzahl unterschiedlicher Themen, die auch für andere Disziplinen interessant sind. Auch hier bieten vielfältige Übungsmaterialien einen intensiveren Zugang zu den vorgestellten Ansätzen der Datenauswertung.
von Werner Timischl (Autor) | Springer | 44,99 EUR
Link zum Buch bei Amazon
Statistik und Stochastik: Die Basis für Machine Learning
Im Grunde erfindet Machine Learning das Rad nicht neu, denn die den unterschiedlichen Ansätzen des maschinellen Lernens zugrunde liegenden Verfahren basieren auf lange bekannten mathematischen Methoden aus der Statistik und Stochastik.
Um ein besseres Verständnis des maschinellen Lernens zu entwickeln, lohnt es sich, in die Bereiche der Statistik und der Wahrscheinlichkeitsrechnung einzutauchen. Es gibt viele Einführungsbücher in diese beiden Felder der Mathematik, zwei sich ergänzende Bücher stammen aus dem Telekolleg: Statistik / Stochastik: Telekolleg und Mathematik Formeln und Begriffe: Telekolleg „Statistik und Stochastik: Die Basis für Machine Learning“ weiterlesen
Machine Learning hilft Versicherungen Geld zu sparen
Als Versicherung möchte ich – so gut es irgend geht – über meine Kunden Bescheid wissen, um beispielsweise zu verhindern, dass Versicherungsleistungen grundlos in Anspruch genommen werden. Versicherungsbetrug hat hohe Schäden zur Folge: „Alleine in der Schaden- und Unfallversicherung beläuft er sich jährlich auf vier Milliarden Euro, schätzt der GDV.“ So liegt es im ureigensten Interesse der Versicherungen, die Schäden so gering wie möglich zu halten. Hier kommt nun Machine Learning ins Spiel. „Machine Learning hilft Versicherungen Geld zu sparen“ weiterlesen
Was sind grundsätzliche Probleme von Machine Learning?
Schauen wir uns einmal das Diagramm oben an.
Die Zahl der Störche steigt, die Zahl der geborenen Kinder ebenfalls. In manchen Jahren fällt die Zahl der gesichteten Störche allerdings und die Zahl der geborenen Kinder sinkt in diesen Zeiträumen proportional.
Schaut man sich die Daten an, so ist alles korrekt: Die Zahlen stimmen, die Zuordnung zu den Jahren ist auch richtig. Kein Zweifel: Unser Diagramm zeigt deutlich einen Zusammenhang zwischen der Zahl der Geburten und der Anzahl der Störche. Stimmt es also doch? Bringen Störche die Kinder? Natürlich nicht. „Was sind grundsätzliche Probleme von Machine Learning?“ weiterlesen
Statistische Auswertung: Manipulieren nach Zahlen
„Politicians use statistics in the same way that a drunk uses lamp-posts—for support rather than illumination.“ (Andrew Lang, schottischer Schriftsteller)
Im Dezember 2016 macht eine Studie namens Perils of Perception die Runde, in der die Diskrepanz zwischen Wahrnehmung und Realität zur Geltung kommt. In zwölf Ländern wurden von IPSOS MORI Menschen befragt, wie hoch sie den muslimischen Anteil der Menschen innerhalb der eigenen Bevölkerung schätzen. In allen Ländern wurde dieser Anteil ausnahmslos viel zu hoch eingeschätzt.
Dabei verschätzten sich die Menschen teilweise um den Faktor Vier: Beispielsweise denken die Franzosen, dass 32 % ihrer eigenen Bevölkerung islamischen Glaubens sind, tatsächlich sind es etwa 8 %. Teilweise verschätzen sich die Menschen sogar um den Faktor 17: So denken US-Amerikaner, dass 17 % der Bevölkerung Moslems sind, tatsächlich sind es nur 1 %. Aber die Darstellung der Ergebnisse ist problematisch. „Statistische Auswertung: Manipulieren nach Zahlen“ weiterlesen
20 kostenlose Bücher zu Machine Learning für Anfänger und Fortgeschrittene
Im folgenden sind 20 kostenlose Bücher zur Datenanalyse und Datenauswertung verknüpft, die Anfängern und Fortgeschrittenen helfen, sich in das maschinelle Lernen einzuarbeiten. Alle Bücher sind auf Englisch. Manche der Bücher liegen als PDF vor, andere wiederum lassen sich auf ihrer jeweiligen Web-Seite lesen. Nicht alle Werke richten sich an Anfänger, aber bei 20 unterschiedlichen Links sollte für jede und jeden etwas dabei sein.
Die Themen reichen von Machine Learning über explorativer Datenanalyse bis hin zur Datenauswertung mit Big Data im Unternehmensumfeld. Viele Bücher sind dabei im Hinblick auf den praktischen Einsatz der vorgestellten Techniken in Algorithmen verfasst. Es gibt allerdings auch mehrere Werke, die für einen theoretischen Unterbau der Datenauswertung sorgen. Dabei verwenden die praktischen Exemplare nicht immer Python als Programmiersprache, sondern auch R.
Die Bücher sind in zwei Kategorien unterteilt: Die ersten Werke richten sich eher an Einsteiger ins Machine Learning. Aus den Büchern der zweiten Kategorie werden eher Menschen einen Nutzen ziehen, die sich bereits mit Machine Learning beschäftigt haben und nun weiterführende Informationen suchen. „20 kostenlose Bücher zu Machine Learning für Anfänger und Fortgeschrittene“ weiterlesen