Startseite > Programmierung > Informatik > Technologie > Data Science von Grund auf neu: Erste Prinzipien mit Python Bewertung

Data Science von Grund auf neu: Erste Prinzipien mit Python

Data Science from Scratch: First Principles with Python
Von Joel Grus
Rezensionen: 30 | Gesamtbewertung: Durchschnitt
Ausgezeichnet
3
Gut
17
Durchschnitt
5
Schlecht
4
Schrecklich
1
Data Science-Bibliotheken, Frameworks, Module und Toolkits eignen sich hervorragend für Data Science, sind aber auch eine gute Möglichkeit, in die Disziplin einzutauchen, ohne Data Science wirklich zu verstehen. In diesem Buch erfahren Sie, wie viele der grundlegendsten datenwissenschaftlichen Tools und Algorithmen funktionieren, indem Sie sie von Grund auf neu implementieren. Wenn Sie eine Begabung für Mathematik und einige haben

Rezensionen

05/14/2020
Dale Fodness

Ich kämpfe immer noch darum, das Buch zu finden, das ich über Data Science haben möchte. Ich habe gelernt, dass es zwei Ebenen gibt:

1. Wissen Datenwissenschaft
2. TUN Datenwissenschaft

Dieses Buch handelt vom zweiten. Machen Sie keinen Fehler, dies ist ein Handbuch zur "statistischen Berechnung". Hier erfahren Sie, wie Sie mit Python statistische Antworten finden. Die Hälfte dieses Buches besteht aus Codebeispielen. Wenn Sie nicht vorhaben, statistische Antworten auf bekannte Fragen durch Schreiben von Python-Code zu finden, ist dies nicht das richtige Buch für Sie.

Ich würde mir die Codebeispiele in diesem Buch ansehen und denken: "Was soll ich damit machen? Ich nehme das Wort des Autors dafür, dass dies funktioniert, aber was soll es mir sagen?" Die Codebeispiele zeigen nicht einmal viel innere Berechnung, da der größte Teil der Arbeit in Python-Bibliotheken zusammengefasst ist und die Codebeispiele wirklich nur magische Methodenaufrufe und den Code zeigen um jene. Dies ist fast ein Python-Handbuch.

Und ich bin mit dem Titel nicht einverstanden: "... von Grund auf neu." Es ist nicht von Grund auf neu, und dies ist meine Hauptbeschwerde: Zu wissen, wie man die Antwort findet, ist die zweite Hälfte des Prozesses. Das Hauptproblem ist folgendes: niemand kennt die richtigen Fragen. Ich kann jemanden finden oder einstellen, der mir die Antwort gibt. Erklären Sie mir, welche Fragen ich an Daten stellen sollte.

Und hier fällt das Buch hin. Die beschriebenen Szenarien sind enorm erfunden und werden in rasender Eile beschönigt, um zu den Codebeispielen zu gelangen (genau der Teil, der mir egal war). Ich möchte mehr Zeit damit verbringen, warum die Frage wichtig ist. Beispiele aus der Praxis wären auch schön.

Ich verstehe, dass dies möglicherweise nicht das war, was der Autor wollte. Aber ich beschuldige ihn für den Titel. Es ist nicht "Data Science from Scratch". Es ist "Wie man Statistiken mit Python berechnet." Ich denke, ich hätte dem Untertitel mehr Aufmerksamkeit schenken sollen.

Das ist mein Problem mit diesem Buch und mit ungefähr jedem Buch, das ich in den letzten zwei Jahren über Datenwissenschaft gelesen habe. Alle diese Bücher wurden von Statistikern geschrieben, die Ihnen sehr schnell Mathematik (oder Code) zeigen. Ich möchte ein Buch von einem Geschäftsmann, das mit der Idee beginnt, welche Lösungen wir aus unseren Daten freischalten können.

Wie finde ich diese Lösungen? Das ist ein leicht lösbares Problem.
05/14/2020
Leverick Manfredonia

Ich habe alle Beispiele in diesem Buch durchgearbeitet. Anstatt Sie Numpy und Pandas importieren zu lassen und Scikit zu lernen, führt er Sie durch den Aufbau dieser Tools. Was Sie bauen, wird furchtbar ineffizient sein und Sie sollten es niemals im wirklichen Leben verwenden, aber Sie werden ein großartiges Gefühl dafür bekommen, wie sie unter der Haube funktionieren.

(Ich habe auch gelernt, dass meine lineare Algebra sehr rostig ist und ich eine Auffrischung brauche ...)

Ich bin mit einigen Bewertungen nicht einverstanden, dass er die Berechnung nicht gut erklärt - er tut dies in den Kommentaren des Codes, wo er Sie Schritt für Schritt durch das führt, was er tut.

Ein tolles Intro für einen Anfänger wie mich.
05/14/2020
Adamec Hanly

Die Idee des Buches ist schön, ich denke immer noch, dass es ein nützliches Buch ist, aber:
1. Sie werden dahinter keine Mathematik lernen oder die Methoden werden erklärt (es ist jedoch gut für eine Programmierung).
2. In Bezug auf den Programmierteil denke ich, dass die Leute mehr davon profitieren würden, wenn sie tatsächlich Übungen machen würden, nicht nur die Einstellung "Diesen Code eingeben"
3. wäre schön, wenn alle Datensätze tatsächlich in einem Buch generiert würden, nicht nur "es gibt einen Datensatz mit 2000 Punkten, den ich gerade aus meinem Arsch gezogen habe"
4. Eine stärkere Verwendung von Numpy wäre nützlich
5. Alle Titel, die "Von Grund auf neu lernen" enthalten, sind zum Kotzen
6. die ganze amerikanische Einstellung mit "Herzlichen Glückwunsch! Sie arbeiten jetzt in DataScienster! Willkommen an Bord!" ist nervig und behandelt Leute wie Idioten.
Das Buch ist eigentlich nicht so schlecht, wie ich es beschrieben habe, aber manchmal werden Sie während der Arbeit so verärgert sein, aber all diese Details. Gut, dass das nicht teuer ist.
05/14/2020
Lydie Hasberry

Ordentliches Buch zur Einführung in die Datenwissenschaft mit Python.

Übrigens sollten wir ernsthaft aufhören, Bücher über elementare Datenwissenschaft mit R oder Python zu schreiben. Wir haben zu viele und sie sahen sich schon ähnlich.

05/14/2020
Chem Delegal

zu lesen, um Grundlagen zu demonstrieren. Die meisten Arbeiten hier können mit fortgeschrittenen Bibliotheken viel einfacher ausgeführt werden, aber diese Art von Text hilft, das Warum und die Bausteine ​​einer ausgefeilteren Praxis zu verstehen.
05/14/2020
Africa Brola

Wie der Titel schon sagt, zeigt Ihnen dieses Buch, wie Sie grundlegende lineare Algebra, Statistiken, Wahrscheinlichkeitsmethoden und ML-Modelle in reinem Python implementieren.

+ Das Buch behandelt alle notwendigen Grundthemen, damit Sie mit Data Science beginnen können, und zeigt uns auch, wo wir uns eingehender mit diesen Themen befassen können.
+ Python mit Typhinweise ist ein großes Plus. Einige Leute mögen es hassen, aber ich denke, es ist eine gute Funktion. Im wirklichen Leben kann es von Ihrem Team abhängen.

- Nicht genug mathematische Erklärungen.
- Das ist zu "kratzig". Ich würde Numpy in Aktion sehen wollen. Weil der Code viel sauberer aussehen würde, aber immer noch "niedrig" genug ist, um zu lernen, wie man maschinelle Lernmodelle von Grund auf neu erstellt. Es wird dem Leser helfen, Themen wissenschaftlicher zu verstehen (lineare Algebraoperationen)
- Kapitel 24: Datenbanken und SQL, in denen der Autor versucht hat, SQL-Befehle und Abfragen mit Python-Methoden nachzuahmen, sind vollständig redundant.
- In der Zwischenzeit gibt es keine Kapitel für Test- und Bereitstellungsphasen im Data Science-Lebenszyklus.
05/14/2020
Janaye Trumble

Gut in:
- Einstiegsprojekte üben (Übungen)
- einfache Sprache

Schlecht in:
- Fehlen einiger erforderlicher Details in einigen Abschnitten
- veralteter Code
- Die Apps-Codes sind in einigen Abschnitten nicht so nützlich

Insgesamt ist das Buch eine gute erfrischende Lektüre. aber nicht so gut zum studieren
05/14/2020
Narah Shepheard

Nicht besonders beeindruckt von diesem. So wie ich das sehe, werden die Leser dieses Buches entweder bereits wissen, wie man Datenwissenschaft macht, oder sie werden es nicht. Wenn ja (und hier ignoriere ich die Tatsache, warum sie es tun sollten, da der Titel des Buches "Datenwissenschaft" lautet von Grund auf neu"), dann finden sie die Erklärungen von Konzepten zu grundlegend und die Beispiele für die Implementierung von Python-Code meistens nutzlos (sie verwenden schließlich nicht die Bibliotheken, die speziell für Data Science entwickelt wurden, sondern implementieren einen naiven direkten Ansatz). Und Wenn dies nicht der Fall ist, finden sie die Erklärungen von Konzepten zu knapp, um nützlich zu sein. Die Beispiele für die Implementierung von Python-Code sind immer noch nutzlos, da a) sie schwer zu befolgen sind, ohne die Konzepte zuerst zu verstehen, und b) sie "von" stammen Scratch ", so dass Sie sie nicht einmal in der Produktion für die Konzepte wiederverwenden können, die Sie verstanden haben. Insgesamt ist mein größter Kritikpunkt, dass das Buch nicht die" Data Science from Scratch "behandelt, wie angekündigt, sondern vielmehr "Python-Code-Implementierung von Grund auf neu, da sie für schlecht erklärte datenwissenschaftliche Konzepte gilt". Das Buch ist nicht völlig nutzlos, aber definitiv kein guter Ausgangspunkt, um Datenwissenschaft von Grund auf neu zu lernen.
05/14/2020
Romina Viken

Wirklich guter Überblick, brauchte aber ein wenig mehr Informationen darüber, welche Softwarepakete die besprochenen Funktionen implementieren.
05/14/2020
Quartis Koong

Gutes Einführungsbuch zur Datenwissenschaft. Ich würde dies Leuten empfehlen, die grundlegende Dinge auf praktische Weise lernen möchten.
05/14/2020
Altaf Delahoussaye

Eine kurze Einführung in viele Konzepte und die schrittweise Erstellung eines Arbeitscodes. Ich würde etwas mehr Mathematik und Theorie erwarten, deshalb habe ich vier statt fünf Sterne vergeben.
05/14/2020
Karlow Mirjah

Tolles Buch für einen allgemeinen Überblick über die Konzepte und um zu verstehen, was "Data Science" eigentlich bedeutet. Viel Code, um zu den Punkten nach Hause zu fahren, und es hat mir einige Python-Tricks beigebracht.

Ich kann voraussehen, dass dies als Referenz für die Hauptkonzepte verwendet wird oder wenn nach einer einfachen Implementierung der diskutierten Algorithmen gesucht wird. Die Informationen sind sehr solide.

Wenn Sie direkt durchstarten wollen, ist es manchmal eine schwierige Lektüre - aber Joel ist ein sehr guter Schriftsteller, und ich habe den trockenen Humor genossen, der überall verteilt ist. Ich bin selbst neu in der Datenwissenschaft und froh, dass ich mir die Zeit dafür genommen habe.
05/14/2020
Shaum Tomjack

Grundlegende Konzepte enthüllt, Bibliotheken für den Sieg

Joel macht einen großartigen Job, indem er die Aufgaben eines Datenwissenschaftlers zur Lösung hypothetischer Probleme durchläuft und die Modelle erklärt, die am häufigsten beim maschinellen Lernen implementiert werden. Eine überwältigende Mehrheit der Codebeispiele ist nutzlos, was beabsichtigt ist, da Joel feststellt, wie man Dinge von Grund auf neu erstellt. Bibliotheken (wie Pandas, Scikit-Learn usw.) bieten APIs, um viele dieser Aufgaben zu erledigen, ohne von Grund auf neu zu schreiben. Ohne das zugrunde liegende Wissen und die Wertschätzung für deren Implementierung kann es jedoch leicht sein, die Konzepte als selbstverständlich zu betrachten oder nicht zu verstehen .
05/14/2020
Rainwater Kull

Dies war eine unterhaltsame Übersicht über beliebte Themen der zeitgenössischen Datenwissenschaft. Es war gut für ein Lehrbuch geschrieben und leicht zu lesen. Ich nehme an, es gab nur wenige formale Beweise, aber das wurde wieder wettgemacht, indem Sie Spielzeugmodelle aller wichtigen Ideen bauen ließen. Es lohnt sich für mich zu lesen, da ich sehr neu in der Datenwissenschaft bin, aber gut mit Python und Mathematik vertraut bin. Ich würde gerne ein Folgebuch sehen, das dieselben Themen behandelt, aber die realen Bibliotheken verwendet, die in der Industrie verwendet werden, um dieselben Probleme zu lösen.
05/14/2020
O'Conner Maenpaa

unterhaltsamer als ein Programmiersprachentext für Einsteiger normalerweise und nicht auf Kosten des Inhalts. Nun, vielleicht etwas auf Kosten des Inhalts, weil einige der Beispiele etwas zu einfach sind, um ein echtes Gefühl dafür zu vermitteln, wofür die Methoden nützlich sind. aber insgesamt viel spaß und sehr gute informationen. Ich fand es ein wenig frustrierend, besonders früh, dass keine Gleichungen enthalten waren und das Lesen von Python notwendig war, um die Grundlagen zu verstehen.
05/14/2020
Jobie Swedlund

Schnell lesen. Und ein großartiges Intro, das den Bereich Data Science überflutet. Auch wenn es nicht viel Wissen vermittelt, das von einem praktizierenden Data Scientist verwendet werden könnte. Der Teil "von Grund auf neu" des Titels bezieht sich auf den Fokus des Buches auf die Implementierung der gängigen Algorithmen mit Python. Von Grund auf neu. Welches ist ... ziemlich sinnlos. Jeder, der es mit Data Science ernst meint, würde stattdessen vorgefertigte, effiziente Bibliotheken verwenden, um seine Modelle zu trainieren. Der Autor sendet den Leser mit den eigentlichen Data Science-Tools an externe Quellen. Ich wünschte nur, der Autor hätte mehr Zeit mit ihnen verbracht.

Es ist interessant zu sehen, dass viele scheinbar komplizierte Algorithmen für maschinelles Lernen in Python implementiert werden könnten. Ich würde jedoch nicht sagen, dass eine solche Implementierung zu einem besseren Verständnis beigetragen hat.

Lesen Sie das Buch, wenn Sie einen schnellen Überblick über einige der in der Branche verfügbaren Tools erhalten möchten. Wenn Ihnen das, was Sie lesen, gefällt, lesen Sie die praktischen Anleitungen, um die Standardpraktiken in der Branche besser zu verstehen.
05/14/2020
Quita Przedwiecki

Ein hervorragendes Werkzeug für angehende Datenwissenschaftler wie mich.

Es gibt keinen Mangel an Informationen zu diesem Thema, aber es ist schwierig, alles an einem Ort zu finden. Sie könnten Wochen damit verbringen, Foren, Blog-Beiträge und Video-Tutorials zu durchsuchen, um nur halb so viele nützliche Informationen zu finden. Data Science von Grund auf neu behandelt auf prägnante und humorvolle Weise die Grundlagen vieler grundlegender Algorithmen für maschinelles Lernen.

Als faire Warnung ist die Mathematik für ein einzelnes Buch ein wenig zu berücksichtigen. Der Autor bietet eine Einführung in Statistiken, Wahrscheinlichkeit und lineare Algebra, aber Sie sollten sich am besten mit diesem Material vertraut machen, bevor Sie eintreten. Kalkül ist ebenfalls ein Plus.

Empfohlen für Personen mit technischem Hintergrund, die lernen möchten, was maschinelles Lernen wirklich ist.
05/14/2020
Casimire Chowhan

Praktisches Buch, das behandelt, was für Datenanalysten wichtig ist, um sich mit statistischer Analyse, maschinellem Lernen und verwandten Themen zu befassen. Gutes Buch für Anfänger, hatte aber auf der Seite des statistischen Lernens, der Prinzipien und der Konzepte nicht viel zu bieten. Sie sollten Bücher wie IPSUR (Jay G Kearns) und ISLR (Hastie & Tibshirani) nach solchen Inhalten durchsuchen. Dies ist jedoch ein praktisches Buch, da es viele relevante Ideen vorstellt. Einige Bedenken: Die MapReduce-Behandlung ist wahrscheinlich bereits veraltet, da niemand mehr so ​​viel verwendet. Nicht viel über NLP und nicht genug Diskussion über Nicht-ML-Statistiken, die Teil der Datenwissenschaft sind - wie häufig auftretende Statistiken, Verteilungsmodellierung, Zeitreihen und so weiter.
05/14/2020
Bartholomew Tekippe

Abgesehen von der Begeisterung und dem breiten Wissen des Autors habe ich nicht viel aus diesem Buch herausgeholt. Für mich gibt es nicht genug Details zu den statistischen Konzepten und zu viele Details in den Codebeispielen von Grund auf. Die Codebeispiele dürfen auch nie wieder verwendet werden, wie der Autor am Ende zugibt, da es viele Python-Pakete gibt, die die Datenanalyse unendlich effizienter und skalierbarer machen. Die Modellierungskonzepte sind nicht klar genug differenziert, sodass nicht klar ist, warum Sie sie übereinander verwenden. Die verwendeten Datenbeispiele bestehen alle aus offensichtlichen Einschränkungen dieses Ansatzes und werden nur von Hand durchgewinkt. Ich würde empfehlen, woanders nach einem Einführungsbuch zu suchen.
05/14/2020
Whatley Cossell

Ich habe dies vor Beginn eines MSc in Data Science gelesen und fand, dass es eine großartige Einführung in Data Science ist. Ich habe mit den Grundlagen begonnen, bevor ich mich allgemeineren ML-Techniken zuwandte und einige der komplexeren Themen wie MapReduce abgeschlossen habe. Kein ausführliches Lehrbuch, aber ich denke nicht, dass dies der Zweck dieses Buches ist, um dem Leser eine umfassende Vorstellung von dem Gebiet zu vermitteln.
05/14/2020
Lyontine Nelson

Es ist ein wunderbares Buch, die Details der Implementierung einiger Methoden des maschinellen Lernens zu verstehen. Es ist auch eine gute Praxis, Python Basic zu verwenden. Wie vorgeschlagen, ist jede Funktion von Grund auf neu aufgebaut. Ich habe das Buch wirklich genossen, aber ich würde es nicht empfehlen, ML zu lernen und direkt mit der Entwicklung von ML-Anwendungen zu beginnen.
Ich bewerte es mit 4, weil einige Beispiele im Buch keine Daten zum Testen enthalten
05/14/2020
Valer Romm

Das Buch behandelt ein umfangreiches Thema, das erforderlich ist, um mit Data Science Stream zu beginnen. Es führt Theorie, Frameworks und Bibliothek ein. Infolgedessen ist keines der Themen mit beispielhaften Problemlösungen praxisnah. Obwohl das Buch Arbeitscode Beispiel für alle Konzepte. Um die Datenwissenschaft in den Griff zu bekommen, ist die Problemlösung sehr wichtig.
05/14/2020
Ardith Mcgarvey

Dieses Buch ist hilfreich, um das Verständnis einiger Details zu verbessern, die den datenwissenschaftlichen Algorithmen zugrunde liegen, aber es fehlt in der Tiefe des Inhalts. Einige Konzepte fühlen sich gehetzt und unvollständig an; Die Erklärung ist manchmal nicht klar.

Obwohl das Buch flach ist, würde ich es empfehlen; hier und da können Sie wertvolle Informationen daraus erhalten.
05/14/2020
Berget Riesenberg

Data Science from Scratch bietet einen guten Überblick über Data Science. Es deckt die Breite des "Feldes" ab, das sich an (aufstrebende) Praktiker richtet (zum Beispiel konnte ich keine "Definition" der Datenwissenschaft finden, die über das "Es ist ein Venn-Diagramm - Daten, Mathematik, Hacken" hinausgeht). Für Praktiker ist der Ansatz "von Grund auf neu" sehr nützlich. Einige Themen werden schnell überflogen, andere sind eine genaue Analyse des Codes (Python), um die spezifische Implementierung von "Cartoon" -Beispielen zu verstehen. Der Ansatz von Grund auf baut die Tools auf, um ein gutes Verständnis zu vermitteln und gleichzeitig Zeiger auf geeignete Bibliotheken / Module bereitzustellen. Außerdem wird empfohlen, für "echte Anwendungen" die optimierten Module zu verwenden.
05/14/2020
Julide Posley

Wirklich gute Einführung in DS

Detaillierte Erklärungen für gängige ML-Modelle
Wenn Sie nach sklearn, pytorch, pandas suchen, ist dies nicht Ihr Buch
Bücher ist in Python 2.7, aber Python 3 ist in Github verfügbar
05/14/2020
Nierman Tribou

Ich habe das schon eine ganze Weile gelesen. Es werden zahlreiche datenwissenschaftliche Algorithmen und Methoden von Grund auf erläutert, wobei Python als Titel (und viele Rezensionen) verwendet wird. Im Grunde erklärt es also, was die Bibliotheken von Drittanbietern unter der Haube tun.
05/14/2020
Sheree Cords

Frischer Ansatz für maschinelles Lernen und DL. Einige technische Vorkenntnisse sind erforderlich, um die in diesem Buch enthaltenen Code-Schnipsel „unter der Haube“ zu verstehen. Aber es ist eine sehr gute Lektüre und richtig organisiert.
05/14/2020
Terle Seielstad

Eine gute Einführung in die eigentliche Arbeit eines Datenwissenschaftlers sieht aus, von der Massage der Daten bis zur Entscheidung, welcher ML-Algorithmus ausgeführt werden soll.
05/14/2020
Lionello Mizrahi

Geben Sie eine gute Perspektive und erklären Sie einige einfache Algorithmen buchstäblich von Grund auf neu

Hinterlassen Sie eine Bewertung zu Data Science von Grund auf neu: Erste Prinzipien mit Python


Nützliche Links