Startseite
> Programmierung
> Informatik
> Technologie
> Data Science von Grund auf neu: Erste Prinzipien mit Python Bewertung
Data Science von Grund auf neu: Erste Prinzipien mit Python
Data Science from Scratch: First Principles with PythonVon Joel Grus
Rezensionen: 30 | Gesamtbewertung: Durchschnitt
Ausgezeichnet | |
Gut | |
Durchschnitt | |
Schlecht | |
Schrecklich |
Data Science-Bibliotheken, Frameworks, Module und Toolkits eignen sich hervorragend für Data Science, sind aber auch eine gute Möglichkeit, in die Disziplin einzutauchen, ohne Data Science wirklich zu verstehen. In diesem Buch erfahren Sie, wie viele der grundlegendsten datenwissenschaftlichen Tools und Algorithmen funktionieren, indem Sie sie von Grund auf neu implementieren. Wenn Sie eine Begabung für Mathematik und einige haben
Rezensionen
1. Wissen Datenwissenschaft
2. TUN Datenwissenschaft
Dieses Buch handelt vom zweiten. Machen Sie keinen Fehler, dies ist ein Handbuch zur "statistischen Berechnung". Hier erfahren Sie, wie Sie mit Python statistische Antworten finden. Die Hälfte dieses Buches besteht aus Codebeispielen. Wenn Sie nicht vorhaben, statistische Antworten auf bekannte Fragen durch Schreiben von Python-Code zu finden, ist dies nicht das richtige Buch für Sie.
Ich würde mir die Codebeispiele in diesem Buch ansehen und denken: "Was soll ich damit machen? Ich nehme das Wort des Autors dafür, dass dies funktioniert, aber was soll es mir sagen?" Die Codebeispiele zeigen nicht einmal viel innere Berechnung, da der größte Teil der Arbeit in Python-Bibliotheken zusammengefasst ist und die Codebeispiele wirklich nur magische Methodenaufrufe und den Code zeigen um jene. Dies ist fast ein Python-Handbuch.
Und ich bin mit dem Titel nicht einverstanden: "... von Grund auf neu." Es ist nicht von Grund auf neu, und dies ist meine Hauptbeschwerde: Zu wissen, wie man die Antwort findet, ist die zweite Hälfte des Prozesses. Das Hauptproblem ist folgendes: niemand kennt die richtigen Fragen. Ich kann jemanden finden oder einstellen, der mir die Antwort gibt. Erklären Sie mir, welche Fragen ich an Daten stellen sollte.
Und hier fällt das Buch hin. Die beschriebenen Szenarien sind enorm erfunden und werden in rasender Eile beschönigt, um zu den Codebeispielen zu gelangen (genau der Teil, der mir egal war). Ich möchte mehr Zeit damit verbringen, warum die Frage wichtig ist. Beispiele aus der Praxis wären auch schön.
Ich verstehe, dass dies möglicherweise nicht das war, was der Autor wollte. Aber ich beschuldige ihn für den Titel. Es ist nicht "Data Science from Scratch". Es ist "Wie man Statistiken mit Python berechnet." Ich denke, ich hätte dem Untertitel mehr Aufmerksamkeit schenken sollen.
Das ist mein Problem mit diesem Buch und mit ungefähr jedem Buch, das ich in den letzten zwei Jahren über Datenwissenschaft gelesen habe. Alle diese Bücher wurden von Statistikern geschrieben, die Ihnen sehr schnell Mathematik (oder Code) zeigen. Ich möchte ein Buch von einem Geschäftsmann, das mit der Idee beginnt, welche Lösungen wir aus unseren Daten freischalten können.
Wie finde ich diese Lösungen? Das ist ein leicht lösbares Problem.
(Ich habe auch gelernt, dass meine lineare Algebra sehr rostig ist und ich eine Auffrischung brauche ...)
Ich bin mit einigen Bewertungen nicht einverstanden, dass er die Berechnung nicht gut erklärt - er tut dies in den Kommentaren des Codes, wo er Sie Schritt für Schritt durch das führt, was er tut.
Ein tolles Intro für einen Anfänger wie mich.
1. Sie werden dahinter keine Mathematik lernen oder die Methoden werden erklärt (es ist jedoch gut für eine Programmierung).
2. In Bezug auf den Programmierteil denke ich, dass die Leute mehr davon profitieren würden, wenn sie tatsächlich Übungen machen würden, nicht nur die Einstellung "Diesen Code eingeben"
3. wäre schön, wenn alle Datensätze tatsächlich in einem Buch generiert würden, nicht nur "es gibt einen Datensatz mit 2000 Punkten, den ich gerade aus meinem Arsch gezogen habe"
4. Eine stärkere Verwendung von Numpy wäre nützlich
5. Alle Titel, die "Von Grund auf neu lernen" enthalten, sind zum Kotzen
6. die ganze amerikanische Einstellung mit "Herzlichen Glückwunsch! Sie arbeiten jetzt in DataScienster! Willkommen an Bord!" ist nervig und behandelt Leute wie Idioten.
Das Buch ist eigentlich nicht so schlecht, wie ich es beschrieben habe, aber manchmal werden Sie während der Arbeit so verärgert sein, aber all diese Details. Gut, dass das nicht teuer ist.
Übrigens sollten wir ernsthaft aufhören, Bücher über elementare Datenwissenschaft mit R oder Python zu schreiben. Wir haben zu viele und sie sahen sich schon ähnlich.
+ Das Buch behandelt alle notwendigen Grundthemen, damit Sie mit Data Science beginnen können, und zeigt uns auch, wo wir uns eingehender mit diesen Themen befassen können.
+ Python mit Typhinweise ist ein großes Plus. Einige Leute mögen es hassen, aber ich denke, es ist eine gute Funktion. Im wirklichen Leben kann es von Ihrem Team abhängen.
- Nicht genug mathematische Erklärungen.
- Das ist zu "kratzig". Ich würde Numpy in Aktion sehen wollen. Weil der Code viel sauberer aussehen würde, aber immer noch "niedrig" genug ist, um zu lernen, wie man maschinelle Lernmodelle von Grund auf neu erstellt. Es wird dem Leser helfen, Themen wissenschaftlicher zu verstehen (lineare Algebraoperationen)
- Kapitel 24: Datenbanken und SQL, in denen der Autor versucht hat, SQL-Befehle und Abfragen mit Python-Methoden nachzuahmen, sind vollständig redundant.
- In der Zwischenzeit gibt es keine Kapitel für Test- und Bereitstellungsphasen im Data Science-Lebenszyklus.
- Einstiegsprojekte üben (Übungen)
- einfache Sprache
Schlecht in:
- Fehlen einiger erforderlicher Details in einigen Abschnitten
- veralteter Code
- Die Apps-Codes sind in einigen Abschnitten nicht so nützlich
Insgesamt ist das Buch eine gute erfrischende Lektüre. aber nicht so gut zum studieren
Ich kann voraussehen, dass dies als Referenz für die Hauptkonzepte verwendet wird oder wenn nach einer einfachen Implementierung der diskutierten Algorithmen gesucht wird. Die Informationen sind sehr solide.
Wenn Sie direkt durchstarten wollen, ist es manchmal eine schwierige Lektüre - aber Joel ist ein sehr guter Schriftsteller, und ich habe den trockenen Humor genossen, der überall verteilt ist. Ich bin selbst neu in der Datenwissenschaft und froh, dass ich mir die Zeit dafür genommen habe.
Joel macht einen großartigen Job, indem er die Aufgaben eines Datenwissenschaftlers zur Lösung hypothetischer Probleme durchläuft und die Modelle erklärt, die am häufigsten beim maschinellen Lernen implementiert werden. Eine überwältigende Mehrheit der Codebeispiele ist nutzlos, was beabsichtigt ist, da Joel feststellt, wie man Dinge von Grund auf neu erstellt. Bibliotheken (wie Pandas, Scikit-Learn usw.) bieten APIs, um viele dieser Aufgaben zu erledigen, ohne von Grund auf neu zu schreiben. Ohne das zugrunde liegende Wissen und die Wertschätzung für deren Implementierung kann es jedoch leicht sein, die Konzepte als selbstverständlich zu betrachten oder nicht zu verstehen .
Es ist interessant zu sehen, dass viele scheinbar komplizierte Algorithmen für maschinelles Lernen in Python implementiert werden könnten. Ich würde jedoch nicht sagen, dass eine solche Implementierung zu einem besseren Verständnis beigetragen hat.
Lesen Sie das Buch, wenn Sie einen schnellen Überblick über einige der in der Branche verfügbaren Tools erhalten möchten. Wenn Ihnen das, was Sie lesen, gefällt, lesen Sie die praktischen Anleitungen, um die Standardpraktiken in der Branche besser zu verstehen.
Es gibt keinen Mangel an Informationen zu diesem Thema, aber es ist schwierig, alles an einem Ort zu finden. Sie könnten Wochen damit verbringen, Foren, Blog-Beiträge und Video-Tutorials zu durchsuchen, um nur halb so viele nützliche Informationen zu finden. Data Science von Grund auf neu behandelt auf prägnante und humorvolle Weise die Grundlagen vieler grundlegender Algorithmen für maschinelles Lernen.
Als faire Warnung ist die Mathematik für ein einzelnes Buch ein wenig zu berücksichtigen. Der Autor bietet eine Einführung in Statistiken, Wahrscheinlichkeit und lineare Algebra, aber Sie sollten sich am besten mit diesem Material vertraut machen, bevor Sie eintreten. Kalkül ist ebenfalls ein Plus.
Empfohlen für Personen mit technischem Hintergrund, die lernen möchten, was maschinelles Lernen wirklich ist.
Ich bewerte es mit 4, weil einige Beispiele im Buch keine Daten zum Testen enthalten
Obwohl das Buch flach ist, würde ich es empfehlen; hier und da können Sie wertvolle Informationen daraus erhalten.
Detaillierte Erklärungen für gängige ML-Modelle
Wenn Sie nach sklearn, pytorch, pandas suchen, ist dies nicht Ihr Buch
Bücher ist in Python 2.7, aber Python 3 ist in Github verfügbar