Startseite
> Geschäft
> Nonfiction
> Science
> Data Science for Business: Was Sie über Data Mining und datenanalytisches Denken wissen müssen Bewertung
Data Science for Business: Was Sie über Data Mining und datenanalytisches Denken wissen müssen
Data Science for Business: What you need to know about data mining and data-analytic thinkingVon Foster Provost Tom Fawcett,
Rezensionen: 29 | Gesamtbewertung: Gut
Ausgezeichnet | |
Gut | |
Durchschnitt | |
Schlecht | |
Schrecklich |
Data Science for Business wurde von den renommierten Data Science-Experten Foster Provost und Tom Fawcett verfasst und führt Sie in die Grundprinzipien der Data Science ein und führt Sie durch das "datenanalytische Denken", das erforderlich ist, um nützliches Wissen und Geschäftswert aus den von Ihnen gesammelten Daten zu extrahieren. Dieses Handbuch hilft Ihnen auch dabei, die vielen heute verwendeten Data-Mining-Techniken zu verstehen.
Rezensionen
Ich fand es genau auf dem richtigen Niveau, weil es gerade genug Mathematik gibt, um die grundlegenden Konzepte zu erklären und sie in meinem Kopf stecken zu lassen. Dies ist kein Buch über die Implementierung dieser Konzepte oder eine Reihe von Algorithmen. (Überprüfen Sie die Elemente der statistischen Neigung über oder Data Mining: Praktische Tools und Techniken für maschinelles Lernen, XNUMX. Auflage dafür.) Dies gibt dem Buch den Vorteil, etwas zu sein, das man einem intelligenten Manager oder interessierten Entwickler vorwirft, und beide können viel daraus machen. Und wenn sie an der nächsten Lernstufe interessiert sind, gibt es viele Hinweise.
Andere Kapitel behandeln die geschäftsbezogenen Aspekte, an denen ich ehrlich gesagt weniger interessiert bin. Obwohl ich das Kapitel über die Darstellung von Ergebnissen durch ROC-Kurven, Auftriebskurven usw. ziemlich interessant fand.
Es wäre cool, wenn dieses Buch noch einige praktische Aspekte hätte. Vielleicht sollte man nach dem Lesen dieses Buches Weka herunterladen und zu Teil 3 von Data Mining: Praktische Tools für maschinelles Lernen springen oder zu Kaggle gehen und sich in den aktuellen und vergangenen Wettbewerben umsehen.
Ein paar kleine Nissen - ich hatte das Gefühl, dass die baysischen Methoden zu schnell behandelt wurden, obwohl das Buch klar ist, dass es ein ziemlich großes Thema für sich ist. Die Gleichung, die schließlich gezeigt wird, hat ein großes Loch, das schnell auf Null gehen kann. Es wäre also schön zu erwähnen, dass manchmal Begriffe weggelassen werden, oder den LaPlace-Schätzer zu erwähnen, zumindest in einer Seitenleiste. Auch zufällige Wälder werden nur vorübergehend erwähnt. Aber ich beschwere mich teilweise, weil ich denke, ich würde auch von ihren Erklärungen dieser Dinge profitieren.
Oh, und es war cool, Themenmodelle zu sehen, die im Kapitel über Text erwähnt wurden, weil ich bereits in den 90er Jahren für ein Unternehmen gearbeitet habe, das eine sehr primitive, manuelle Version dieser Technik zur Klassifizierung von Dokumenten verwendet hat.
Bei Data Science for Business dreht sich alles um den konzeptionellen Rahmen des Fachgebiets, da es sich um die verschiedenen Aspekte des Unternehmertums handelt. Die Autoren legen großen Wert auf die Struktur des Buches: Es gibt einen sehr deutlichen Fortschritt zwischen der statistischen Theorie und ihrer Anwendung anhand sehr detaillierter Beispiele. Jeder Fachbegriff ist sofort mit realen Anwendungen verbunden, was ihn zu einer unschätzbaren Ressource für jemanden macht, der eine pragmatische Verwendung für ansonsten esoterische Konzepte findet.
Anfängern und Veteranen wird jedoch empfohlen, dass der Inhalt dieses Buches etwas dicht ist. Wenn Sie ein absoluter Anfänger sind, dauert es eine Weile, bis der Inhalt vollständig verdaut ist. Für die Eingeweihten ist dies jedoch ein ausgezeichnetes Referenzmaterial. In diesem Buch wird die Idee untersucht, dass Data Science mehr als eine perfekte Maschine ist: Es handelt sich um analytische Technik gepaart mit innovativer Exploration, aber es sind viele Anpassungen erforderlich, um die gewünschten Ergebnisse zu erzielen.
Wenn Sie feststellen, dass die Innovationswelle Sie in Richtung Datenwissenschaft führt, bietet das Buch von Fawcett und Provost eine sanfte, aber gründliche Einführung in die Grundlagen der Datenwissenschaft. Sie können dann ihre sehr detaillierte Referenzliste verwenden, um weiter in die relevantesten Themen einzutauchen. Zumindest können Sie bei Ihrem nächsten Meeting einige Referenzen nennen, um mit den Datenwissenschaftlern bei der Arbeit einige Punkte zu erzielen.
Dies ist ein gutes Einführungsbuch. Um es jedoch vollständig zu erhalten, benötigen Sie Grundkenntnisse in Statistik oder sind hartnäckig genug, um Google immer zu konsultieren, wenn Sie auf ein Fremdkonzept stoßen. Lesern ohne statistischen Hintergrund oder ohne Zeitmangel wird empfohlen, zuerst die Kapitel 1 und 2 zu lesen, die einen guten Überblick über die Datenwissenschaft ohne Fachsprache bieten. Die Kapitel 2-10 behandeln die Kernbereiche der Datenwissenschaft und sollten in einem Tempo gelesen werden, mit dem der Leser vertraut ist. Dies ist eine empfohlene Lektüre für alle, die sich für datenwissenschaftliche Kenntnisse interessieren.
Data Science for Business ist selbst für technische Leser keineswegs einfach zu lesen, es sei denn, Sie verfügen über umfangreiche Erfahrung im maschinellen Lernen und den relevanten statistischen Techniken und Algorithmen. Das Buch nennt die tieferen technischen Abschnitte, die Sie sicher überspringen können, aber ich glaube, dass sie viele kritische Details enthielten. Trotzdem ist die Mathematik im Verhältnis zur Zielgruppe noch relativ leicht. Die ersten Kapitel hätten viel kürzer und klarer sein können, wenn die Autoren viele Wörter durch eine viel geringere Anzahl von Gleichungen ersetzt hätten, aber dann hätten sie das Buch möglicherweise neu betiteln müssen.
Ein Bereich, den das Buch nicht ausführlich behandelt, ist die Visualisierung der Modellleistung, obwohl es eine angemessene Beschreibung von ROC-Diagrammen, Anpassungsdiagrammen und Auftriebskurven gibt, wobei der Schwerpunkt darauf liegt, genug über sie zu lernen, um sie auf hohem Niveau zu verstehen.
Die Coursera ML-Klasse ist eine bessere Möglichkeit, um zu lernen, wie Algorithmen für maschinelles Lernen wirklich funktionieren. Sie müssen jedoch über gute Programmier- und Mathematikkenntnisse verfügen und bereit sein, bis zu 10 Wochen lang etwa 15 bis 10 Stunden pro Woche damit zu verbringen. Dieses Buch ist ein ausgezeichneter Kompromiss für die viel kürzere Investition in die Zeit, um es zu lesen.
Data Science for Business erwies sich auch als eine großartige Ergänzung zu einem anderen Buch, das ich gelesen habe: How to Not Be Be Wrong von Jordan Ellenberg, das ich auch empfehlen werde, sobald ich es fertiggestellt habe. Oder vielleicht empfehle ich es jetzt einfach weiter.
Gute Auswahl an alltäglichen Business Cases aus der Praxis, um den Kontext zu halten und den praktischen Wert des Verständnisses von Data Science zu veranschaulichen. Es ist auch nützlich, wichtige Begriffe auf dem Gebiet der Datenwissenschaft zu verstehen, und dieses Buch leistet hervorragende Arbeit bei der Überbrückung der "Sprachbarriere" zwischen Technologie und Wirtschaft. Das ist sehr wichtig für Menschen, die an dieser Kreuzung arbeiten.
Besonders interessant fand ich die Abschnitte über datengesteuerte Entscheidungen und den Einsatz von Data Science zur Strategieentwicklung.
Ich mag, wie praktisch, nicht so tief, nicht so flach dieses Buch ist, und ich empfehle es!
Ich las das meiste leicht und hörte hier und da auf, wo der Inhalt mehr mit meinen aktuellen Projekten in Resonanz stand. Planen Sie, bald auf bestimmte Fragen zurückzugreifen.
Es ist kein anderer Autor, der versucht, einen Bestseller unter dem Hype "Big Data" zu finden. Das Buch handelt NICHT von Algorithmen (dem Teil der Informationstechnologie, den sie nennen), sondern von der Datenwissenschaft, den Phasen vor und nach "Datenaufbereitung" und "Modellierung" in CRISP-DM.
Das Buch wird sich sowohl für Leser mit geschäftlichem oder technischem Hintergrund als wertvoll erweisen. Wenn Sie verstehen möchten, wie Sie Daten nutzen können, um geschäftliche Probleme aufzuwerten, oder wie Sie mit Kollegen zusammenarbeiten, die an Data Mining, Analysemodellen usw. arbeiten.
Das Buch enthält einige mathematische Aspekte - ich würde jedoch empfehlen, sich nicht abschrecken zu lassen und sich Zeit zu nehmen, um sich mit diesen Konzepten zu befassen, da sie einen großen Beitrag zur Verbesserung Ihres Verständnisses leisten würden.
Erweiterte Überprüfung:
Ich bin von Beruf Business Analyst, beschäftige mich also mit Geschäftsprozessen, identifiziere Geschäftsanforderungen und arbeite mit Kollegen aus verschiedenen technischen und nichttechnischen Bereichen zusammen. Data Science liegt einem Großteil der aufkommenden Geschäftspraktiken für datengesteuerte Entscheidungen zugrunde.
Als ich dieses Buch aufnahm, hatte ich keine Vorkenntnisse auf diesem Gebiet, aber ich wollte ein konzeptionelles Verständnis und eine reale Perspektive für das Gebiet der Datenwissenschaft entwickeln. Dieses Buch behandelt beide Aspekte.
Ich hatte tatsächlich mit einigen Online-Kursen begonnen, aber das Interesse ließ schnell nach, da die besprochenen Inhalte entweder zu detailliert oder zu allgemein in der Einführung waren. Der einfache Erzählstil des Buches und gute Beispiele für die Entwicklung von Geschäftsanwendungen haben jedoch dafür gesorgt, dass ich dieses Buch erst ablege, wenn ich die letzte Seite erreicht habe.
Nun eine Prise Salz hinzufügen:
Obwohl der Inhalt hervorragend ist, würde ich nur kritisieren, dass das Buch auf Links und Artikel verweist, die viel schwieriger sind als die im Buch vorgestellten Konzepte. Wenn Sie mehr über bestimmte Themen erfahren möchten, stellen Sie möglicherweise fest, dass es eine längere Brücke gibt, die noch überquert werden muss.
Insgesamt: Es ist eine Reise eines Buches, und ich bin froh, dass ich es genommen habe!
Das Buch macht einen guten Job und erklärt die in der Datenwissenschaft am häufigsten verwendeten Konzepte aus einer "geschäftlichen" Perspektive, wie der Titel schon sagt. Es geht ausreichend tief in die Mathematik ein und geht auch einige gute Beispiele durch.
Die einzige ernsthafte Einschränkung in diesem Buch besteht darin, dass es keine tatsächlichen Codebeispiele oder Pseudocodes der Algorithmen enthält. Wenn Sie also lernen möchten, wie diese Algorithmen implementiert werden, müssen Sie über dieses Buch hinausgehen. Wenn Sie jedoch mit Datenwissenschaftlern kommunizieren oder ein Data Science-Projekt als Business Manager verwalten möchten, lesen Sie dieses Buch wird Sie auf den neuesten Stand bringen.
Fazit: Wenn Sie ein Datenwissenschaftler sein möchten, würde ich empfehlen, mit so etwas wie zu beginnen Data Science von Grund auf neu: Erste Prinzipien mit Python und dann zu so etwas übergehen Eine Einführung in das statistische Lernen: Mit Anwendungen in R.. Wenn Sie ein Business Manager eines Data Science-Projekts sein möchten, ist dieses Buch genau das Richtige für Sie.
An manchen Stellen fühlte es sich so an, als gäbe es eine Menge "Hier ist ein Konzept, über das wir später sprechen werden, und es bezieht sich auf das, worüber wir auch in einem anderen Kapitel sprechen werden", so dass es nicht immer die reibungsloseste Lektüre ist, und ich Ich würde empfehlen, zwischen verschiedenen Teilen des Buches hin und her zu gehen - bestimmte Kapitel usw. erneut zu lesen.
Schließlich kann ich ihm keine 5 Sterne geben, weil ich tatsächlich große Probleme mit dem Buch habe. Das Whisky-Beispiel in Kapitel 6 (S. 178). In welcher Welt fällt ein Laphroaig in die gleiche Gruppe wie ein Aberfeldy in einem Cluster, der auf Scotch-Eigenschaften basiert?
Analytics ist nichts, was Sie lesen lernen könnten, Sie müssen es tun und es gut machen, und Sie können es mit Excel nicht nur R oder Python tun. Wenn Sie also wirklich lernen möchten, sind dies die Bücher, die Sie benötigen:
1. Marketinganalyse von Wayne Winston
2. Data Smart von John Foreman
Trockenes Lesen in mehreren Kapiteln.