Startseite
> Nonfiction
> Science
> Psychologie
> Alle lügen: Big Data, neue Daten und was das Internet uns darüber sagen kann, wer wir wirklich sind Bewertung
Alle lügen: Big Data, neue Daten und was das Internet uns darüber sagen kann, wer wir wirklich sind
Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really AreVon Seth Stephens-Davidowitz Steven Pinker,
Rezensionen: 29 | Gesamtbewertung: Durchschnitt
Ausgezeichnet | |
Gut | |
Durchschnitt | |
Schlecht | |
Schrecklich |
Vorwort von Steven PinkerBlending die fundierte Analyse von The Signal and the Noise mit dem lehrreichen Bildersturm von Think Like a Freak, einem faszinierenden, aufschlussreichen und witzigen Blick darauf, was die riesigen Mengen an Informationen, die uns jetzt sofort zur Verfügung stehen, über uns selbst und unsere Welt liefern Stellen Sie die richtigen Fragen. Am Ende eines durchschnittlichen Tages am Anfang
Rezensionen
ORIGINAL ÜBERPRÜFUNG:
Ja, "Jeder lügt", natürlich auch der Autor, denn wenn Seth Stephens-Davidowitz niemals lügt, wäre der Untertitel sicher "Außer mir in diesem Buch" gewesen. Aus unseren bisherigen Daten wissen wir also, dass der Autor lügt, und vielleicht sogar in diesem Buch. Der erste große Fehler des Autors beruht auf einer urkomischen Aussage darüber, wie schwule Männer wie Judy Garland (man kann nur annehmen, dass die Stichprobe des Autors seine schwulen Onkel und ihre Freunde sind. In diesem Fall hätte er stattdessen Edith Piaf oder vielleicht Bette Midler als verwenden sollen Sowohl Bette als auch Piaf wurden in der Tat von schwulen Gemeinschaften berühmt gemacht, während Garland ein Star für alle war, die 1939 ins Kino gingen und sie in "Wizard of Oz" sahen. Oh, ich schweife ab, sorry. Ich mochte einige davon Dieses Buch: Speziell die Teile, in denen reelle Zahlen / Daten verwendet werden: 1950 ergab eine Umfrage beispielsweise, dass 20% einer bestimmten Stichprobe einen Bibliotheksausweis besaßen, aber die offizielle Stichprobenanzahl ergab, dass nur 13% tatsächlich einen hatten. (Warum Oh, warum sollte ein Erwachsener in den USA KEINEN Bibliotheksausweis haben? Das verwirrt mich.) Aber verstehe diese lächerliche Verwendung von Wörtern: "... die überwiegende Mehrheit der schwarzen Amerikaner glaubt, unter Vorurteilen zu leiden ... Weiter Andererseits werden nur sehr wenige weiße Amerikaner zugeben, rassistisch zu sein. "Gut Trauer. JEDER hat Vorurteile (so kommen wir durch diese chaotische Welt, da wir zum Beispiel nachteilig dafür sind, zu fahren anstatt zu fliegen, weil wir Straßenfahrten mögen und gerne an Orten anhalten, die wir nie besucht haben, und Leute treffen, die wir sonst nie eine Chance hätten zu sprechen - und ich spreche über mich, da lange Flughafenlinien keinen Spaß machen), aber Rassismus ist ein ganz anderes Thema, da Rassismus nichts mit meiner nachteiligen Entscheidung zu fahren zu tun hat. Ein Abschnitt, der sich der "ausgelassenen variablen Voreingenommenheit" widmet, gehört sicherlich in ein anderes Wissenschaftsbuch dieses Jahres mit dem Titel "Wir haben keine Idee". Komischerweise schließt der Autor mit vielen Fragen, einschließlich dieses Heulers: "Woher kommen sexuelle Vorlieben?" Die Antwort ist einfach eine der Genetik (in Kombination mit der Epigenetik, die diese Gene ein- oder ausschalten kann), aber das sind alte Nachrichten. Können wir daher den Schluss ziehen, dass nicht alle Ökonomen und Statistiker aktuelle Bücher und Zeitschriften zur Genetik lesen? Kaum, aber man würde annehmen, dass ein Editor irgendwo dieses Problem lösen würde. Zusammenfassend: Wenn der Autor echte, solide Zahlen verwendet (die Anzahl der Likes auf Facebook im Vergleich zu den Internetsuchen derselben Person - und denken wir daran, dass Google keine Namen veröffentlicht, sondern die Anzahl der liebenden Frauen, die ihre Ehemänner loben Facebook und dann die Anzahl der Frauen, die "Is My Husband Gay" googeln. Nun, da ich darüber nachdenke, warum eine solche Fixierung auf schwule Angelegenheiten? Ein besserer Titel für dieses Buch wäre "Alle lügen über ihr Sexualleben" gewesen Wir wissen absolut, dass das wahr ist.
--------Wählen--------
Fast jeder sagte voraus, dass Clinton die Wahl 2016 gewinnen würde. Aber Stephens-Davidowitz hätte es nicht getan, wenn er sich Google-Daten angesehen hätte. "Clinton" oder "Trump" zu googeln sagt nicht wirklich viel (Sie könnten sie googeln, ob Sie sie hassen oder lieben), aber wenn Sie "Clinton Trump-Debatte" oder "Trump Clinton-Umfragen" googeln, die viel verraten: Sie neigen dazu, aufzulisten Der Kandidat, den Sie zuerst bei diesen Suchen unterstützen, sodass geografische Gebiete mit mehr "Clinton Trump" -Suchen als "Trump Clinton" wahrscheinlich für Clinton landen werden.
Andere Dinge, wie die Suche nach Wahlmöglichkeiten oder -möglichkeiten, die die Wahlbeteiligung vorhersagen, können analysiert werden (Gebiete mit einer hohen Bevölkerung schwarzer Amerikaner hatten nicht viele davon, und da schwarze Amerikaner als Gruppe Clinton über Trump unterstützten, würde dies weh tun Clinton).
Es zeigt sich auch, dass unerwartete Gebiete am rassistischsten sind. Anstelle der südlichen USA sucht Appalachia nach den rassistischsten Begriffen - insbesondere nach Ost-Ohio, West-Pennsylvania, West Virginia usw. und einigen benachbarten Great Lakes-Staaten (Indiana, Michigan, Illinois) - von denen einige wichtige Swing-Staaten sind Trump diese Wahl.
Der größte Prädiktor dafür, ob eine Region Trump unterstützen würde? Nicht Beschäftigung, Religion, Waffenbesitz, Einwanderung. Nein, der größte Einzelprädiktor mit der höchsten Korrelation zur Trump-Unterstützung war die Anzahl der Google-Suchen in diesem Bereich nach dem n-Wort.
Jesus fickt Christus.
--------Sport--------
Wenn Sie über 7 Meter groß sind, haben Sie eine 1: 5-Chance, es in die NBA zu schaffen. Das ist richtig: Von allen über 7 Fuß großen Männern in Amerika sind / waren 20% NBA-Spieler. Sie wundern sich, wie viel sportliches „natürliches Talent“ nur Größe + tägliches Training ist.
-------- Beziehungen --------
Gemeinsame Freunde sind ein Prädiktor für eine Beziehung nicht letzte.
Lesen Sie: Raum ist eine gute Sache.
--------Intelligenz--------
Ihr Kind wird höchstwahrscheinlich Ruhm und Erfolg erlangen, wenn es in bestimmten Bereichen aufwächst - insbesondere an Orten mit vielen Universitäten. Großstädte (Boston, NYC) und Universitätsstädte (Ithaca, NY) gleichermaßen.
Möchten Sie, dass sie noch erfolgreicher sind? Lebe irgendwo mit einer hohen Anzahl von Einwanderern. Ja, auch wenn Sie selbst kein Einwanderer sind, trägt es zum Erfolg Ihres Kindes bei, mit vielen Einwanderern zusammen zu sein.
Facebook-Likes für Mozart, Gewitter und lockige Pommes (???) korrelieren mit hoher Intelligenz. Korreliert mit geringer Intelligenz sind Facebook-Likes für Harley Davidson-Motorräder, Lady Antebellum und die Seite "Ich liebe es, eine Mutter zu sein".
~~~~~~~~ Book Riot's Read Harder Challenge ~~~~~~~
# 14: Ein Buch der Sozialwissenschaften
Nur weil Sie ein Problem mit einer Messmethode identifizieren (Selbstbericht), bedeutet dies nicht unbedingt, dass Sie die Lösung gefunden haben. Klingt Big Data äußerst vielversprechend? Auf jedenfall. Tatsächlich denke ich, wenn wir lernen, wie wir den vielen Fallstricken entkommen können, wenn wir versuchen, Big Data zu sammeln, um ein genaues Bild darzustellen (dies sind einige gewaltige Fallstricke, die in diesem Buch nicht angemessen behandelt wurden), sind Big Data möglicherweise unsere beste Wahl die menschliche Natur verstehen. Einige Aspekte von Big Data scheinen bereits solide und vertrauenswürdig zu sein. Zum Beispiel geben die Leute an, dass sie eine bestimmte Art von Film auf Netflix sehen werden - vielleicht einen Dokumentarfilm, einen intellektuellen Film oder ähnliches -, aber sie schauen stattdessen und oft eine sinnlose Komödie. Unabhängig davon, wie viele von einem Filmtyp eine Person in ihre Netflix-Warteschlange stellt, können ihre tatsächlichen Sehgewohnheiten weitaus zuverlässiger vorhersagen, welche Arten von Filmen sie gerne sehen, als was sie selbst ausgewählt haben, um sie in ihre eigene Warteschlange zu stellen.
Es gibt viele andere Beispiele im Buch, die ähnlich überzeugend sind. Sie werden exzellentes Data Mining finden, das Licht in die Dinge von der Wahl von Trump bis zu den Dingen bringt, über die sich die Leute wirklich Sorgen machen, die sie aber nicht zugeben. Daten halfen Nate Silver herauszufinden, wie Trump die Vorwahl 2016 gewann. Es stellte sich heraus, dass Trump in Gebieten gewann, in denen das Wort "Nigger" im Jahr vor der Grundschule am häufigsten gegoogelt worden war. Unter Berücksichtigung anderer Faktoren ist dies ein äußerst beunruhigender Befund. Es gab andere wirklich interessante Beispiele dafür, wonach Menschen in verschiedenen Regionen der USA und in verschiedenen Regionen der Welt suchen, die uns ein äußerst offenes Bild davon geben, was sie denken könnten. Ich sage vielleicht, weil es durchaus möglich ist, dass Menschen, die sich Sorgen über die Dinge machen, die ihre Nachbarn sagen oder tun, diese Dinge auch nachschlagen. Der Effekt könnte geringer sein als es scheint. Trotzdem sind all diese Suchanfragen ein wertvolles Fenster, zumindest in das, woran die Leute denken. Und wenn man darüber spricht, woran die Leute denken, scheint es das Hauptanliegen der Männer zu sein, wie groß ihr Penis ist. Für Frauen ist es, wenn ihre Vagina schlecht riecht. Es scheint eine regelrechte Beschäftigung zu sein.
So sehr ich dieses Buch geliebt habe und ich muss sagen, dass es viele Teile gab, die ich wirklich, wirklich geliebt habe, ich war manchmal sehr enttäuscht. Der Autor ist in seinem Denken sicherlich kritischer als die meisten anderen und bemüht sich, den Leser als solchen zu überzeugen. Wenn Sie jedoch ein Buch darüber schreiben, wie man kritisch denkt, sollten Sie wahrscheinlich zu den Top 1% der kritischen Denker gehören. Kapitel XNUMX sagt mir, dass dies wahrscheinlich nicht der Fall ist. Er zitierte die Bedenken von Experten, dass Gewalt in Filmen gewalttätiges Verhalten verursacht, und zitierte dann eine Studie, die schwerwiegende grundlegende Mängel aufwies. In der Studie wurde versucht (ich verwende den Begriff leichtfertig) herauszufinden, ob gewalttätige Filme gewalttätige Handlungen verursachten. Es stellte sich heraus, dass an Wochenenden, an denen gewalttätige Filme gezeigt wurden, die Gewalt abnahm und nicht zunahm. An Wochenenden mit gewaltfreien Filmen nahm die Gewalt zu. Verblüffend! oder so behauptet der Autor. Nicht wirklich. Es ist leicht vorstellbar, warum dies so sein könnte. Die Autoren der Studie kamen unter Verwendung der absoluten Vermutung zu dem Schluss, dass sie gewalttätige Menschen beschäftigt. Ich werde das kaufen ……. kurzfristig. Dies beweist jedoch nicht, ob gewalttätige Filme gewalttätige Handlungen verursachen oder nicht. Es kann manchmal lange dauern, bis gewalttätige Handlungen kultiviert werden. Sie können sie nicht an einem Wochenende messen. Diese Studie war kein einsamer Fehler im kritischen Denken, und das hat mich gestört, weil es in diesem Buch um kritisches Denken geht. Insgesamt muss ich jedoch sagen, dass die großartigen Teile die störenden Teile überwogen. Ich würde empfehlen. .
Der letzte Abschnitt des Buches erklärt die Einschränkungen, die Big Data mit sich bringt, und ist wirklich der am meisten begründete Abschnitt, der Rest ist fast Hagiographie. Es hätte viel getan, den dritten Abschnitt in die Beispiele der ersten beiden Abschnitte zu integrieren. Es hätte das Lob ausgeglichen und auch viel dazu beigetragen, die Mängel einiger der enthaltenen Beispiele zu erklären.
Einige coole Fakten, die in einer Menge düsterer Seltsamkeit begraben sind.
Haftungsausschluss: Ich habe dieses Buch in einem Goodreads-Werbegeschenk erhalten.
Wenn Soziologen den Inhalt des Mülls derselben Leute untersuchen, erhalten sie eine genauere Antwort.
Stellen Sie sich vor, wie viel mehr Informationen über die Internetsuche verfügbar sind.
Durch die Analyse immenser Datensätze von Google, öffentlichen Archiven, sozialen Medien und dergleichen konnte Seth Stephens-Davidowitz viele faszinierende Antworten auf rätselhafte Fragen finden. Zum Beispiel kann er durch Google-Suche nach verschiedenen Symptomen vorhersagen, wer wahrscheinlich in einem frühen Stadium von Bauchspeicheldrüsenkrebs leidet. Er kann epidemische Ausbrüche einiger ansteckender Krankheiten vorhersagen, lange bevor sie vom CDC (Center for Disease Control) angekündigt werden. Er zeigt, dass der einzige Faktor, der mit der Wahl von Trump korreliert, der Rassismus ist.
Dann gibt es die lustigen Faktoide über die Dinge, nach denen die Leute bei Google am häufigsten suchen. Am häufigsten folgt auf die Suche "Ist mein Sohn ..." "begabt", während auf die Suche "Ist meine Tochter ..." "Übergewicht" folgt. Das sagt etwas über Stereotypen aus, wie Menschen über ihre Kinder denken. Interessanterweise korreliert die Veröffentlichung eines neuen Gewaltfilms in einer Stadt mit a verringern in Gewaltverbrechen in dieser Stadt. Vielleicht liegt der Grund darin, dass gewalttätige Menschen, die den Film sehen, nicht auf der Straße sind und Verbrechen begehen.
Und hier kommen wir zum Hauptproblem dieser Art von Analyse. Zweifellos wird die Recherche und Analyse großer Datenmengen korrekt durchgeführt. Sobald jedoch ein überraschendes Ergebnis gefunden wird, ist das Verständnis der Motivationen hinter der Online-Aktivität oft subjektiv und offen für Interpretationen. Während dieses Buch sehr vorsichtig mit den zugrunde liegenden Annahmen ist, ist es ein schlüpfriger Weg, um die richtigen Interpretationen und Erklärungen zu erhalten.
Dies ist ein einfaches, schnelles Buch, das jeden ansprechen sollte, der Bücher wie mag Freakonomics: Ein Schurkenökonom erforscht die verborgene Seite von allem.
Ich habe dem Gespräch über dieses Buch nichts Einzigartiges hinzuzufügen. Ich denke, diejenigen, die es am dringendsten lesen müssen, werden es nicht tun, und das ist frustrierend.
Wenn Sie jemals eine Zahl gesehen haben, die einen Trend erklärt, lesen Sie dieses Buch. Wenn Sie jemals behauptet haben, dass ein bestimmter Prozentsatz von etwas etwas / etwas anderes war, lesen Sie dieses Buch. Wenn Sie jemals einen Politiker gesehen haben, der eine Studie zitiert und Ihr angeborener Bullshit-Filter verstopft ist, lesen Sie dieses Buch.
Wirklich einfache Begriffe auf hoher Ebene: LESEN. DIESE. BUCH.
Das späte 20. Jahrhundert hat den Zugang zu riesigen Mengen an Informationen über jeden von uns eingeläutet. Unsere Kaufgewohnheiten, Surfgewohnheiten, welche Nachrichtenquellen wir in einer sehr wachsenden Welt des Zugangs zu Nachrichten verwenden. Wir erzählen jedes Mal von uns, wenn wir auf unseren Tablets, Telefonen und Computern online gehen. Jeder Text, jeder Anruf, jede E-Mail fügt unserem digitalen Make-up Daten hinzu. Ob es Ihnen gefällt oder nicht, Daten werden für jeden von uns gesammelt und sind für einige sehr persönliche Dinge verfügbar. Es gibt ein Wissenschaftsgebiet, das sich der Analyse und Interpretation ihrer Daten widmet. Die Nebenprodukte dieses neuen Feldes werden für Gut und Böse verwendet. Unternehmen können die Informationen verwenden, um Personen anzusprechen, die ihre Artikel kaufen können (Woher wusste Goodreads, dass ich über den Kauf einer Matratze nachdachte?). Einige Data Mining-Ergebnisse könnten verwendet werden, um zu bestimmen, wie viel Menschen bestimmte Arten von Regierungsdiensten benötigen. Einige Internet-Suchanfragen in Kombination mit Kaufgewohnheiten, Forumsdiskussionen, Buchbesprechungen, Blog-Posts usw. haben zu medizinischen Entdeckungen geführt. Die Datenmenge ist atemberaubend und die Fähigkeit, Daten zusammenzustellen und zu analysieren, um nützliche Informationen zu erhalten, ist eine neue Wissenschaft, die weit über die Statistik hinausgeht. Es erfordert Kenntnisse in Mathematik, Soziologie, Psychologie, Ingenieurwissenschaften und Biowissenschaften sowie ein Verständnis der menschlichen Natur usw., um nützliche Informationen abzubauen. Was Stephens-Davidowitz entdeckt hat, ist, dass jeder über ... alles lügt. Seine Hauptdiskussion ist, dass Menschen in Umfragen und Umfragen usw. selten die Wahrheit sagen. Sie lügen auch auf ihren Online-Datengewohnheiten. Oft für sich. Diese kleine Tatsache erschwert offensichtlich das Mining von Daten zum Beispiel in den Roten Staaten mit ihren angegebenen evangelischen Haltungen, die die meisten Pornos konsumieren und die höchste Rate an Internet-Suchanfragen nach Zugang zu Abtreibungen usw. aufweisen. Menschen lügen in ihren eigenen Suchanfragen, um sich zu verstärken ihre eigenen Positionen und nicht unbedingt nach Antworten suchen. Solche Aktionen sind nicht überraschend, erschweren jedoch die Analyse (Untertreibung).
Dieses Buch war eine sehr interessante Datengrundierung. Die Datenmenge, die die meisten von uns jeden Tag generieren, hat so viel mehr zu bieten, und Stephens-Davidowitz erklärt die Grundlagen hervorragend. Einige seiner Beispiele und sein Ansatz sind etwas oberflächlich, jugendlich, Popkultur. Ich bin nicht neugierig auf die Benutzer von Pornhub, die durchschnittliche Penisgröße oder Baseball-Statistiken. Einiges davon war albern und gewalttätig; Seine Jugend zu verraten und offen auf das einzugehen, was sein Data Mining als Publikum junger Männer empfand. Bah. Außerdem zitierte er Malcolm Gladwell als eine Ressource, die meiner Ansicht nach niemals genutzt werden sollte, wenn Sie hoffen, eine Grundlage zu schaffen, die auf Erfahrung auf diesem Gebiet und Glaubwürdigkeit in diesem Bereich basiert. Trotzdem hat mir das Buch gefallen und ich denke, dass Stephens-Davidowitz sowohl als Wissenschaftler als auch als Schriftsteller eine sehr überzeugende und erfolgreiche Zukunft hat.
4 Sterne
Lesen Sie weiter kindle
Stephens-Davidowitz wurde von Mentoren und Beratern angewiesen, Google-Suchanfragen nicht als lohnende Daten zu betrachten. Je mehr er sich diese Daten ansah, desto mehr war er davon überzeugt, dass Google-Suchanfragen die besten Daten enthielten, um festzustellen, worüber die Menschen besorgt sind. Er hat einige interessante Trends aufgedeckt, die durch direkte Befragung nicht erkennbar sind, weil sich Menschen manchmal für ihre Ängste, Gefühle, Vorurteile und Vorlieben schämen.
♾
Dieses Buch hat mir nicht wirklich gefallen. Teilweise liegt der Grund darin, dass ich es mir angehört habe und Stephens-Davidowitz Diagramme, Grafiken und Datenpunkte liefert, die in der Audioversion offensichtlich nicht dargestellt werden können. Diese helfen mir normalerweise dabei, Dinge leicht zu erfassen und möglicherweise Seiten mit Material zu umgehen, das für mich nicht so interessant ist. Es war nicht so, dass sein Material hart war, es war so, dass mir oft nicht gefiel, worüber er sprach. Er neigte dazu, sich auf abweichendes Verhalten zu konzentrieren, z. B. sexuelle Raubtiere, Missbrauch, Pornos usw. Man könnte argumentieren, dass diese Verhaltensweisen wichtig zu verstehen und daher einen Blick wert sind. Möglicherweise. Wenn jedoch "jeder lügt", könnte man argumentieren, dass wir nicht auf Abweichungen achten müssen, um Unwahrheit zu finden.
Was wir entdecken, ist, dass wir, um Stephens-Davidowitz 'These zu testen, dass „jeder lügt“, ziemlich viel Zeit mit Statistiken und der Erstellung von Studien verbringen müssen oder, wie er es gewohnt ist, Big Data zu studieren. Big Data gleicht wahrscheinlich Unstimmigkeiten in den Gründen für unsere Google-Suche aus, z. B. dass nicht ich am Herpesvirus interessiert bin, sondern mein Bruder, denn am Ende spielt es keine Rolle, warum wir die Suche durchgeführt haben. Was zählt ist, dass wir die Suche durchgeführt haben. Außerdem lüge ich vielleicht darüber, dass mein Bruder das Virus hat, aber mein Interesse an dem Thema ist keine Lüge.
Stephens-Davidowitz hat bisher eine Karriere mit dem Studium von Big Data gemacht und uns Wege aufgezeigt, wie wir es in Scheiben schneiden und würfeln können, damit es für unsere Sicht auf die Welt nützlich ist. Das einzige ist, dass mich das, was Big Data uns sagt, nicht so interessiert wie er. Er hatte eine Ausbildung zum Wirtschaftswissenschaftler absolviert und gegen Ende des Buches einige Bereiche kennengelernt, die ich interessanter fand, wie den Begriff der Regressionsdiskontinuität, ein Begriff, der verwendet wird, um ein statistisches Instrument zu beschreiben, mit dem die Ergebnisse von Menschen sehr gemessen werden können in der Nähe einer willkürlichen Grenze. ** SD spricht über die Verwendung dieses Tools bei Bundesinsassen und entdeckt, dass Kriminelle, die härter behandelt wurden, bei ihrer Freilassung mehr Verbrechen begangen haben. SD studierte aber auch Schüler auf beiden Seiten des Zulassungsschlusses für die renommierte Stuyvesant High School: Diejenigen, die Stuyvesant besuchten, hatten im späteren Leben keinen signifikanten Leistungsunterschied als Schüler, die dies nicht taten.
Anscheinend ist Stephens-Davidowitz wegen in die Datenwissenschaft gegangen Freakonomics, das Bestseller-Buch von Steven D. Levitt. Er glaubt, dass viele der nächsten Generation von Wissenschaftlern in allen Bereichen Datenwissenschaftler sein werden. Ich habe das Hörbuch fertiggestellt, eine weitere Studie, die er auf den letzten Seiten zur Kenntnis genommen hat. Anscheinend beenden nur wenige Leser "Abhandlungen" von Ökonomen. Er glaubt, dass dies sein großer Beitrag zu unserer Wissensbasis ist, und es besteht kein Zweifel, dass seine Widersprüchlichkeit gezeigt hat, wie Big Data effektiv genutzt werden kann.
Wenn ich so mutig bin, kann ich vielleicht einen Grund vorschlagen, warum viele Leserinnen nicht so interessiert an dem präsentierten Material sind oder an Stephens-Davidowitz selbst (er war / ist offenbar auf der Suche nach einer Freundin). Bleib weg von den abweichenden Sexsachen, Seth. Es mag Sie interessieren, aber ich kann garantieren, dass weniger Frauen dieses ansprechende oder beruhigende Gesprächs- oder Lesematerial finden werden.
Eine interessante Folge der Datenansicht dieser Ökonomen ist die Frage, ob die Wahrheit wichtig ist. So bin ich zu diesem Buch gekommen. Kürzlich fragte Carlos Watson auf PBS 'The Third Rail mit Ozy, ob die Wahrheit wichtig sei. Auf den ersten Blick scheint die Antwort offensichtlich zu sein, und zwei Seiten diskutierten diese Frage. Eine Seite sagte natürlich, dass Wahrheit wichtig ist… aber die meisten von uns wissen, dass die Wahrheit eines Mannes die Lüge eines anderen Mannes ist. Die andere Seite sagte: "Jeder lügt." Es hat mich zum Nachdenken gebracht ... Ich denke, die beiden Wege, irgendwann zu dem Begriff des Lügenschwalbenschwanzes zu gelangen, und man muss zu dem Schluss kommen, dass die Wahrheit möglicherweise nicht so wichtig ist, wie wir denken. Was zählt, ist das, was wir für wahr halten.
Schließlich scheint Stephens-Davidson in gewissem Maße mit Cathy O'Neill, Autorin von, übereinzustimmen Waffen der Mathezerstörung, darin stimmt er zu, dass Sie Algorithmen am besten nicht ohne menschliche Optimierungen und Eingriffe laufen lassen. Die besten Ergebnisse werden erzielt, wenn Menschen ihre besonderen Beobachtungen sowie ihr Wissen und ihre Fachkenntnisse anwenden zusammen mit Große Daten.
** SD beschreibt es so: “Any time there is precise number that divides people into two different groups, a discontinuity, economists can compare, or regress, the outcomes of people very very close to the cut off.”
Er weist auf Probleme mit der traditionellen Berichterstattung hin. Im Abschnitt über Kindesmissbrauch und Abtreibungen deuten Google-Suchanfragen darauf hin, dass der Kindesmissbrauch während des wirtschaftlichen Abschwungs zunimmt, während die Zahlen der Regierung fälschlicherweise nur geringe Veränderungen anzeigen. Die Schließung von Abtreibungskliniken hält sie nicht auf, sondern führt einfach zu mehr selbstinduzierten Abtreibungen. Beides geschieht aus den Büchern, aber es gibt jetzt überzeugende unterstützende Daten, die uns zeigen, was wir tun müssen, um fundiertere Entscheidungen mit Ressourcen zu treffen.
Big Data hat einen Vorteil gegenüber jeder anderen Art von Umfrage, da nur wenige erkennen, dass sie gesammelt wird. Wir lügen also nicht, um besser auszusehen. Es ist auch anonym und aggregiert, daher ist bei der Erstellung von Schlussfolgerungen Vorsicht geboten. Zum Beispiel kommt der Autor aufgrund von Pornhub-Suchen zu dem Schluss, dass etwa 5% der Männer schwul sind, weil sie nach schwulen Pornos gesucht haben. Dies schien eine vernünftige Schlussfolgerung zu sein, bis er darauf hinwies, dass 15% der Frauen nach Vergewaltigungspornos suchen. Heißt das, sie wollen vergewaltigt werden? Der Autor sagt natürlich nicht und macht eine große Sache aus dem Unterschied zwischen Fantasie und Realität. Das lässt mich seine erste Schlussfolgerung in Frage stellen, obwohl es ungefähr richtig erscheint.
Darmreaktionen sind oft falsch und er liefert mehrere Beispiele, bei denen es aufgrund kognitiver Vorurteile falsch ist. Er weist auch auf "Der Fluch der Dimensionalität" hin. Bei ausreichend großen Datenmengen kommt es nur zufällig zu Korrelationen. Zum Beispiel gibt es Grafiken, die zeigen, wie genau die Diagnose von Autismus mit dem Verkauf von Bio-Lebensmitteln oder der Popularität von Jenny McCarthy übereinstimmt. Diese zu trennen ist ein ganz anderes Problem.
Big Data gibt uns nur Trends, die wir untersuchen müssen. Wir können es nicht auf individueller Ebene verwenden. Während 1000 Menschen suchten, wie sie ihre Freundin töten könnten, wurde in seinem Beispiel nur 1 Mädchen getötet. Das ist schrecklich und hätte vielleicht gestoppt werden können, wenn sich jemand seinen Suchverlauf angesehen hätte. Aber geben wir die Privatsphäre eines jeden für eine 1: 1000-Chance auf, einen Mord zu verhindern? Einige mögen bereit sein, aber ich bin es nicht, also haben wir auch neue Fragen zu beantworten.
Das Hörbuch war gut erzählt und ich habe die Grafiken nicht zu sehr vermisst. Sie sind im zusätzlichen Material enthalten, aber nicht praktisch, als ich zuhörte, und das Buch berücksichtigte dies größtenteils. In beiden Formaten sehr zu empfehlen.
Worum geht es in dem Buch? Ich freue mich, Ihnen mitteilen zu können, dass es echte Informationen über die Wissenschaft der Statistik und das Sammeln von Big Data enthält und wie sich die fehlerhafte Auswahl von Studienparametern oder Annahmen darüber, welche Daten für das Studium relevant sind, auf die Schlussfolgerungen auswirkt (soweit ich weiß - ich bin ein Dummkopf in wissenschaftlicher Mathematik, obwohl ich einen Statistikkurs bestanden habe). Der Autor verwendete für mich wirklich interessante neue Methoden, um statistische Studien zu formulieren, hauptsächlich unter Verwendung der forensischen Tools von Google und anderer Quellen.
Ich war schockiert darüber, was die Leute in die Google-Suche eingeben (die Google in anonymen Daten zusammenstellt). Zum Beispiel scheint die Rasse von Präsident Obama Rassisten wirklich dazu gebracht zu haben, aus ihren Schränken zu kommen. Der Vergleich von Umfrageinterviews mit Personen, die angeben, rassistisch zu sein (ein geringer Prozentsatz), mit dem Prozentsatz derjenigen, die von Staat zu Bundesstaat „n ***** Witze“ gegoogelt haben, zeigt einige wirklich verborgene Taschen unerwarteten Rassismus - und den Gesamtprozentsatz der rassistischen Suchanfragen bei Google war viel höher als der Rassismus, den typische Umfragen zeigen. Darüber hinaus suchten die Orte, die Trump lieben, am meisten nach „n ***** witzen“. Korrelation? Idk, niemand weiß es für die Aufzeichnung, aber ich denke ja.
Auch von Interesse für mich (bitte sprengen Sie meine Eier nicht wegen meiner prurienten Interessen - und vielleicht gibt es ein Wortspiel in diesem Satz, hehheh - lesen Sie weiter) Männer machen wirklich wirklich viel über Penisgrößen bei Google. Komm schon, Jungs, ruhe dich aus! (Ja, ich versuche, snarky zu sein, da die zu große Ruheposition Teil dessen ist, worüber Männer am meisten besorgt zu sein scheinen!) Männer streifen in riesigen Mengen durch Pornoseiten - schockierend, oder? - Das ist gut für Statistiker, die nach der Wahrheit über Sexualität suchen, um sie in ihre mathematischen Gleichungen einzugeben. Basierend auf Google-Pornosuchen schätzt der Autor, dass 5% der Bevölkerung schwul sind. (Übrigens verwenden Konservative meistens das Wort "homosexuell", während Liberale in Google-Suchanfragen statistisch gesehen den Ausdruck "gleichgeschlechtlich" verwenden.)
Um nicht zu vernachlässigen, was Google über die größte sexuelle Sorge der Damen sagt, kann ich nur sagen: Oh. Meine. Gott. Vagina-Geruch. "Ja wirklich?" Ja wirklich!!
Alle Statistiker sollten dies zur Kenntnis nehmen - Befragungsumfragen zeigen häufig andere Ergebnisse als die in Google-Suchanfragen ermittelten Statistiken über den Prozentsatz derer, die wo und wann denken / fühlen, insbesondere in diesen moralisch gewichteten oder persönlich peinlichen Bereichen der Gesellschaft. Natürlich ist die Interpretation immer mit möglichen fehlerhaften Urteilen behaftet, unabhängig von der Quelle der Stichprobe.
Ich habe diesen versicherungsmathematischen Versicherungstabellen immer weit mehr vertraut als politischen oder medialen Spins oder sogar Universitätsdatenstudien. Jetzt füge ich Google-Statistiken zu meiner Liste der vertrauenswürdigen Informationen hinzu. Natürlich, lieber Leser, ich weiß, dass alle Zusammenstellungen von Daten irrtümlich oder absichtlich manipuliert oder massiert werden können. "Müll rein, Müll raus" gilt immer noch ... was auch bei "Everybody Lies" der Fall ist. Soweit ich weiß, schien das Buch über der Wissenschaft zu stehen. Ich bin kein Wissenschaftsgehirn, sondern ein Amateur-Möchtegern.
Meine einzige Irritation bei diesem Buch ist die Art und Weise, wie die Informationen erklärt werden. Sehr geehrter Leser, meine Beschwerde ist höllisch subjektiv. Ehrlich gesagt kann ich es nicht genau sagen. Der Autor schien zu versuchen, sein aktuelles 200-seitiges Buch auf 300 Seiten auszufüllen, indem er einen persönlichen emotionalen Füllstoff hatte, der dem keuchenden ähnelt, abgesehen davon, dass viele Shows das emotionale Hoch der Zuschauer über das, was diskutiert wird, steigern. Kennen Sie diese TV-Sendungen, die nach jeder Werbepause die gesamte Sendung in den vorangegangenen Minuten vor der Werbepause atemlos montieren? Und sie hatten oft einen schockierten Teaser darüber, was vor der Werbepause gezeigt wird? Wie auch immer, ich hatte das Gefühl, dass in diesem Buch irgendwie viel von dieser Art emotionaler Manipulation (und Erweiterung des Materials) vor sich geht. Ich habe den persönlichen "lustigen" Füllstoff einfach nicht so sehr geschätzt. Vielleicht gab es nicht genug Snark. Ich bevorzuge snarky Humor, wenn es Humor gibt. Beiß mich. Vielleicht hätte ein enger geschnittenes Buch für mich besser funktioniert, wenn ich es gerne gelesen hätte. Wie auch immer, mir ist klar, dass ich hier zappele. Nichts davon mag für Sie zutreffen.
Letztendlich ist dies ein Buch, das es wert ist, für den allgemeinen Leser gelesen zu werden (für die Aufzeichnung habe ich definitiv ein beleuchtetes / geschichtliches Gehirn, also ja, ich bin ein allgemeiner Wissenschaftsleser!) Und die erklärenden Informationen darüber, wie statistische Studien durchgeführt werden (die Nur eine Mathe-College-Klasse, die mich engagiert hat) und was die Leute wirklich fühlen und denken (wenn Google-Suchanfragen geglaubt werden sollen und ich denke, dass sie es sind).
Enthalten sind umfangreiche Abschnitte zu Anmerkungen und Index.
Das andere Problem ist ein wachsender Trend bei Menschen, die Datenbücher schreiben. Sie möchten umgangssprachlich schreiben, damit es informell und leicht lesbar erscheint. Sie wollen die Leute nicht abschrecken, wenn sie über Algorithmen und ähnliches reden.
Leider macht die Verwendung von Tonnen von Satzfragmenten und umgangssprachlichen Phrasen ein Buch wie dieses nur schwieriger zu lesen. Es ist Präzision und Klarheit, die Bücher leicht verständlich machen. Mehrdeutigkeit einzuführen, um wie ein freundliches Gespräch zu klingen, ist genau der falsche Ansatz.
Insgesamt gibt es hier eine Reihe interessanter Fakten. Ich denke, Seth macht eine Menge falsch, wenn er nicht vollständig versteht, warum bestimmte Suchbegriffe verwendet werden.
Ich suchte nach etwas Nuancierterem, einer langen und strengen thematischen Untersuchung der menschlichen Tendenz und Daten als äußerst nützliches Werkzeug, aber nicht im Mittelpunkt. Stattdessen ist es in dem Buch eher eine Sammlung von Beobachtungen. Jedes Mal, wenn Stephens-Davidowitz eine Idee hat, sucht er nach einer Antwort aus den verfügbaren Daten und fährt dann fort. Die Fragen beziehen sich etwas auf das private Verhalten des Menschen, das wir traditionell nicht beobachten können. Das Tool scheint hier etwas mehr im Mittelpunkt zu stehen, aber er diskutiert die Nachteile und alle ethischen Implikationen von Big Data nicht so ausführlich, bis auf einen kurzen Abschnitt am Ende des Buches.
Nun, das ist völlig in Ordnung, für eine ungezwungene und leichte, aber dennoch nützliche Lektüre. Noch wichtiger ist, dass diese Art der Forschung und das Thema Big Data noch relativ neu sind. Es dauert Jahrzehnte und Jahrzehnte, um eine Literatur aufzubauen, die groß genug ist, um wirklich bedeutungsvolle und tiefgreifende Schlussfolgerungen zu ziehen. Die Zeit für das Buch meines Geschmacks ist einfach noch nicht gekommen, aber dieses würde, wie der Autor feststellt, hoffentlich das Interesse an jungen Menschen, jungen Sozialwissenschaftlern, wecken und sie zu potenziell fruchtbaren Themen und Forschungsmethoden führen. Deshalb ist es ein 3-Sterne-Hotel.
Dies ist eine gute Wissenschaft für Konsumenten von Sesselwissenschaften wie mich und eine gute Lektüre für diejenigen, die sich nur gerne mit Sachbüchern beschäftigen. Es ist sowohl prägnant als auch reichhaltig. Dokumentiert mit Notizen und Index, und die eigene Website des Autors, die er verspricht, enthält viel mehr harte Informationen.
Es könnte sich als Vier-Sterne-Buch herausstellen, wenn mehr zum Thema veröffentlicht wird. Aber im Moment fordere ich alle auf, es zu lesen. Als nächstes hoffe ich, Seths nächstes Buch und mehr zu diesem Thema zu lesen. Ja, Seth, ich habe bis zum Ende gelesen, und trotzdem bin ich froh, dass Sie in Ihrem Fazit nicht lange darum gekämpft haben, etwas zu sagen ... imo, Sie haben es perfekt beendet.
Persönlich gesehen einer der wichtigsten Punkte aus dem Intro. und einer der wichtigsten Punkte aus der Schlussfolgerung ist erstaunlich relevant. Hier ist das Ding. Unser Jüngster sucht eine Schule, in die er wechseln kann, und gleichzeitig suchen wir nach unserer ersten Gemeinschaft nach dem Ruhestand. Wir hoffen, ein College und eine Stadt zu finden, die wir alle drei möchten, und ein bestimmtes Studienfach für unser Kind. Am Anfang dieses Buches stehen zwei Karten, eine, die Trump-Anhänger enthüllt, und eine, die Taschen von Rassisten zeigt, die durch ihre Google-Suche aufgedeckt wurden. Dies sind offensichtlich relevante Daten für uns, wenn wir uns für einen Teil des Landes entscheiden ziehen nach. Und am Ende des Buches sagt Seth meinem geekigen Sohn, auf welche Studien er sich konzentrieren soll:
"Ich hoffe, es gibt gerade eine junge Person, die dies liest und ein wenig verwirrt darüber ist, was sie mit ihrem Leben anfangen will. Wenn Sie ein bisschen statistische Fähigkeiten, viel Kreativität und Neugier haben, steigen Sie in das Datenanalyse-Geschäft ein. ""
(Nun, mein junger Mensch hat mir zugehört, wie er Teile aus dem Buch gelesen hat, aber sonst hätte das direkt auf ihn zugeschnitten werden können.)
Lies das Buch. Lassen Sie sich von meiner langen Rezension nicht täuschen. Ich teile nur ein bisschen von dem, was ich daraus gelernt habe.
Andere Buchpfeile:
"[P] Schnürsenkel mit den höchsten rassistischen Suchraten umfassten den Bundesstaat New York, West-Pennsylvania, Ost-Ohio, das industrielle Michigan und das ländliche Illinois sowie West Virginia ... Die wahre Kluft ... war nicht Süd gegen Nord; es war Ost gegen den Westen. So etwas gibt es westlich des Mississippi nicht. Und Rassismus war nicht auf Republikaner beschränkt ... "
Die 4 Möglichkeiten von Big Data lassen sich zusammenfassen:
"Neue Datentypen anbieten ..."
"Bereitstellung ehrlicher Daten ..."
"Erlaubt uns, kleine Untergruppen von Menschen zu vergrößern ..."
"Erlaubt uns viele kausale Experimente zu machen ..."
Nun kommen wir zu einem Beispiel dafür, was an dem Buch nicht perfekt ist. Erstens Kontext: Seth ist ein vorsichtiger Wissenschaftler; Er kennt Stichprobenfehler, Verzerrungen, Korrelationen, die nicht gleichbedeutend mit Kausalität sind, usw. Manchmal vergisst er jedoch alternative Erklärungen und Interpretationen. Das heißt, wenn das Buch uns Daten zeigt, ist es in Ordnung, aber manchmal, wenn Seth die Daten interpretiert, wird er von einem Irrtum gefangen. Zum Beispiel sagt er: "[O] der Minderheit der Frauen, die PornHub besuchen, gibt es eine (25%) Untergruppe, die ... nach Vergewaltigungsbildern sucht ... manchmal haben Menschen Fantasien, die sie gerne nicht hätten und welche nicht sie dürfen es niemals anderen gegenüber erwähnen. " Vielleicht ... oder vielleicht sind sie Opfer, die versuchen zu verarbeiten, oder vielleicht sind sie Möchtegernautoren, die Nachforschungen anstellen, oder sie sind Männer, die lügen, um sich als Frauen zu präsentieren ... Es sieht für mich so aus, als wollte Seth nicht denken zu schwer mit diesem ....
Mit Big Data können Forscher Teilmengen demografischer Gruppen und geografischer Regionen vergrößern ... "Ein weiterer großer - und immer noch wachsender - Vorteil von Daten aus dem Internet besteht darin, dass Daten aus der ganzen Welt einfach gesammelt werden können. .. Und Datenwissenschaftler erhalten die Möglichkeit, auf Zehenspitzen in die Anthropologie einzusteigen. "
Big Data könnte im Gesundheitswesen wirklich helfen. Wenn ich hier fertig bin, werde ich die Seite PatientsLikeMe.com besuchen. "Heywood hofft, dass Sie Menschen in Ihrem Alter und Geschlecht mit Ihrer Vorgeschichte finden können, die ähnliche Symptome wie Sie melden - und sehen, was für sie funktioniert hat."
Ich möchte auch darüber nachdenken zu lesen Unwiderstehlich: Der Aufstieg süchtiger Technologie und das Geschäft, uns gefangen zu halten und Super Crunchers: Warum das Denken nach Zahlen der neue Weg ist, klug zu sein.
Dies ist ein ansprechendes und informatives Buch über die enorme Menge an online verfügbaren Daten und darüber, was es über die Gesellschaft aussagt. Ich habe es daneben gelesen Dataclysm und fand, dass Everybody Lies bei weitem das bessere von beiden ist, eine Fülle von Informationen auf zusammenhängende Weise präsentiert und weniger unbegründete Annahmen trifft. Der Autor war Datenwissenschaftler bei Google und stützt sich zu einem großen Teil auf die Suchanfragen auf der Website sowie auf Informationen von Websites wie Facebook und Pornhub.
Die Daten enthalten eine Menge interessanter Informationen, von der Rate rassistischer Durchsuchungen im Rostgürtel, die den Aufstieg von Donald Trump vorhersagen, über häufige Körperangst und ob sie tatsächlich für das andere Geschlecht von Bedeutung sind, bis hin zu einer Schätzung, wie viele Männer schwul sind und ob dies je nach Geografie variiert (es scheint nicht), je nach Rate der selbstinduzierten Abtreibungen. Dies ist ein großartiges Buch zum Lesen, wenn Sie ungewöhnliche Faktoide lieben, sei es über sexuelle Neigungen oder wie Sportfans gemacht werden.
Der Autor schreibt auch auf überzeugende Weise über die Verwendung von Big Data selbst, und während er evangelisch darüber wird (offensichtlich bevorzugt er es, seine ganze Zeit in statistisch signifikante Daten einzutauchen, findet er Romane und Biografien zu „klein und nicht repräsentativ“ und daher uninteressant) gibt es dort sicherlich viele Möglichkeiten. Im Gesundheitsbereich kann beispielsweise das Zusammenstellen früher Suchanfragen nach Symptomen mit späteren Suchanfragen zur Behandlung einer Diagnose Ärzten helfen, Bauchspeicheldrüsenkrebs in einem früheren Stadium zu erkennen, während Epidemien anhand von Symptomen verfolgt werden können Der Autor ist auch daran interessiert, wie das Anwenden von Daten ein Feld revolutionieren kann, indem er ausführlich die Daten diskutiert, die den Erfolg des amerikanischen Rennpferdes Pharao vorhergesagt haben. (Mit "ausführlich" meine ich 9 Seiten; dies ist ein Buch, das sich durch ein Buch bewegt breites Themenspektrum schnell.)
Insgesamt ist das Schreiben ansprechend und das Buch hängt gut zusammen, ist informativ und widersteht größtenteils dem Drang zu spekulieren. Der Autor macht jedoch einige Annahmen, auf die es sich hinzuweisen lohnt. Zum einen werden die Google-Suchanfragen von Personen ernsthaft und aus persönlichen Gründen durchgeführt. Sicherlich könnten Sie nach „Depressionssymptomen“ suchen, weil Sie oder jemand, den Sie kennen, depressiv sind. Möglicherweise möchten Sie aber auch im Voraus darauf vorbereitet sein, Warnzeichen zu identifizieren, oder Sie sind in den Medien auf etwas gestoßen, das Ihr Interesse geweckt hat, oder Sie sind ein Student, der eine Arbeit zu diesem Thema schreibt. Wenn Sie jedoch bereits mit Depressionen vertraut sind, ist es unwahrscheinlich, dass Sie die Symptome googeln. Nichts davon bedeutet, dass die Feststellung des Autors, dass die Suchraten für Depressionssymptome zwischen Chicago und Hawaii um 40% unterschiedlich sind, nicht relevant ist, aber Daten, die sowohl zu viel als auch zu wenig enthalten, dienen eher als Ausgangspunkt für die Forschung als als endgültige Schlussfolgerung. Es ist sicherlich kein Beweis dafür, dass eine bessere Geografie doppelt so wirksam ist wie Antidepressiva, wie der Autor vorschlägt.
Die andere Annahme ist, dass jeder lügt: Das Buch besteht darauf, hauptsächlich aufgrund der Tatsache, dass typisch rosige Social-Media-Beiträge nicht all diese unglücklichen oder hasserfüllten Suchanfragen widerspiegeln. Das selektive Teilen von Informationen scheint mir nicht unbedingt zu lügen, aber der Autor scheint investiert zu sein, um den Titel des Buches zu beweisen. Zum Beispiel erörtert er eine bestimmte Art von Steuerbetrug: In Gebieten, in denen nur wenige Steuerfachleute oder Personen leben, die für das System in Frage kommen, geben 2% der Personen, die von dieser Lüge profitieren könnten, dies an, während in Gebieten mit hohen Konzentrationen von beiden der Steuersatz angegeben wird des Betrugs ist rund 30%. Der Autor kommt zu dem Schluss, dass „der Schlüssel nicht bestimmt, wer ehrlich und wer unehrlich ist. Es ist entscheidend, wer schummeln kann und wer nicht. “ Diese trostlose Sicht auf die Welt erklärt nicht die 70%, die selbst in Gebieten mit hohem Wissensstand nicht schummeln. Die Feststellung, dass eine beträchtliche Anzahl von Menschen betrügt, wenn sie wissen, wie weit davon entfernt ist, dass jeder dies tut.
Stephens-Davidowitz ist also wie der Autor von Dataclysm wahrscheinlich ein besserer Statistiker als Soziologe. Wenn Sie sich jedoch für Big Data interessieren oder einen Blick auf die Gedanken und Ängste werfen möchten, nach denen Google gefragt wird, weil sie nicht gerne mit anderen teilen, ist dies das Buch, das ich empfehle. Sie werden sicherlich eine Menge interessanter Leckerbissen davon bekommen, zusammen mit vielleicht neuen Hemmungen, Dinge in Google einzugeben!
Die Einführung hat mich schon begeistert. Seine Prämisse ist, dass wir uns alle, die Meinungsforscher und uns selbst anlügen, aber nicht die weiße Box, in der Sie Internetsuchen eingeben. Sowohl vor als auch nach der Wahl waren alle verrückt, um herauszufinden, warum Trump so viel besser abschneidet, als Umfragen vermuten lassen, und suchten nach Faktoren, die dies erklären würden. Es gab nur einen. "[Nate] Silver stellte fest, dass der einzige Faktor, der am besten mit Donald Trumps Unterstützung bei den Vorwahlen der Republikaner korrelierte, die Maßnahme war, die ich vor vier Jahren entdeckt hatte. Bereiche, die Trump in der größten Anzahl unterstützten, waren diejenigen, die die meisten Google-Suchanfragen nach 'n durchgeführt haben ----- '. " (Er benutzt das wahre Wort, das die Abneigung gegen das, was er entdeckt hat, vertieft.)
Trotz Obamas zwei einfachen Wahlsiegen und der Erzählung, dass wir nach dem Rassismus waren, erzählen die Google-Suchdaten eine andere Geschichte über die Reaktionen auf diese Siege.
Was geschah unmittelbar nach den Schießereien in San Bernadino online? Eine Menge Leute suchten nach "Muslime töten".
Und es gibt noch viel mehr über Sex, Kindesmisshandlung und Sexismus. Wussten Sie, dass der häufigste Begriff zur Vervollständigung des Satzes "Ist mein Sohn ..." "begabt" oder eine Variante davon ist und der häufigste Begriff zur Vervollständigung des Satzes "Ist meine Tochter ..." " Übergewicht'?
Amerika ist nichts anderes als vielleicht gute Absichten.
Welchen Nutzen glaubt er, kann das sein? Nun, er hatte einige gute Vorschläge, und keiner von ihnen basiert darauf, herauszufinden, wer eine Person ist, die eine Suche durchgeführt hat. Wenn beispielsweise in einer bestimmten Stadt nach einem Spike für "Muslime töten" gesucht wird, könnten einige zusätzliche Polizisten eingesetzt werden, um die lokale Moschee zu überwachen, bis der Spike nachlässt. Er verbringt einen Moment damit, darüber zu sprechen, wie Big Data nicht dazu gedacht ist und sein sollte, herauszufinden, wer konkret Verbrechen begehen wird.
Als ich mit diesem Buch fertig war, war ich ein bisschen entmutigt darüber, wer Amerikaner zu sein scheinen, aber es ist besser zu wissen. Ich hoffe, dass diese Art von Studie fortgesetzt wird, damit wir versuchen können, realistisch mit unserer Gesellschaft zu arbeiten, anstatt so zu tun, als wäre es etwas, was es nicht ist.
Der Autor ist ein Big-Data-Spezialist und hat ein ansprechendes und zugängliches Buch über ein hochtechnisches Thema geschrieben. Sein analytisches Arsenal umfasst Google Trends, Google Correlate, Google N-Gramm und Google Adwords. Er verwendet diese Tools, um überraschende und sogar entsetzliche Enthüllungen über sexuelle Neigungen aufzudecken, die in Google-Suchanfragen vermittelt werden. Von dort geht er zu ernsteren Themen über, wie der Rolle des Rassismus bei politischen Ergebnissen und geschlechtsspezifischen Themen bei der Elternschaft. Das meiste, was er enthüllt, ist unerwartet und widerspricht weitgehend der herkömmlichen Weisheit.
Stephens-Davidowitz spricht ein breites Spektrum von Interessen in diesem Buch an. Er untersucht ein Konzept namens Doppelgänger-Suche, mit dem der Verlauf von David Ortiz 'Karriere im Major League Baseball vorhergesagt wurde. (Es ist eine perverse Ironie, dass Ortiz das Opfer einer falschen Identität war - ein bildlicher „Doppelgänger“ - bei einer fast tödlichen Schießerei).
Es wurde viel über den Missbrauch von Big Data geschrieben. Stephens-Davidowitz ist sich dieses Problems nicht unbewusst, obwohl seine Bedenken die Befürchtungen derjenigen, die sich mit Datenschutzfragen befassen, nicht zerstreuen werden. Wenn überhaupt, könnte die Kraft der Werkzeuge, mit denen er arbeitet, diese Angst verstärken.
Stephens-Davidowitz erklärt leserfreundlich neben der Doppelgangersuche auch andere technische Konzepte. Er befasst sich mit dem „Fluch der Dimensionalität“ - einem für die sozialwissenschaftliche Forschung relevanten Problem, bei dem sich die Anzahl der Variablen nahezu unendlich erweitern kann. In einem anderen amüsanten Beispiel, mit dem sich viele Leser identifizieren könnten, warnt er vor der Suchtkraft von Metriken. Er erzählt, wie eine Marketingprofessorin von ihrer Zählung auf einem Schrittzähler besessen wurde: „Sie ging früh am Morgen, spät in der Nacht, fast zu jeder Tageszeit - zwanzigtausend Schritte in einem bestimmten Zeitraum von vierundzwanzig Stunden. Sie überprüfte ihren Schrittzähler hunderte Male pro Tag, und vieles, was von ihrer menschlichen Kommunikation übrig blieb, war, mit anderen Schrittzählernutzern online zu sein und Strategien zur Verbesserung der Punktzahl zu diskutieren. “ (Standort 2908)
Eine faszinierende Idee, die Stephens Davidowitz vorschlägt, ist, dass die Big-Data-Analyse die Grenze zwischen Korrelation und Kausalität durch A / B-Tests überschreiten kann. Er bietet einige Tests an; Der Leser wird erstaunt sein, wie stark die Daten von einer anfänglichen Darmreaktion abweichen.
Erklärungen des Verhaltens schwanken ständig zwischen dem Mikrokosmos von Geschichten aus individuellen Blickwinkeln und zuversichtlichen Verallgemeinerungen auf der Grundlage fehlerhafter Statistiken. Seth Stephens Davidowitz sieht in der Big Data-Analyse eine mögliche Brücke zwischen diesen beiden Methoden. Dies war ein aufschlussreiches Buch, das von allen gelesen werden sollte, die an politischen Entscheidungen interessiert sind.
HINWEISE:
Ich habe die Kindle-Ausgabe dieses Buches gelesen. Die Redaktion hat einen Schritt in die richtige Richtung getan. Sternchen kennzeichnen die Kommentare des Autors, und die Leser können problemlos zum Haupttext wechseln. Fußnoten sind dagegen im Text nicht markiert. Der Leser ist gezwungen, die Fußnoten zu lesen und eine Suche durchzuführen, um sie wieder mit den relevanten Passagen zu verknüpfen.
Ich habe selten etwas gelesen, das so viele individuell interessante (wenn auch flache) Sätze enthielt, und mich immer noch verdammt gelangweilt. Ich bin es auch leid, über die Verliebtheit des Autors in Baseball, Google und Pornos zu lesen. Ich zähle dieses Buch jedoch als gelesen, weil ich für die Zeit, die ich beim Lesen verloren habe, eine kleine (wenn auch wertlose) Belohnung erhalten sollte.
Einige zufällige, nichtlineare Gedanken, weil ich nicht genug an dem Buch interessiert bin, um mich an dieser Stelle mehr anzustrengen:
1. Der Autor hat für Google gearbeitet. Anscheinend ist er immer noch begeistert von ihnen und hält ihre massive Sammlung von Daten über Benutzer für das wunderbarste Geschenk, das Menschen jemals gemacht haben. Natürlich macht er. Sein Abschluss und seine Karriere hängen davon ab.
Ich bin der Meinung, dass die meisten und vielleicht die ausschließlich Eine ehrliche Sache, die Google jemals getan hat, ist, als sie ihren Firmenslogan "Sei nicht böse" losgeworden sind. Google ist für mich ein bisschen wie Walmart. Ich mag es nicht, vertraue ihm oder glaube nichts, was es behauptet, und benutze es so wenig wie möglich.
2. Die Tatsache, dass die Regierung die Steuerdaten jedes Amerikaners an alle Forscher weitergab, die sie durchsuchen möchten - und zwar so detailliert, dass sie Einkommensänderungen für jede Adresse verfolgen können, von der eine einzelne Person berichtet hat -, ist besorgniserregend. "Oh, aber die Personen wurden nicht identifiziert." Bullshit. Möglicherweise nicht namentlich, aber es gibt genügend Informationen, um sie mit anderen Daten abzugleichen und Personen individuell zu identifizieren. Dass jede Suche, die Sie durchgeführt haben, mit einem Zeit- / Ortsstempel versehen ist und jedem zur Verfügung steht, der sie möchte, ist einfach gruselig. Während wir alle inzwischen wissen sollten, dass wir nur Produkte sind, die mit Gewinn abgebaut werden sollen, ist es beunruhigend, eine zeitgestempelte Liste der genauen Suchanfragen einer Person über einen Zeitraum von 24 Stunden zu sehen.
3. Wenn dieser Typ Recht hat, habe ich Suchmaschinen für die falschen Dinge verwendet. (Lesen Sie das in Snark-Schrift.) Suchen die Leute wirklich bei Google nach "Warum sind Juden billig?" oder "Ist meine Tochter hässlich?" oder "Bin ich schwul?" Die ganze Zeit habe ich nach Dingen wie "Was ist die Hauptstadt von Lettland" oder "Wie lautet die Formel zur Berechnung der Amortisation?" Gesucht. Hin und wieder mache ich mich auf die Suche nach David Bowie Musikvideos. Ich glaube, ich habe mich einmal gebeugt zu "Warum zum Teufel sind die Kardashianer berühmt?" Angeblich googeln überall Frauen "Riecht meine Vagina?" und "Betrügt mein Mann"? Nun, Schatz, wenn du fragen musst ...
4. Daten dienen datenzwecken wenig. Es sorgt nur für mehr Lärm, nicht für mehr Klarheit.
5. Anscheinend glaubt der Autor, dass der Weg, um das Interesse der Leser aufrechtzuerhalten, darin besteht, die sensationellsten Beispiele zu verwenden, die er sich einfallen lassen könnte. Wirf eine Menge rassistischer Begriffe und Hinweise auf sexuelle Knicke oder Unsicherheiten herum. Wenn alles andere fehlschlägt, sprechen Sie über Baseball und bringen Sie etwas Humor ein. Ich verstehe: Die Pornoindustrie treibt fast jede Internetinnovation voran, vom Webdesign bis zur Sicherheit und Datenerfassung. Fein. Aber das zehnte oder 15. Mal, wenn er sich auf Frauen bezieht, die sich Sorgen um Vaginalgeruch machen oder wie häufig Pornhub nach Inzestvideos sucht, ist dies ein Versuch, eher provokativ als informativ zu sein. Für ein oder zwei Kapitel, wenn dieser Inhalt für das Thema relevant ist, ist das in Ordnung. Jedes einzelne Kapitel? Langweilig. Und nach einer Weile wirklich gruselig.
6. Wenn es in dieser Sache eine Diskussion über die Ethik des Data Mining gibt, ist sie so weit im Hintergrund vergraben, dass ich nicht dazu gekommen bin. Wenn es substanzielles Material zu statistischer Relevanz, Hypothesentests oder Phantompopulationen gibt, ist es im Hintergrund vergraben.
Er ist der Junge, der mit seiner hellen, glänzenden, nicht traditionellen Methode hereinkommt und im Grunde sagt, er hat Recht und jeder andere, der jemals Daten studiert hat, ist falsch.
(Und wenn, wie der Autor behauptet, die letzten Kapitel von Büchern nicht so oft gelesen werden wie die ersten, dann deshalb, weil Bücher immer weniger informativ und / oder glaubwürdig werden.)
Sie mögen der Welt liberal erscheinen, aber insgeheim rassistische Witze googeln… ..
Obwohl Sie möglicherweise Ihre tiefsten, dunkelsten Geheimnisse an Google weitergeben, machen Sie keinen Fehler, diese Daten befinden sich an einem Ort, an dem sie analysiert werden können.
Ich arbeite jeden Tag mit Big Data und habe mich sofort für dieses Buch interessiert. Aber Sie müssen wirklich nicht in der Datenbranche sein, um das Buch zu schätzen. Es ist für den Laien mit Humor und interessanten Leckerbissen geschrieben, die im ganzen Buch verteilt sind.
Das erste Drittel des Buches bietet Daten zu Sex, Politik und Rassismus eine bemerkenswerte Menge an Raum. Dies sind Dinge, bei denen wir unseren Freunden (oder sogar uns selbst) gegenüber nicht immer ehrlich sind.
Der einzige Nachteil für mich war, dass die Daten sehr auf die USA ausgerichtet waren, so dass einige der Fallstudien, die sich mit Baseball oder Basketball befassten, für mich einfach nicht sehr interessant waren. Es gab auch ein oder zwei Diagramme, die nicht richtig erklärt wurden. Der Autor ist auch sehr leidenschaftlich in diesem Thema, was bedeutet, dass er manchmal so schnell hintereinander von einem Thema zum anderen flintete, dass Sie fast den Punkt verlieren, den er anstrebt
Aber es gab Abschnitte, die mich auch faszinierten. Die Erklärung der Doppelganger-Suchalgorithmen (so schlagen Amazon und Netflix Bücher / Filme vor, die Ihnen gefallen könnten) und ihrer Anwendungen in verschiedenen Branchen. Die Fallstudie darüber, wie Rennpferde ausgewählt wurden und wie neue Daten auch ihre Grenzen haben, war ebenso groß.
Dies ist ein bisschen wie Freakonomics for Big Data und der Autor selbst ist eindeutig ein RIESIGER Fan von Steven Levitt, da die Schlussfolgerung wie eine Ode an sein Idol gelesen wurde.
Und schließlich hat die Welt letzte Woche ihren ersten Blick auf ein Schwarzes Loch geworfen, was nur möglich ist, wenn riesige Daten mit ausgeklügelten Algorithmen verarbeitet werden. Danke Katie Bouman! Dies zeigt, wie leistungsfähig die Anwendung von Big Data sein kann.
Die großen Fragen und Geheimnisse unserer Zeit können sehr gut einzeln beantwortet werden.
Empfohlen
Erinnerungsstücke. Vorhersage der Arbeitslosenquote anhand der Häufigkeit der Suche nach Pornoseiten (Zeitaufwand). Vorhersage des Erfolgs der Datierung (hören Sie zu, dann hören Sie noch etwas zu, und wenn Sie glauben, dass Sie mit dem Zuhören fertig sind, hören Sie noch etwas zu). Doppelgänger (DOPP-el-gang-er) suchen im Internet (nach Krankengeschichte, Interessen usw.). Regressionsdiskontinuität (Probe wird aus dem Abschnitt um eine scharfe numerische Teilung entnommen). Natürliche Experimente. Präsidentenvereinigung und das Leben nach dem Tod der Wirtschaft. Zukunft der Schüler, die zu angesehenen Schulen wurden und dies nicht taten. Rückfall von Gefangenen, die härter behandelt wurden (weil sie gerade in die gefährlichere Klassifikation aufgenommen wurden) und gegen vc.
Kaum ein "Nachteil" zu melden ... aber es ist ein bisschen kurz und überwiegend auf die USA ausgerichtet. Immer noch sehr klug und zum Nachdenken anregend
Insgesamt: auf jeden Fall Ihre Zeit wert
Ich beschloss schließlich, es zu versuchen, hauptsächlich weil Steven Pinker und der Autor, den ich sehr respektiere, den Stürmer geschrieben haben. Ich bin so froh, dass ich es getan habe.
Für den Autor, Herrn Davidowitz, habe ich das Buch fertiggestellt, ebenso wie für die ersten beiden Bücher, die Sie unten erwähnt haben - Punkt für das dritte Buch, da es nicht einmal auf meiner Liste zu lesen ist ;-)
„Mehr als 90 Prozent der Leser haben Donna Tartts Roman The Goldfinch fertiggestellt. Im Gegensatz dazu schafften es nur etwa 7 Prozent durch Daniel Kahnemans Magnum Opus Thinking, Fast and Slow. Weniger als 3 Prozent… haben es bis zum Ende des viel diskutierten und gelobten Kapitals des Ökonomen Thomas Piketty im 21. Jahrhundert geschafft. “
Wie der Untertitel andeutete, war das Buch eine Einführung in die Datenwissenschaft, ein noch aufstrebendes Gebiet, das jedoch als Grundlage für heiße Märkte wie künstliche Intelligenz und maschinelles Lernen dient.
Zuallererst, so informativ das Buch auch war, ich würde sagen, dass das Buch die allgemeine Leserschaft ansprach. Es hielt sich größtenteils von mathematischen, statistischen und Programmierjargons fern. Der Schreibstil war unbeschwert; es erinnerte mich sicherlich nicht an ein ernstes (langweiliges ??) Lehrbuch.
Trotzdem gehe ich davon aus, dass diejenigen Leser, die Zahlen lieben und lieber prozentual sprechen, das Buch mehr genießen würden.
Kurz gesagt, Data Science in diesem Buch erzählte Geschichten durch Daten, Big Data, neue Daten, dh die gigantischen Datensätze, auf die wir jetzt zugreifen können, hauptsächlich dank Schlüsselwörtern, die wir jeden Tag in Internet-Suchmaschinen eingeben. Und heute kann sogar unser Personal Computer in der Lage sein, solche Datensätze zu verarbeiten und zu analysieren, da immer billigere Speicherchips und leistungsstärkere CPUs, GPUs oder andere Prozessoren zur Verfügung stehen.
Während Davidowitz zugab, dass unser Mut gute Arbeit leisten könnte, um Schlussfolgerungen zu ziehen und auf natürliche Weise Vorhersagen zu treffen, wies er darauf hin, dass wir Big Data benötigen, um „das Bild zu schärfen“. Zum Beispiel ist es normal, dass raues Winterwetter zu Depressionen führen kann (das D-Wort wurde während meines letzten Urlaubs in Nordeuropa häufig von Reiseleitern angesprochen), aber wie stark ein Temperaturabfall die Stimmung der Menschen wesentlich beeinflussen kann - 10 Grad oder 50 ?? Würden andere Faktoren, wie „wirtschaftliche Bedingungen, Bildungsniveau und Kirchenbesuch“, das Bild trüben?
Und wie wäre es, wenn unser Mut es völlig falsch macht? Das Buch gab ein Beispiel für eine Studie, die völlig gegen unsere Intuition zu dem Schluss kam, dass Paare, die getrennte Gruppen von Freunden unterhalten, dazu neigen, länger in der Beziehung zu bleiben.
Deshalb hat Davidowitz den größten Teil des Buches im zweiten Teil ausgegeben, um die „Kräfte der Big Data“ zu veranschaulichen, auf die wir heute zugreifen können:
1) neue Datentypen, die über Umfragedaten oder Tabellendaten hinausgehen, denken an Tweets und Bilder;
2) ehrliche Daten, die Daten, die auf unbewusster Ebene generiert werden, z. B. eine Google-Suche (anstatt eine Umfrage zu beantworten), wenn Menschen nicht so geneigt sind zu lügen;
3) die Daten sind so detailliert, dass wir kleine Teilmengen für unsere spezielle Studie vergrößern können;
4) Daten, die so groß und umfassend sind, dass wir schnelle, kontrollierte Experimente durchführen können.
Sehr bald in dem Buch entdeckte ich seine Ähnlichkeit mit einem sehr beliebten Titel, der vor mehr als einem Jahrzehnt veröffentlicht wurde und den ich auch liebte. Freakonomics: Ein Schurkenökonom erforscht die verborgene Seite von allem von Steven Levitt und Stephen Dubner. Es war nicht nur, weil Levitt in diesem Buch häufig erwähnt wurde.
• Die beiden Bücher hatten einen ähnlichen sorglosen und witzigen Schreibstil und waren von ähnlicher Länge.
• beide versuchten, Daten zu verwenden, um Mythen zu entlarven, die größtenteils aus unserer Intuition stammen;
• Als ansprechende Übung für den Leser gaben beide Listen mit Faktoren an und fragten die Leser, welche Faktoren einen signifikanten Einfluss auf das Ergebnis hatten, und gaben dann die Antworten.
• beide widmeten einen großen Teil der Erläuterung der Unterscheidung zwischen „Kausalität“ und „Korrelation“ und der Beschreibung der A / B-Tests, der randomisierten, kontrollierten Studie;
• Die beiden Bücher befassten sich sogar mit einem ähnlichen Thema, wenn auch aus unterschiedlichen Blickwinkeln, ob die Wahl der Schule den späteren Erfolg des Schülers bestimmt.
Im Wesentlichen ermutigten beide Bücher die Leser, über den Tellerrand hinauszudenken und die richtigen Fragen zu stellen. Natürlich war dieses Buch aktueller; Es wurden Datenquellen wie Google Trends, Ngrams und Correlate sowie unstrukturierte Datentypen aufgelistet, die für die heute digital verbundenen Leser relevanter sind.
Es überrascht nicht, dass Davidowitz am Ende des Buches enthüllte, dass es der „Schurkenökonom“ Levitt und seine Freakonomics waren, die ihn dazu inspirierten, seine derzeitige Karriere fortzusetzen.
Tatsächlich untersuchte Davidowitz denselben Datensatz, Geburtsurkundendaten in Kalifornien, der den Vornamen der schwarzen Einwohner enthielt (oder ob es sich um einen gebräuchlichen weißen Namen oder einen unverwechselbaren schwarzen Namen handelte). Während Levitt die Verbindung zwischen dem Vornamen einer schwarzen Person und seinem sozioökonomischen Hintergrund herstellte, baute Davidowitz auf der Studie auf und verwendete den Vornamen einer schwarzen Person als Proxy für seinen sozioökonomischen Hintergrund, um die Verbindung zwischen diesem Faktor und der Chance der Person zu untersuchen die NBA machen.
Für mich war dies eine der bekanntesten Fallstricke der Datenanalyse, das sogenannte „Garbage-In, Garbage-Out“. Was ist, wenn jemand herauskommt, um zu beweisen, dass Levitt in seiner Verknüpfung falsch liegt? Das wäre wie ein Erdbeben für Davidowitz 'nachfolgende Studie? Es wäre großartig, wenn dieses Thema in der Fortsetzung dieses Buches ausführlicher behandelt werden könnte.
Um fair zu sein, hat Davidowitz in dem Buch einige Einschränkungen von Big Data behandelt, insbesondere unter moralischen / ethischen Gesichtspunkten, z. B. Preissenkungen, Diskriminierung und Datenschutz.
Es gab andere Teile in dem Buch, die ich weniger überzeugend fand. "... im Prognosegeschäft muss man nur wissen, dass etwas funktioniert, nicht warum." Als Beispiel führte der Autor an, dass Walmart entdeckte, dass seine Kunden Erdbeer-Pop-Torte vor Hurrikanen bevorzugt auf Lager hatten. Das Geschäft sollte also das Gebäck in seinen Regalen nur anhand der Daten lagern, ohne zuerst die Kausalität zu bestätigen?
Ich würde auch gerne zu viel in die verschiedenen Signale für das erste Date im Buch lesen. Ein Mann würde sich also mehr für mich interessieren, wenn ich mich eher wie ein Narzisst verhalte? Hmmm...
Nun, als Intro kratzte das Buch nur die Oberfläche der Datenwissenschaft. Und doch war es eine unterhaltsame, rasante und zum Nachdenken anregende Lektüre.
Ich habe beschlossen, meine Bewertung auf 4 zu ändern, da ich denke, dass sowohl Freakonomics als auch Thinking, Fast und Slow, die oben erwähnt wurden, relativ besser zu lesen sind.
Trotzdem geht das Buch nicht annähernd so tief, wie ich es mir gewünscht hätte - Annahmen bleiben ungeprüft, ernsthafte ethische Bedenken bleiben unberücksichtigt und alternative Hypothesen bleiben unerforscht. Diese relative Oberflächlichkeit hat jedoch einen Vorteil: Das Buch ist leicht und unterhaltsam, obwohl einige der Ergebnisse, die SD diskutiert, auch schockierend und deprimierend sind (wie viele Menschen online nach schrecklichen Dingen suchen).
Im Kern des Buches liegen die vier "Kräfte" von Big Data:
(1) It offers up new types of data (e.g., people's sexual desires and preferences gathered through porn sites).
(2) It provides honest data (e.g., people's genuine concerns as expressed through questions asked in Google).
(3) It allows us to zoom in on small subsets of people (because there is so much data, even small slices of a population can provide meaningful [statistical] information).
(4) It allows us to do many causal experiments (e.g., presumable, through the kind of A/B testing done by Facebook and sellers of ads – this is, in my eyes, a problematic area that is not adequately addressed by S-D).Trotz all seiner Schwächen, von denen einige lediglich mehr Aufmerksamkeit und Forschung erfordern, von denen andere grundlegender sind, sollte Stephens-Davidowitz Anerkennung für die Arbeit erhalten, die er an und mit Big Data geleistet hat. Ich stimme ihm zu, dass es eine sehr wichtige Informationsquelle (die trotzdem mit Vorsicht verwendet werden sollte) und ein Werkzeug für die Forschung ist, vielleicht sogar - wie er definitiv zu denken scheint -des Konsums am wichtigsten in und für die Zukunft.
Ein Problem für mich - der Teil Kausalität gegen Korrelation kommt zu spät im Buch und der Autor mischt manchmal die beiden IMHO. Das größte Problem für Data Scientists ist das Problem der Kausalität, und wenn / wie es nachgewiesen werden kann, kann es mit dieser Methode in den meisten Fällen aufgrund der eingebauten Einschränkung einfach nicht nachgewiesen werden, aber der Autor gibt es weiter dies und das alles macht einige Annahmen, so gut sie können, naiver Natur.