Predictive Analytics World Berlin 2014 - Tag 1

Tags: Predictive AnalyticsKonferenzenBerlin
Autor: Oliver Staubli, Founder & Data Scientist
Publiziert:    (Aktualisiert 16. November 2014)

Für mich war es die richtige Entscheidung, an der Predictive Analytics World in Berlin teilzunehmen. Im Vorfeld habe ich noch länger abgewägt, ob sich Weg, Zeit und Kosten rechtfertigen würden. Insbesondere da ich befürchtete, dass sich die Konferenz als Verkaufsschau von Software-Anbietern entpuppen könnte. Zum Glück kam es anders.

Die Referate waren praxisbezogen und die Referenten vermittelten einen guten Einblick in ihre meist ersten Predictive Analytics Projekte. Ein wiederkehrendes Muster war in den präsentierten Use Cases auszumachen: Die ersten Projekterfolge konnten anfängliche Skeptiker überzeugen und lassen nun Weiterentwicklungen und die Ausdehnung auf neue Anwendungsbereiche zu. Diese "Goldgräberstimmung" war deutlich zu spüren und übertrug sich auf die Teilnehmer.


Anbei meine Highlights vom ersten Tag der Konferenz:

Cheating Detection in "Call of Duty" - Video Game Fraud Detection (Activision)

Arthur Von Eschen erzählte eindrücklich, wie er als erster Data Scientist bei Activision das Thema "Game Analytics" trotz anfänglichem Widerstand etablieren konnte.
30 Millionen Gamer spielen Call of Duty. Einige Spieler versuchen sich mit unlauteren Mitteln in die vordersten Ränge der Leaderboards zu "boosten" und ruinieren dabei das Spielvergnügen der ehrlichen Spieler. Zwischen solchen schwarzen Schafen und echten Profi-Spielern zu unterscheiden, sei schwierig und falsche Beschuldigungen könne man sich nicht leisten. Vier Mitarbeiter konnten pro Tag 200 solcher "Cheaters" manuell entdecken. Arthurs erstes Projekt bei Activision war die Automatisierung dieses Prozesses. Mittlerweile sind 40 Modelle im Einsatz, um die verschiedenen bekannten Strategien der Cheaters automatisch zu entdecken. Auf diese Weise werden nun täglich 40'000 Cheaters identifiziert und bestraft. Parallel dazu suchen Algorithmen stetig nach neuen Mustern in den Daten, um auch neue Cheat-Strategien zu finden.
Ebenso eindrücklich war die Schilderung der Skalierungs-Problematik und der Optimierung dieses Prozesses: Die anfängliche Berechnungszeit von 500 Stunden konnte auf 3 Stunden reduziert werden (siehe Slide). Mittlerweile arbeiten 20 Data Scientists bei Activision und das Team soll nächstes Jahr auf 35 ausgebaut werden.

Predictive Analytics Powered By Process Mining (Technical University Eindhoven)

Wil van der Aalst, Professor an der Technical University Eindhoven, drohte einführend an, die Teilnehmer nun aus ihrer "Comfort Zone" zu führen. Für viele im Raum, inklusive mir, war das Thema "Process Mining" wohl Neuland. Der Vortrag war für mich ein "Eye-Opener" und ich war tief beeindruckt von den Möglichkeiten von Prozess Mining.
Das Grundprinzip ist bestechend einfach: Aus grossen Mengen an Log-Daten von Prozess-Ereignissen wird automatisch ein Prozessmodell generiert. Wiederkehrende Abläufe definieren Regeln und Abhängigkeiten im Prozess - die starre, manuelle Prozess-Modellierung entfällt somit und weicht einem dynamischen, flexiblen Ansatz. Am Beispiel eines Krankenhauses zeigte Wil, wie ein solches Prozessmodell entsteht und wie die Ereignisse aus Patienten-Akten durch das Prozessmodell "fliessen" (siehe Slide). Die Identifizierung von Abweichungen zu den "üblichen" Pfaden (Conformance checking) oder von "Bottlenecks", bei welchen sich die Ereignisse stauen, wird mit diesem Ansatz extrem vereinfacht.
Die Visualisierungen entstanden im Process-Mining Tool ProM, welches von der Technical University Eindhoven als Open Source Software zur Verfügung gestellt wird. Muss ich unbedingt ausprobieren!

The Revolution in Retail Customer Intelligence (Abbott Analytics, Inc)

Dean Abbott präsentierte einen spannenden Ansatz für die Omnichannel Attribution Modellierung: Den einzelnen Touchpoints wurde ein Engagement-Score mit einer Halbwertszeit zugeordnet, um die Kauflust des Kunden über die Zeit und über die verschiedenen online/offline Kanäle realistischer zu modellieren (siehe Slide). Die Visualisierung des Contents und dessen Scorings bezüglich Conversion im Zeitverlauf, war ebenfalls inspirierend - wenn auch nicht ganz einfach zu lesen (siehe Slide).

Mein Takeaway: Mit aktuellen Predictive Analytics Algorithmen lässt sich wie auf dem Basar feilschen: Einfach grosses Interesse zeigen, aber kurz vor Abschluss den Kaufprozess unterbrechen. Allenfalls kommt einem der Algorithmus ja noch mal im Preis oder mit anderen Anreizen entgegen.

Uplift-Modeling (Lufthansa Miles & More Credit Card)

Thomas Klein und Alexander Funkner präsentierten wie Lufthansa ihre Direktmarketingkampagnen für Miles & More Kreditkarten optimierte: Sie ersetzten das klassische Response-Modell zur Zielgruppen-Selektion durch Uplift-Modeling, um direkt den Einfluss eines Mailings auf die individuelle Kaufwahrscheinlichkeit zu prognostizieren. Neu wurden zusätzlich auch die Daten der Kontrollgruppe berücksichtigt. Damit konnten Kosten sowie unnötige Kundenkontakte bei der Neukundenakquise reduziert werden. Der Uplift von Direktmarketingkampagnen konnte um bis zu Faktor 3 gesteigert werden.
Erstaunlicherweise zeigte die wichtigste Modellvariable "E-Mail", mit einem Einfluss von immerhin 15%, ein überraschendes Muster: "t-online.de" E-Mail-Adressen stellten sich als gute Indikatoren für eine positive Resonanz auf die Direktmarketingkampagnen heraus (siehe Slide). Weshalb, konnte zwar niemand genau sagen.

Von Smart-Phones zu Smart-Places zu Smart-Profiles (GfK Geomarketing)

In Kooperation mit Telecom-Anbietern analysiert GfK Netzwerkdaten von Mobilgeräten. Nina Meinel und Hendrik Wagenseil zeigten wie einfach sich aus den Smart-Phone Bewegungsdaten detaillierte Profile rekonstruieren lassen. Wer glaubte ein Prepaid-Abo helfe seine Identität geheim zu halten, wurde eines Besseren belehrt: GfK konnte die Heimadresse eines anonymen Users mit hoher Wahrscheinlichkeit eingrenzen: Dazu wurden einfach über längere Zeit die Orte des höchsten Datenvolumens und die Position des Smart-Phones während der Nacht analysiert und überlagert (siehe Slide).
Solche angereicherten Smart-Profils sind z.B. für Warenhäuser wertvoll, welche daran interessiert sind, potenzielle Besucher-Volumen an neuen Standorten zu quantifizieren oder besser zu verstehen, wo ihre Kunden herkommen.



Zweiter Konferenz-Tag