- Regularisierungsmethoden Die Regularisierung ist unter anderem ein wichtiges Werkzeug die Modellvarianz zu reduzieren, um damit Vorhersagen höherer Validität zu treffen. Dies wird an einem konkreten Beispiel aus der Medizin demonstriert. Zudem wird auf die Bedeutung der Variablenselektion durch Regularisierungsmethoden eingegangen.
- Update des Churn Models der NOZ Eine Präsentation von Patrik Punčo über ein Update des Churn Modells der Neuen Osnabrücker Zeitung zur Kündigungsprognose. Wir hatten bereits in Prävention von Abonnementkündigungen mit Hilfe von Predictive Analytics gehört, wie dort anhand von Kundendaten vorhergesagt werden kann, welche Kunden am wahrscheinlichsten kündigen werden. Nach nunmehr fast einem Jahr erfahren wir, wie das Modell in der Zwischenzeit verbessert wurde.
- Visualisierung mehrfaktorieller Daten Nichts macht mehr Spaß und beeindruckt neue R-Nutzer so sehr wie das Erstellen von komplexen Grafiken. Im Vortrag werden theoretische Prinzipien für gute Visualisierungen (Tufte: Data-ink Ratio, Small Multiples, etc.) vorgestellt und gezeigt, wie diese in R umzusetzen sind.
- Prävention von Abonnementkündigungen mit Hilfe von Predictive Analytics Mit Hilfe von Predictive Analytics und auf Basis von Kundendaten werden Modelle erstellt und validiert, die zur Vorhersage von Abonnementkündigungen genutzt werden können.
- Estimating out-of-sample performance - comparing resampling methods Resampling- und Validierungsmethoden wie Leave-one-out-cross-validation, k-fold Cross-Validation und Bootstrapping leiden jeweils unter Bias und Varianz in Abhängigkeit von der Komplexität des getesteten Modells und der Stichprobengröße. In dieser Präsentation geht es darum, wie gut die Schätzungen der Validierungsmethoden die tatsächliche out-of-sample Performance in neuen Beobachtungen vorhersagen. Dies wurde anhand von Simulationen überprüft.
- Hallo Meetup-Welt Ein paar Informationen über unser Data Science Meetup in Osnabrück