2018 - Mannheim

**R Einführungsworkshop **

  • Dieser Workshop gibt ganz basic eine Einführung in die statistische Programmiersprache R. Dabei werden werden zunächst verschiedene Datentypen vorgestellt, Daten aus verschiedenen Formaten eingelesen und ein kurzer Einblick in die Tidyverse-Pakete dplyr und ggplot2 gegeben.
  • Speaker: Stefan Haußner, CorrelAid Mitglied der frühen Stunde, wiss. Mitarbeiter am Jean-Monnet-Lehrstuhl für Europapolitik in Duisburg

**Spatial Data in R **

RASA Chatbot Framework

  • GitHub Repository: Please request access to github.com/enryH
  • Der Vortrag hat eine Einführung in die verschiedenen benötigen Trainingsdaten für Chatbots bereitgestellt. Nach einer Live-Demo des Bots auf SLACK wurden die Kodierung der natürlichen Sprache gezeigt und darauf aufbauend die Konstruktion der Trainingdialogue. Das Erfassen der Trainingsdaten wurde live vorgestellt.

**Text Mining and NLP in R **

**Data Science for Policy **

Nicht-lineare Modelle verstehen

Moderne Methoden sind im Vergleich zur Linearen Regression schwieriger auf die Relevanz einzelner Inputs (Features, Variablen) zurückzuführen. Es gibt allerdings Ansätze nicht-lineare Modelle wie Random Forests oder Neural Networks für Schätzungen einzelner Beobachtungen zu erklären.
  • Computer Vision: iNNvestigate bietet die Anwendung verschiedener Techniken an, die Vorhersagen Neuraler Netze für Bilderkennungsaufgaben zu entschlüsseln.
  • Shap: Berechnet den durchschnittlichen Einfluss eines Features aus einer Anzahl möglicher Input-Koalitionen, die gesamplet werden. Der Wert drückt den Einfluss eines Features für eine Beobachtungseinheit relativ zum Durchschnittswert aller Schätzungen aus.
  • Lime: Durch zufälliges Ziehen ähnlicher Inputs wie der des ursprünglichen Input, wird die Relevanz einzelner Inputs lokal simuliert.
Ein frei verfügbares Buch, das u.a. den Shap und Lime Ansatz mit einprägenden Beispielen einführt, wurde im Rahmen des Workshops von einem Teilnehmenden empfohlen: Molnar, Christoph (2018): Interpretable Machine Learning

Datenethik

**JavaScript for Data Scientists **

  • In diesem Workshop beschäftigten wir uns mit JavaScript, spezifisch damit, was JavaScript ist / kann, was überhaupt ein Server ist und wie man in JavaScript ein Frontend und Backend entwickeln kann. Die Teilnehmer*innen schrieben sogar ihre ersten Zeilen JavaScript. Bis zum großen Hands on sind wir leider nicht gekommen, aber jede*r ist aufgerufen, dieses zu Hause zu lösen :)

**Datenjournalismus **

  • Dieser Workshop gibt einen Einblick in die Grundlagen des Datenjournalismus und zeichnet den Entstehungsweg eines Datenjournalismus-Projekts an einem praktischen Beispiel nach: Von den ersten Zeilen R-Code bis zu einem potentiellen Nachrichtenbeitrag.
  • Speaker: Jochen Schäfer, Mitglied bei CorrelAidX Mannheim und freier Datenjournalist

Let's git our shit together!

  • In diesem Git-Einführungsworkshop lernten die Teilnehmer*innen die grundlegenden Konzeopte von Git kennen: Fork, Clone, Commit, Push / Pull. In einigen Hands On Sessions setzten die Teilnehmer*innen das Gelernte in einem Mini-Gruppenprojekt mit GitHub und dem GitKraken GUI praktisch um. Sogar ein Merge Conflict wurde erfolgreich gelöst!
    🎉
  • Speaker: Frie Preu, CorrelAid Core Team Mitglied und Data Scientist bei codcentric AG

CNN mit Keras