Am 16. Mai 2016 veranstaltete GoDataDriven das zweite PyData Amsterdam Meetup. Zu den Sprechern gehörten Niels Zeilemaker und Wendell Kuling.
Zweites PyData Amsterdam Meetup
Zu diesem zweiten PyData Amsterdam Meetup kamen über 110 Personen, um die Präsentationen von Niels Zeilemaker von GoDataDriven und Wendell Kuling, Datenwissenschaftler bei ING Wholesale Banking, zu verfolgen. Das Meetup wurde von einem Konsortium aus der Schiphol Group, Microsoft und GoDataDriven gesponsert, um den Schiphol Data Science Hackathon vorzustellen, der am Freitag, den 28. Oktober stattfinden wird.
Niels Zeilemaker: Ja, Sie können Monopoly mit einem genetischen Algorithmus spielen
Der erste Redner war Niels Zeilemaker mit Yes you can play Monopoly with a genetic algorithm.
Niels Zeilemaker ist Data Hacker bei GoDataDriven. Er arbeitet für eine Vielzahl von Unternehmen, bei denen er seine Zeit mit Feature Engineering und der Erstellung von Modellen verbringt. Bevor er zu GoDataDriven kam, schloss er seine Doktorarbeit an der Technischen Universität Delft ab.
In diesem Vortrag erklärte Niels, wie man Monopoly mit einem genetischen Algorithmus "löst". Zunächst erinnerte er uns an die offiziellen Regeln von Monopoly, denn niemand scheint tatsächlich nach den Regeln zu spielen. Dann erklärte Niels, wie er die allgemeine Kaufregel mit Hilfe eines genetischen Algorithmus optimiert hat und schließlich, wie man die Anzahl der zu kaufenden Häuser optimiert.
Als nächstes war Wendell Kuling mit "Namensabgleich im großen Maßstab" an der Reihe: CPU, GPU oder Spark?"
Wendell Kuling "Namensabgleich im großen Maßstab: CPU, GPU oder Spark?"
Wendell arbeitet als Data Scientist bei ING im Wholesale Banking Advanced Analytics Team. Durch die Anwendung von Data Science bietet Wendells Team bessere Dienstleistungen für die Firmenkunden von ING. Wendell berichtete über verschiedene wertvolle Erkenntnisse und Erfahrungen aus Projekten, bei denen ING große Datensätze anhand von Namen abgleicht. Dieser Vortrag umfasste die wichtigsten Algorithmen und Pakete, die für den Namensabgleich verwendet werden, sowie einen Best-Practice-Ansatz für die Anwendung dieser Algorithmen in großem Maßstab. Würden Sie auf einen Cruncher (48-CPU/512 MB RAM Maschine), einen Tesla (Cuda Tesla K80 mit 4992 Kernen, 24GB Speicher) oder einen Spark-Cluster (80 Kerne/2,5 TB Speicher) setzen?
Über PyData Amsterdam
PyData Amsterdam ist eine Gruppe für Benutzer und Entwickler von Datenanalysetools in Python. Ziel ist es, Python-Enthusiasten einen Ort zu bieten, an dem sie Ideen austauschen und voneinander lernen können, wie man die Sprache und die Tools am besten auf die sich ständig weiterentwickelnden Herausforderungen im weiten Feld der Datenverwaltung, -verarbeitung, -analyse und -visualisierung anwendet. Ein Ziel der PyData-Gruppen, -Veranstaltungen und -Konferenzen ist es, Anwendern aus allen Bereichen der Datenanalyse einen Ort zu bieten, an dem sie ihre Erfahrungen und Techniken austauschen und die Erfolge und potenziellen Fallstricke bei der Verwendung von Python für bestimmte Problemstellungen aufzeigen können. PyData wird von NumFOCUS.org organisiert.
Sind Sie daran interessiert, am nächsten PyData Amsterdam Meetup teilzunehmen? Treten Sie der Gruppe bei!
Verfasst von
Walter van der Scheer
Unsere Ideen
Weitere Blogs
Contact




