Blog

GoDataDriven Open Source Beitrag: Ausgabe April 2017

Giovanni Lanzani

Giovanni Lanzani

Aktualisiert Oktober 21, 2025
3 Minuten

Bereits die dritte Ausgabe: die Zeit vergeht wie im Flug! Drei ist eine magische Zahl, also haben wir, ohne jegliche Planung in typischer GoDataDriven-Manier, ein Airflow-Special veranstaltet!

Seit dem letzten Mal haben wir 6 Pull Requests zu Airflow beigetragen! Henk war der fleißigste, aber Alexander, Niels und ich selbst haben auch geholfen:

  • Henk fügte mit PR 2216 Azure Blob Storage hinzu, überarbeitete mit PR 2234 die Tests so, dass Travis sie aufnimmt ( ), und erfasste schließlich mit PR 2252 ungültige Argumente für Sqoop;
  • Alexander hat in PR 2158 Kerberos-Unterstützung bei der Verwendung von Python 3 hinzugefügt (das ist eine ziemlich große Sache!);
  • Niels hat in PR 2258 die Unterstützung für benutzerdefinierte Filter in Jinja2-Vorlagen hinzugefügt;
  • Meine Wenigkeit hat die Ausführung von Skripten im SparkSql-Hook mit PR 2259 behoben.

Die Liste unserer Aktivitäten endet hier aber noch nicht! Robert hat, nachdem er sanft dazu gedrängt wurde, seinen allerersten Beitrag zu Homebrew geleistet. Als er anfing, mit dem ELK-Stack auf seinem Mac zu spielen, stellte er fest, dass Logstash keinen damit verbundenen Dienst hatte. Er korrigierte dies mit PR 12144, der nach einigen internen Diskussionen zusammengeführt wurde.

Fokko konnte sich nicht aus der Arbeit seiner Kollegen heraushalten und steuerte PR 104 zu druid-spark-batch bei (ein Plugin, das die Indizierung von Druid durch Spark ermöglicht), sowie zwei Pull-Anfragen zu Druid:

  • In PR 4210 hat er das pom auf Parquet 1.8.2 aktualisiert (dessen Versionshinweise nicht mehr auffindbar sind: Wenn Sie sie finden, lassen Sie es ihn wissen! );
  • In PR 4233 hat er eine Abhängigkeit entfernt, denn weniger ist mehr, insbesondere bei Abhängigkeiten!

Zu guter Letzt hat Kris smokey, ein Framework für Hadoop-Smoke-Tests, als Open Source zur Verfügung gestellt. Er hat ziemlich viel Arbeit hineingesteckt, also sehen Sie es sich an! Es ist auch erwähnenswert, dass unser Blog, zumindest intern gelesen wird, so dass er die Python-Projektstruktur, die Henk in seinem Beitrag vorgestellt hat, übernommen hat.

Das war's für diese Ausgabe! Wie immer, wenn Sie Kommentare, Bemerkungen oder Komplimente haben, würden wir uns freuen, sie von zu hören!

Erfahren Sie mehr über unsere GoDataDriven Open-Source-Beitragsreihe in verschiedenen Ausgaben. Tauchen Sie ein in die Ausgabe vom April 2017, in der wir bedeutende Fortschritte bei Open-Source-Technologien diskutieren. Entdecken Sie die Ausgabe vom August 2017, in der wir wichtige Beiträge für die Community hervorheben. Gewinnen Sie wertvolle Perspektiven aus unserer Ausgabe vom Dezember 2017, in der wir Innovationen und Kooperationen im Open-Source-Ökosystem vorstellen. Tauchen Sie ein in die Ausgabe vom Februar 2017 mit ausführlichen Diskussionen über neue Trends und Technologien. Sehen Sie sich unsere Beiträge aus Q3 2019 an, die unser kontinuierliches Engagement widerspiegeln, die Grenzen von Open-Source-Initiativen zu erweitern. Entdecken Sie die bahnbrechenden Beiträge aus den Ausgaben vom Juli 2017, Juni 2017, März 2017, Mai 2017 und Oktober 2017, die jeweils einzigartige Einblicke und wichtige Beiträge für die Open-Source-Gemeinschaft bieten.

Verfasst von

Giovanni Lanzani

Contact

Let’s discuss how we can support your journey.