Blog
Einführung in die dbt Cloud - Funktionen, Möglichkeiten und Grenzen

dbt Cloud ist ein Service, der Datenanalysten und Ingenieure dabei unterstützt, ihre dbt-Implementierungen in Produktion zu bringen. Da datengesteuerte Unternehmen immer weiter wachsen, wird die Notwendigkeit einer effizienten und effektiven Datenverwaltung immer wichtiger. dbt Cloud bietet eine Lösung zur Automatisierung des Datenanalyseprozesses, die es den Teams erleichtert, ihre Daten zu verwalten und wertvolle Erkenntnisse zu gewinnen.
In diesem Artikel werfen wir einen genaueren Blick auf die Funktionen und Vorteile von dbt Cloud, aber auch auf die möglichen Nachteile. Wir werden untersuchen, wie dbt Cloud die Zusammenarbeit von Datenteams unterstützt und ihre Arbeit rationalisiert, während es gleichzeitig Anpassungsfähigkeit und Kontrolle für Unternehmen bietet, die dies benötigen. Egal, ob Sie ein kleines Unternehmen sind, das seinen Datenanalyseprozess verbessern möchte, oder ein großes Unternehmen, das nach Möglichkeiten zur Optimierung seiner Datenverwaltung sucht, dbt Cloud könnte die Lösung sein, nach der Sie gesucht haben. Werfen wir also einen genaueren Blick auf dieses leistungsstarke Tool.
Was ist dbt?
Um in die Welt von dbt Cloud einzutauchen, ist es zunächst wichtig zu verstehen, was dbt eigentlich ist. Ein Data Build Tool (dbt) ist eine Plattform, die es Datenteams ermöglicht, auf strukturierte, wiederholbare und organisierte Weise mit Daten zu arbeiten. dbt ist eine Komponente des Extract, Transform, Load (ETL)-Prozesses und konzentriert sich speziell auf die Transformationsphase. Es verwendet die Architektur "Transformieren nach Laden".
dbt ermöglicht es Anwendern, Daten in ihrem Data Warehouse zu modellieren und zu transformieren und dabei Konzepte wie Versionskontrolle, kontinuierliche Integration, Bereitstellung und Unit-Tests zu nutzen. Durch die Einbeziehung bewährter Software-Engineering-Praktiken verbessert dbt den Transformationsprozess, erhöht die Zuverlässigkeit und Verlässlichkeit der Daten und versetzt Datenteams in die Lage, als Analysetechniker zu agieren. Es bietet Funktionen wie Modellreferenzierung, Abstammung, Dokumentation und Testen, um die Effizienz und Zusammenarbeit bei der Bereitstellung von Analysecode zu verbessern. dbt ist ein Open-Source-Tool, das entwickelt wurde, um den Zeit- und Arbeitsaufwand für Datenteams zu optimieren, Ablenkungen zu verringern und die Produktivität zu steigern.
dbt ist eine Lösung, die im Bereich der Datenverwaltung an Popularität gewonnen hat. Einer der Hauptgründe dafür ist der Self-Service- und Low-Code-Ansatz. dbt ermöglicht es Datenanalysten, unabhängig zu arbeiten, was eine schnellere Datenanalyse und Entscheidungsfindung ermöglicht, da Datenteams ihre eigenen Datenpipelines erstellen können, ohne in hohem Maße von Dateningenieuren abhängig zu sein. Dies ist vor allem der Tatsache zu verdanken, dass es bei dbt-Workflows um Datentransformationen in SQL geht, die durch leicht verständliche Yaml-Konfigurationen und Makros unterstützt werden. Außerdem bietet es native Unterstützung für Datentests, Datendokumentation und Datenabgleich. Wenn wir dann noch hinzufügen, dass es in praktisch jeder Cloud- oder On-Premise-Datenumgebung problemlos eingesetzt werden kann - was will man mehr?
Was ist dbt Cloud?
dbt Labs, das Unternehmen, das hinter dbt steht, bietet auch ein verwandtes Produkt namens dbt Cloud an. dbt Cloud ist eine abonnementbasierte Cloud-Version, die eine zusätzliche Schnittstellenebene bietet und das Hosting übernimmt, sowie ein verwaltetes Git-Repository und die Möglichkeit, dbt-Transformationsaufträge für verschiedene Umgebungen zu planen.
Hauptmerkmale von dbt Cloud
dbt Cloud umfasst (neben den in dbt Core verfügbaren Funktionen) Funktionen wie Job Scheduling, kontinuierliche Integration und kontinuierliches Deployment, Dokumentation, Überwachung und Alarmierung. Zu den wichtigsten Funktionalitäten von dbt Cloud gehören:
- Job-Planung: Die Möglichkeit, einen oder mehrere dbt-Befehle nach einem Zeitplan mit einer einfachen Cron-Syntax auszuführen.
- Benachrichtigung: Konfigurierbare Warnmeldungen für Aufträge, wenn Fehler oder Warnungen auftreten, die per E-Mail oder Slack versendet werden können.
- Browserbasierte Entwicklung: Die Möglichkeit, dbt-Modelle innerhalb des Browsers zu entwickeln, wodurch zusätzliche Tools überflüssig werden.
Mit dbt Cloud können Sie ganz einfach zwischen verschiedenen Umgebungen wechseln und die Ausführung Ihrer eigenen dbt-Befehle für Aufgaben wie das Ausführen, Testen und Generieren von Dokumentenausgaben mit DAGs planen.
Umgebungen
dbt Cloud führt Environments ein, mit denen Sie Aufträge innerhalb eines dbt-Projekts organisieren und konfigurieren können. Eine Umgebung kapselt eine Sammlung von Einstellungen für die Ausführung Ihres dbt-Projekts, einschließlich der dbt-Version, des Git-Zweigs und des Datenorts (Zielschema).

In der Entwicklungsumgebung gelten für alle Entwickler, die dbt Cloud verwenden, die gleichen Einstellungen. So kann jeder Benutzer über eine eigene Umgebung verfügen, komplett mit Konfiguration und Anmeldeinformationen, was die Bereitstellung von dbt für alle Mitglieder eines Datenteams vereinfacht und sicherer macht. Die Bereitstellungsumgebungen können so konfiguriert werden, dass sie verschiedene Bereitstellungsstrategien und Architekturen unterstützen.
Jobs
Jobs sind eine Sammlung von dbt-Befehlen, die in einer Umgebung ausgeführt werden. Sie können Befehle wie dbt build mit jeder gewünschten Auswahlsyntax/Flags enthalten. Jobs können mit verschiedenen Methoden wie Zeitplan, Webhook oder API-Trigger gestartet werden. 
Geschichte ausführen
Läufe sind die Ausführung eines konfigurierten Auftrags, der ausgelöst wurde. Sie können den Status eines Auftrags in Echtzeit einsehen, während er ausgeführt wird. Sobald der Job abgeschlossen ist, können Sie auf die Ergebnisse des Laufs zugreifen und die Artefakte dieses speziellen Laufs untersuchen. Die Funktion Laufverlauf in dbt Cloud bietet eine Oberfläche, mit der Sie Aufträge anhand ihres Namens, ihres Status und ihrer Umgebung einfach filtern und anzeigen können. So können Benutzer fehlgeschlagene Aufträge aus den vergangenen Monaten leicht auffinden und untersuchen. Mit dieser Funktion können dbt Cloud-Benutzer historische Läufe analysieren, um Änderungen in den Projekt-Build-Zeiten zu bewerten, Fehler bei der Erstellung zu beheben und Probleme mit der Datenqualität zu beurteilen.
API
dbt Cloud führt eine API für die Verwaltung von dbt-Implementierungen ein, die die Erstellung und Auslösung von Jobs zur Orchestrierung komplexer Daten-Workflows ermöglicht. Die API kann in Airflow integriert werden, um dbt-Aufträge auszulösen. Dies ermöglicht die Integration von dbt in bestehende Datenpipelines und bietet gleichzeitig eine benutzerfreundliche Weboberfläche für Datenanalysten und Ingenieure zur Erstellung von dbt-basierten Transformationspipelines.
IDE
Ein wichtiger Aspekt der dbt Cloud ist die browserbasierte integrierte Entwicklungsumgebung (IDE), die den Prozess der Entwicklung und des Testens von SQL-Abfragen und Datentransformationen vereinfacht, indem sie Abfrageergebnisse in Echtzeit bereitstellt und so die Frustration des Datenanalystenteams verringert. Sie ermöglicht eine schnelle Kodierung, die gleichzeitige Anzeige mehrerer Abfrageergebnisse in einem Browser, die Validierung von Abfragen beim Speichern, die Kompilierung von Abfragen und die Vorschau früherer Versionen von Abfragen. 
Beschränkungen und Nachteile
dbt Cloud hat Probleme mit der Skalierbarkeit, die seine Leistung beeinträchtigen können. Die Plattform verfügt über eine begrenzte Gleichzeitigkeit. Für Team-Konten ist nur ein gleichzeitiger Auftrag zulässig, für Enterprise-Konten fünf. Diese Einschränkung ist wahrscheinlich auf die Nutzung gemeinsamer Ressourcen durch alle Kunden zurückzuführen. Dies kann zu zusätzlichen Latenzzeiten und begrenzter Gleichzeitigkeit führen, was für die Benutzer von Nachteil sein kann.
dbt Cloud kann Herausforderungen mit sich bringen, wenn es um die Verwaltung separater Warehouse-Verbindungen geht. Ein großes Problem ist, dass es nicht möglich ist, eine andere Verbindung auf Umgebungsebene festzulegen. Dies kann zu Problemen führen, wenn Sie versuchen, getrennte Datenbanken für verschiedene Umgebungen zu verwalten, da die Benutzer möglicherweise auf zusätzliche Hacks zurückgreifen müssen, z.B. indem sie getrennte Projekte für verschiedene Warehouses verwenden und diese mit verschiedenen Hostnamen verknüpfen, während sie sich dennoch mit demselben Repository verbinden. Dies mag zwar als vorübergehende Lösung funktionieren, kann aber schnell unhandlich werden, wenn die Anzahl der Umgebungen und Projekte wächst. Daher ist es wichtig, die Skalierbarkeit der gewählten Lösung zu berücksichtigen, bevor Sie sich für ein Tool wie dbt Cloud entscheiden.
Ein weiterer Nachteil von dbt Cloud ist die relativ begrenzte integrierte Entwicklungsumgebung (IDE) im Vergleich zu fortschrittlicheren Code-Editoren. Dies kann eine Herausforderung für erfahrenere Dateningenieure sein, die an die Arbeit mit funktionsreicheren IDEs gewöhnt sind.
Eine weitere Einschränkung von dbt Cloud ist die Unterstützung für grundlegende Git-Funktionen. Das bedeutet, dass komplexere Git-Workflows, wie das Zusammenführen, in der dbt Cloud-Umgebung nicht möglich sind. Dies kann ein Problem für Teams sein, die sich bei der Versionskontrolle und Zusammenarbeit auf Git verlassen.
Es gibt auch einige Sicherheitsbedenken im Zusammenhang mit der dbt Cloud. Wenn Sie die browserbasierte IDE zum Schreiben interaktiver Abfragen verwenden, wird die Abfrage im Data Warehouse ausgeführt und die Ergebnisse werden durch die dbt Cloud-Infrastruktur geleitet, bevor sie in Ihrem Browser angezeigt werden. Dieser Prozess birgt das Risiko von Datenverletzungen oder unbefugtem Zugriff auf sensible Informationen.
dbt Cloud ist durch die jüngsten Preiserhöhungen relativ teuer geworden, so dass es für kleinere Unternehmen oder einzelne Datenanalysten weniger zugänglich ist. Dies ist ein erheblicher Nachteil für diejenigen, die dbt Cloud bisher als kostengünstige Lösung für die Datenmodellierung und -transformation genutzt haben. Auch für größere Organisationen, die mehrere Lizenzen und Benutzerkonten verwalten müssen, können die Kosten der dbt Cloud eine Herausforderung darstellen.
Preisgestaltung
dbt Cloud wird mit drei verschiedenen Abonnementoptionen angeboten: Entwickler, Team und Enterprise. Jede Abonnementstufe bietet unterschiedliche Funktionen und Preise.
Das Entwickler-Abonnement ist die Einstiegsoption und bietet Dienste für Datenteams mit einer Person. Es ist für einen Entwicklerplatz für immer kostenlos und umfasst Funktionen wie eine browserbasierte IDE, Jobplanung, unbegrenzte tägliche Durchläufe, ein Projektlimit, Protokollierung und Benachrichtigung, Datendokumentation, Berichte über die Aktualität der Quellen und kontinuierliche Integration. Außerdem bietet es native Unterstützung für GitHub und GitLab und wird in den USA gehostet.
Das Team-Abonnement ist für Teams gedacht, die gemeinsam an dem Workflow arbeiten möchten. Es umfasst alle Funktionen des Entwickler-Abonnements sowie die Möglichkeit, bis zu 8 Arbeitsplätze, ein Projektlimit, 5 schreibgeschützte Arbeitsplätze, bis zu 2 gleichzeitig laufende Aufträge, API-Zugang und eine semantische Schicht hinzuzufügen.
Das Enterprise-Abonnement ist für Unternehmen gedacht, die ihre Bereitstellung individuell anpassen und fein abgestufte Kontrollen anwenden möchten. Der Preis für dieses Abonnement ist individuell und bietet Funktionen wie alle Funktionen des Team-Abonnements, unbegrenzte Projekte, Einzelanmeldungen, mehrere Bereitstellungsregionen, Service Level Agreements, professionelle Dienstleistungen, rollenbasierte Zugriffskontrolllisten, fein abgestufte Git-Berechtigungen, Audit-Protokollierung und native Unterstützung für GitHub, GitLab und Azure DevOps.
Entwickler- und Team-Konten werden mit 24x5-Support geliefert, während Enterprise-Kunden vorrangigen Zugang zum Support erhalten und die Möglichkeit haben, eine individuelle Abdeckung zu wählen.
Insgesamt bietet dbt Cloud eine Reihe von Optionen für Unternehmen unterschiedlicher Größe und Bedürfnisse, wobei das Maß an Kontrolle und Sicherheit mit zunehmender Abonnementstufe steigt.
Alternativen zu dbt Cloud
Für diejenigen, die nach einer leistungsfähigeren Alternative zu dbt Cloud suchen, kann die Kombination von Airflow und dbt Core mit CI/CD einen erstaunlichen Stack bieten, der ähnliche Funktionen bietet, aber viele Einschränkungen vermeidet. Durch den Einsatz dieser Open-Source-Tools können Teams ihre Datenpipelines automatisieren und die vollständige Kontrolle über ihre Infrastruktur behalten.
Mit Airflow können Sie komplexe Daten-Workflows mühelos definieren, planen und ausführen. Die Plattform bietet eine webbasierte Oberfläche, mit der Sie Ihre Datenpipelines einfach überwachen und verwalten können, und sie lässt sich gut mit anderen Tools wie dbt integrieren.
Bei GetInData haben wir eine Kombination aus Airflow und dbt Core mit CI/CD verwendet, um eine moderne Datenplattform zu schaffen, die unsere Datenverarbeitungsmöglichkeiten revolutioniert hat. Wenn Sie mehr über unsere Lösung erfahren möchten, laden wir Sie ein, den Blogpost " GetInData Modern Data Platform - features & tools" zu lesen. Es ist auch erwähnenswert, dass wir bei GetInData an verschiedenen Projekten arbeiten, die sowohl dbt Cloud als auch dbt Core nutzen, um leistungsstarke Datenpipelines aufzubauen. Je nach Projektanforderungen wählen wir die Lösung, die unseren Bedürfnissen am besten entspricht.
Ist die dbt Cloud die richtige Lösung für Ihr Team?
Zusammenfassend lässt sich sagen, dass dbt Cloud ein leistungsstarkes Tool für die Datenverwaltung und -transformation ist, das bei datenorientierten Unternehmen an Beliebtheit gewonnen hat. Es bietet verschiedene Funktionen wie effiziente Automatisierung, Live-Abfrageergebnisse, Warnmeldungen und eine browserbasierte IDE und ist damit eine ideale Lösung für Unternehmen, die einen schnellen und einfachen Einstieg suchen. dbt Cloud ist vielleicht nicht die beste Option für größere Teams, die über die Ressourcen verfügen, diese Funktionen intern zu implementieren, aber es ist eine wertvolle Lösung für kleine Teams, die nach Möglichkeiten suchen, ihre Zeit und Ressourcen zu maximieren.
Möchten Sie mehr über dbt Cloud und Modern Data Platform erfahren? Vereinbaren Sie ein kostenloses Beratungsgespräch mit unseren Experten.
Verfasst von
Radosław Dziadosz
Unsere Ideen
Weitere Blogs
Contact



