In diesem Blog-Beitrag werden wir einfach und klar den Unterschied zwischen 4 beliebten Feature Stores aufzeigen: Vertex AI Feature Store, FEAST, AWS SageMaker Feature Store und Databricks Feature Store. Ihre Funktionen, Möglichkeiten und Besonderheiten werden in einem Refcart verglichen. Welchen Feature Store sollten Sie für Ihre speziellen Projektanforderungen wählen? Dieser Vergleich wird Ihnen die Entscheidung wesentlich erleichtern. Aber zuerst:
Feature Store erklärt: Was ist ein Feature Store?
Ein Feature Store ist ein Datenspeicher, der es Ihnen ermöglicht, Features, Labels und Metadaten an einem Ort zu speichern. Wir können einen Feature Store zum Trainieren von Modellen und für Vorhersagen in der Produktionsumgebung verwenden. Jedes Merkmal wird zusammen mit Metadaten gespeichert. Dies ist bei der Arbeit an einem Projekt äußerst hilfreich, da jede Änderung von Anfang bis Ende nachverfolgt werden kann und jedes Feature bei Bedarf schnell wiederhergestellt werden kann.
Bevor wir weitermachen, lassen Sie uns einen Blick auf das Datenmodell des Feature Stores im untenstehenden Diagramm werfen.

Ein Feature Store enthält die Menge der Entitäten einer bestimmten Entitätszeit. Jeder Entitätstyp definiert Felder wie "entity_id", "timestamp" und eine Liste von Features wie "feature_1", "feature_2" und so weiter.
Wir können uns also einen Feature Store als eine zentralisierte Gruppe von Entitäten aus dem gesamten Unternehmen vorstellen:
- Geschäftsteams liefern hochwertige Geschäftsmetriken ohne Rauschen oder Verzerrungen durch Daten auf niedriger Ebene. Sie möchten zum Beispiel Ihre Betrugserkennungsmaschine nicht auf Daten aufbauen, die durch die betrügerischen Aktivitäten von Nutzern verzerrt sind.
- Datenwissenschaftler sind an Entitäten interessiert, die hochwertige Merkmale darstellen, um ihre maschinellen Lernmodelle zu trainieren. Meistens handelt es sich bei diesen Merkmalen nicht um Geschäftskennzahlen, sondern um sehr granulare Werte, die aus den Rohdaten Ihrer Anwendung berechnet werden (z. B. wie oft sich der Benutzer X in der letzten Stunde angemeldet hat). Diese hochwertigen Funktionen sind rechenintensiv und schwer zu pflegen. Das Letzte, was Sie wollen, ist, dass jedes maschinelle Lernmodell diese Merkmale bei jedem Lauf neu berechnet.
Die Plattform für maschinelles Lernen muss auf diese Funktionen in großem Umfang zugreifen können, wenn Sie Ihre Modelle in der Produktion ausführen.
Der Feature Store kann Geschäftsprobleme lösen, die ich in diesem Artikel erwähnt habe: MLOps 5 Machine Learning Probleme, die zu einer ineffektiven Nutzung von Daten führen.
Doch zuvor möchte ich Ihnen kurz die auf dem Markt verfügbaren Lösungen vorstellen.
Feature Store im Vergleich
Unten im Refcart finden Sie einen sehr spezifischen Vergleich der grundlegenden Unterschiede der vier beliebtesten Feature Stores: Vertex AI Feature Store, FEAST, AWS SageMaker Feature Store und Databricks Feature Store.

Ein interner Funktionsspeicher zur Verwaltung und Bereitstellung von Funktionen in verschiedenen Systemen für maschinelles Lernen ist eine wichtige Praxis für MLOps. Feature Stores helfen bei der Entwicklung, Bereitstellung, Verwaltung und Überwachung von Modellen für maschinelles Lernen. Damit können Sie den Lebenszyklus der Entwicklung Ihres Modells sowie die Flexibilität und Skalierbarkeit der Infrastruktur für maschinelles Lernen verbessern. Sie können den Feature Store auch nutzen, um eine einheitliche Schnittstelle für den Zugriff auf Features in verschiedenen Umgebungen, wie Training und Serving, bereitzustellen.
Wir sind gerade dabei, die Veröffentlichung eines Ebooks abzuschließen, das Ihnen Schritt für Schritt zeigt , wie Sie mit der Vertex AI-Plattform einen Feature Store von Grund auf aufbauen und wie Sie geschäftliche Probleme lösen, die im Prozess des maschinellen Lernens auftreten können. Wir werden auch die Unterschiede zwischen BigQuery und Snowflake, einem Cloud-nativen Data Warehouse, aufzeigen. Außerdem zeigen wir Ihnen, wie Sie mit dbt innerhalb von Minuten hoch skalierbare ELT-Pipelines aufbauen können.
Wenn Sie Fragen oder Bedenken im Bereich des maschinellen Lernens und der MLOps haben, können Sie uns gerne uns zu kontaktieren. Wir haben Erfahrung mit der Implementierung und Optimierung von Machine Learning und MLOps-Prozessen. Wir haben auch originelle Lösungen in Nischenbereichen entwickelt. Wir stehen Ihnen gerne mit unserem Fachwissen zur Verfügung.
Interessieren Sie sich für ML- und MLOps-Lösungen? Wie können Sie ML-Prozesse verbessern und die Lieferfähigkeit von Projekten steigern? Sehen Sie sich unsere MLOps-Demo an und melden Sie sich für eine kostenlose Beratung an.
Verfasst von
Jakub Jurczak
Unsere Ideen
Weitere Blogs
Contact



