HBase
 sql >> Datenbank >  >> NoSQL >> HBase

Erstellen eines skalierbaren Prozesses mit NiFi, Kafka und HBase auf CDP

Navistar ist ein weltweit führender Hersteller von Nutzfahrzeugen. Bei einer Flotte von 350.000 Fahrzeugen sorgten außerplanmäßige Wartungsarbeiten und Fahrzeugausfälle für anhaltende Unterbrechungen ihres Geschäfts. Navistar benötigte eine Diagnoseplattform, die ihnen helfen würde, vorherzusagen, wann ein Fahrzeug gewartet werden muss, um Ausfallzeiten zu minimieren. Diese Plattform musste in der Lage sein, Daten aus über 70 Telematik- und Sensordaten von jedem Fahrzeug in ihrer Flotte zu sammeln, zu analysieren und bereitzustellen, einschließlich Daten zur Messung von Motorleistung, Kühlmitteltemperatur, Lkw-Geschwindigkeit und Bremsverschleiß. Navistar wandte sich an Cloudera, um beim Aufbau einer IoT-fähigen Ferndiagnoseplattform namens OnCommand® Connection zu helfen, um den Zustand ihrer Fahrzeuge zu überwachen und die Betriebszeit der Fahrzeuge zu erhöhen.

Dieser Blog demonstriert die Verwendung ähnlicher Technologien, um Probleme anzugehen, die viel kleiner sind, aber Parallelen zu denen aufweisen, mit denen Navistar konfrontiert war. Daten wurden von einer stark modifizierten Hochleistungs-Corvette (siehe Abb. 1) abgerufen, um die Schritte zum Laden von Daten aus einer externen Quelle, zum Formatieren mit Apache NiFi, zum Pushen an eine Stream-Quelle über Apache Kafka und zum Speichern mit zu zeigen Apache HBase für zusätzliche Analysen.

Abb. 1. 2008er Corvette mit modifiziertem 6,8-Liter-Motor

Für dieses spezifische Beispiel wurden bei der fraglichen Corvette alle originalen Werksmotorkomponenten zugunsten von leistungsstärkeren Teilen ersetzt. Der Motor wurde bis auf den Rohbau zerlegt, die Zylinder aufgebohrt, die Kurbelwelle und die Nockenwelle ersetzt und neue Kolben und Pleuel wurden eingebaut, um das Ziel von ~600 PS zu verfolgen (siehe Abb. 2). Damit diese neue Motorkonfiguration richtig funktioniert, wurde die Software des Motors komplett überarbeitet. Während das Drücken des Gaspedals deutlich dramatischer wurde, war eine unbeabsichtigte Folge, dass die ursprünglichen Diagnose- und Fehlersysteme des Autos nicht mehr genau waren und daher deaktiviert werden mussten.

Abb. 2. Überholung der Motormitte mit komplett neuen, glänzenden Innenteilen

Um die Sensordaten der Corvette zu erfassen und zu analysieren, wurde ein Pfad benötigt, über den die Daten vom Auto in eine alternative Analyse- und Diagnoseplattform fließen konnten. Der erste Schritt bestand darin, einen Laptop an den Diagnoseanschluss der Corvette anzuschließen (siehe Abb. 3), um Sensordaten in einen Cloud-basierten Speicherort zu importieren. S3 wurde für dieses Projekt verwendet.

Abb. 3. Laptop über USB mit Diagnoseanschluss verbunden

Der nächste Schritt bestand darin, Cloudera Data Platform (CDP), Clouderas multifunktionale Multianalyseplattform, zu verwenden, um auf die Dienste zuzugreifen, die erforderlich sind, um die Daten für zusätzliche Analysen an ihren endgültigen Speicherort zu verschieben. Unter Verwendung von CDP Public Cloud wurden 3 Daten-Hubs eingerichtet, die jeweils eine Reihe von vorgefertigten Open-Source-Diensten hosten (siehe Abb. 4):

  • Das erste Setup war NiFi, ein Dienst, der entwickelt wurde, um den Datenfluss zu automatisieren und zu verwalten. NiFi wurde verwendet, um die Daten der Corvette von der Quelle zu ihrem endgültigen Speicherort zu importieren, zu formatieren und zu verschieben.
  • Als nächstes wurde Kafka eingerichtet, ein Echtzeit-Streaming-Dienst, der es ermöglicht, große Datenmengen als Stream verfügbar zu machen. Kafka bietet die Möglichkeit zur Stream-Verarbeitung der Daten, während es gleichzeitig anderen Benutzern die Möglichkeit gibt, die Datenströme zu abonnieren. In diesem Beispiel gibt es keine Abonnenten; Dies ist jedoch ein wichtiges Konzept, das eine Demonstration seiner Einrichtung verdient.
  • Das endgültige Setup war HBase, eine hochgradig skalierbare, spaltenorientierte Betriebsdatenbank, die Lese-/Schreibzugriff in Echtzeit bietet. Sobald die Daten in HBase importiert wurden, wurde Phoenix zum Abfragen und Abrufen von Daten verwendet.

Abb. 4. Corvette-Datenflussdiagramm von der Quelle zur Abfrage.

Der Aufbau der Diagnoseplattform mit CDP zur Überwachung des Zustands und der Leistung der Corvette war eine erfolgreiche Übung. Die Verwendung von NiFi und Kafka zum Formatieren und Streamen der Sensordaten in HBase ermöglicht jetzt eine erweiterte Datentechnik und -verarbeitung, unabhängig davon, wie groß der Datensatz wird.

Nächste Schritte

Um all dies in Aktion zu sehen, sehen Sie sich bitte die Links unten zu einigen verschiedenen Quellen an, die den erstellten Prozess zeigen.

  • Video – Wenn Sie sehen und hören möchten, wie dies gebaut wurde, schauen Sie sich ein kurzes 5-minütiges Video an, das die Echtzeit-Navigation von CDP mit NiFi, Kafka zeigt und HBase.
  • Tutorials – Wenn Sie dies in Ihrem eigenen Tempo tun möchten, sehen Sie sich eine detaillierte Anleitung mit Screenshots und zeilenweisen Anweisungen zur Einrichtung an.
  • MeetUps – Wenn Sie direkt mit Experten von Cloudera und sogar dem Besitzer dieser Corvette sprechen möchten, nehmen Sie bitte an einem virtuellen Meetup teil, um seine Live-Präsentation zu sehen. Am Ende ist Zeit für direkte Fragen und Antworten.
  • CDP-Benutzerseite – Klicken Sie auf den Link, um mehr über andere CDP-Ressourcen zu erfahren, die für Benutzer erstellt wurden, darunter zusätzliche Videos, Tutorials, Blogs und Veranstaltungen.