HBase
 sql >> Datenbank >  >> NoSQL >> HBase

Erste Schritte mit Cloudera Data Platform Operational Database (COD)

Konzepte

Was ist die Cloudera Operational Database (COD)?

Operational Database ist eine relationale und nicht-relationale Datenbank, die auf Apache HBase aufbaut und zur Unterstützung von OLTP-Anwendungen entwickelt wurde, die Big Data verwenden.

Die Betriebsdatenbank in Cloudera Data Platform hat die folgenden Komponenten: 

  • Apache Phoenix bietet ein relationales Modell, das eine massive Skalierbarkeit ermöglicht. Es nutzt die Skalierbarkeit und Ausfallsicherheit von Apache HBase.
  • Apache HBase bietet ein nicht-relationales Modell, das auf massive Skalierbarkeit ausgelegt ist, sodass Sie unbegrenzte Datenmengen auf einer einzigen Plattform speichern und wachsende Anforderungen an die Bereitstellung von Daten bewältigen können.
  • Apache ZooKeeper bietet einen verteilten Konfigurationsdienst, einen Synchronisierungsdienst und eine Namensregistrierung.
  • Apache Knox Gateway bietet Perimetersicherheit, sodass das Unternehmen den Zugriff vertrauensvoll auf neue Benutzer ausdehnen kann.
  • Apache HDFS wird verwendet, um die Apache HBase WALs (und in einigen Fällen HBase HFiles) zu schreiben.
  • Objektspeicher wie Amazon S3 und Microsoft ADLS Gen2 werden verwendet, um die Apache HBase HFiles zu speichern.
  • Shared Data Experience (SDX) wird für Sicherheits- und Governance-Funktionen verwendet. Sicherheits- und Governance-Richtlinien werden einmal festgelegt und auf alle Daten und Workloads angewendet. Genau wie CDP selbst baut SDX auf Open-Source-Community-Projekten auf, wobei Apache Ranger und Apache Atlas an erster Stelle stehen.

Atlas bietet offene Metadatenverwaltungs- und Governance-Funktionen, um einen Katalog aller Assets zu erstellen und diese Assets auch zu klassifizieren und zu verwalten. Die SDX-Schicht von CDP nutzt das gesamte Spektrum von Atlas, um alle Datenbestände automatisch zu verfolgen und zu kontrollieren.

Ranger bietet Sicherheitsschlüsselverwaltung mit einem separaten Login für Schlüsseladministratoren, die den Ranger KMS-Dienst verwenden. Apache Ranger bietet außerdem dringend benötigte Sicherheitsfunktionen wie Spaltenmaskierung und Zeilenfilterung. Ein weiterer wichtiger Faktor ist, dass die Zugriffsrichtlinien in Ranger mit dynamischem Kontext angepasst werden können, indem verschiedene Attribute wie „geografische Region“ oder „Tageszeit“ verwendet werden.

  • IDBroker ist eine REST-API, die als Teil der Authentifizierungsdienste von Apache Knox entwickelt wurde. Es ermöglicht einem authentifizierten und autorisierten Benutzer, einen Satz von Anmeldeinformationen oder ein Token gegen Zugriffstoken von Cloud-Anbietern auszutauschen.

CDP Operational Database Data Service

CDP Operational Database (COD) ist eine in Echtzeit automatisch skalierende operative Datenbank, die von Apache HBase und Apache Phoenix unterstützt wird. Es handelt sich um einen Datendienst, der auf der Cloudera Data Platform (CDP) ausgeführt wird. Sie können direkt von Ihrer CDP-Konsole aus auf COD zugreifen. Mit COD können Sie mit einem einzigen Klick eine neue betriebsbereite Datenbank erstellen und basierend auf Ihrer Arbeitslast automatisch skalieren.

Im Folgenden sind die wichtigsten Schritte für den Einstieg in COD aufgeführt:

  • Erstellen Sie eine Datenbank in einer Umgebung mit einem einzigen Klick und eine Datenbank sollte innerhalb weniger Minuten betriebsbereit und verfügbar sein.
  • Richten Sie Ihr Workload-Passwort ein. Für weitere Informationen klicken Sie hier.
  • Apache Maven, Java, Python 3.8 herunterladen und installieren.
  • Installieren Sie den CDP-Client auf Ihrem Computer. Für weitere Informationen klicken Sie hier.
  • Folgen Sie den Anweisungen im Beispiel-Repository, um Änderungen an Ihren Maven-Dateien settings-security.xml, settings.xml und pom.xml vorzunehmen.
  • Anwendungen erstellen und ausführen.

Apache-HBase

HBase ist eine spaltenorientierte Datenspeicherarchitektur, die auf HDFS aufgebaut ist, um dessen Einschränkungen zu überwinden. Es nutzt die grundlegenden Funktionen von HDFS und baut darauf auf, um Skalierbarkeit zu bieten, indem ein großes Volumen der Lese- und Schreibanforderungen in Echtzeit verarbeitet wird. Obwohl die HBase-Architektur eine NoSQL-Datenbank ist, vereinfacht sie den Prozess der Datenpflege, indem sie sie gleichmäßig über den Cluster verteilt. Dies macht den Zugriff auf und die Änderung von Daten im HBase-Datenmodell schnell. Erfahren Sie mehr über Apache HBase.

Apache Phoenix

Apache Phoenix ist eine RDBMS- und ANSI-SQL-Schnittstelle. Apache Phoenix implementiert Best-Practice-Optimierungen, damit Softwareingenieure datengesteuerte Anwendungen der nächsten Generation auf Basis von HBase entwickeln können. Mit Phoenix können Sie Tabellen in Form typischer DDL/DML-Anweisungen erstellen und mit ihnen interagieren, indem Sie die standardmäßige JDBC-API, ODBC und die Phoenix-DB-API verwenden.

Phoenix bietet:

  • SQL- und JDBC-API-Unterstützung
  • Unterstützung für spät gebundenes Schema-on-Read
  • Zugriff auf Daten, die in anderen Komponenten wie Apache Spark und Apache Hive gespeichert und produziert werden

Erfahren Sie mehr über Apache Phoenix.

Verfahren

So erstellen Sie eine Betriebsdatenbank

Sie können eine Betriebsdatenbank in Ihrer registrierten Umgebung mit CDP Operational Database (COD) erstellen.

Voraussetzungen

  • Sie müssen als ODAdmin in der COD-Umgebung angemeldet sein.
  • Stellen Sie sicher, dass Sie berechtigt sind, eine Datenbank zu erstellen.

Schritte

  1. Melden Sie sich bei der CDP-Weboberfläche an. Beispiel:CDP-Konsole.
  2. Betriebsdatenbank auswählen.
  3. Klicken Sie in der COD-Weboberfläche auf Datenbank erstellen.
  4. Wählen Sie die Umgebung aus der Liste aus, in der Sie die Datenbank haben möchten.
  5. Geben Sie einen Namen für die Datenbank im Feld Datenbankname ein.
  6. Klicken Sie auf Datenbank erstellen.

Ergebnis

Die Informationsseite wird angezeigt, die den Status der Datenbank anzeigt. Ihre neue Datenbank kann verwendet werden, sobald ihr Status Verfügbar wird.

Demo

Wie man eine Datenbankverbindung verwaltet

Nachdem Sie eine betriebsbereite Datenbank erstellt haben und diese verfügbar ist, können Sie die Datenbankverbindungen verwalten.

Voraussetzungen

  • Stellen Sie sicher, dass eine Datenbank aktiv und verfügbar ist.
  • Sie sind berechtigt, Änderungen an der Datenbank vorzunehmen.

Schritte

  1. Wählen Sie in der COD-Weboberfläche die Datenbank aus, für die Sie die Verbindungen verwalten möchten.
  2. Gehen Sie unter Verbinden in die einzelnen Registerkarten und ändern Sie die Parameter.

Referenzen

  • Cloudera-Dokumentation zum Erstellen einer COD-Datenbank
  • Betriebsdatenbank in CDP 

Wenn Sie daran interessiert sind, CDP Public Cloud und die Operational Database auszuprobieren, probieren Sie unsere aus Testfahrt .