HBase
 sql >> Datenbank >  >> NoSQL >> HBase

Betriebsdatenbank in CDP

Anmerkung des Herausgebers, August 2020:CDP Data Center heißt jetzt CDP Private Cloud Base. Hier erfahren Sie mehr darüber.

Die Betriebsdatenbank (OpDB) von Cloudera in CDP bietet eine jederzeit verfügbare, skalierbare OpDB in Echtzeit, die traditionelle strukturierte Daten neben neuen unstrukturierten Daten innerhalb einer einheitlichen Betriebs- und Lagerhaltungsplattform bereitstellt. Cloudera liefert eine operative Datenbank, die herkömmliche strukturierte Daten neben neuen unstrukturierten Daten innerhalb einer einheitlichen Open-Source-Plattform bereitstellt.

Die Betriebsdatenbank hilft Ihnen dabei:

Operationalisieren Sie maschinelles Lernen/künstliche Intelligenz, um Sektoren wie das Gesundheitswesen, öffentliche Versorgungsunternehmen usw. zu revolutionieren 

  • Stellen Sie Inhalte in Echtzeit auf Webscale bereit.
  • Ermöglichen Sie Big-Data-Analysen für betriebliche und Offline-Nutzung.
  • Verwenden Sie es als robusten Speicher für Aufzeichnungen.

OpDB in CDP ist derzeit in zwei Formfaktoren verfügbar:als vollständig sicheres, teilweise verwaltetes Angebot in CDP Public Cloud – Data Hub und als vollständig anpassbares Angebot in CDP Data Center – ähnlich dem, was bereits in CDH und HDP verfügbar ist. Sie können einen Formfaktor basierend auf Ihrer Bereitstellungsstrategie und Ihren OpDB-Anforderungen auswählen. Die Betriebsdatenbank verwendet einen Objektspeicher wie Amazon S3 als Speicherebene für Apache HBase, wobei HFiles in den Objektspeicher, WALs jedoch in HDFS geschrieben werden.

Die Betriebsdatenbank in CDP hat die folgenden Komponenten: 

  • Apache Phoenix ist eine SQL-Schnittstelle, die auf Apache HBase läuft.
  • Apache HBase ist auf massive Skalierbarkeit ausgelegt, sodass Sie unbegrenzte Datenmengen auf einer einzigen Plattform speichern und den wachsenden Bedarf an Datenbereitstellung bewältigen können.
  • Apache ZooKeeper bietet einen verteilten Konfigurationsdienst, einen Synchronisierungsdienst und eine Namensregistrierung.
  • Apache Knox Gateway bietet Perimetersicherheit, sodass das Unternehmen den Zugriff auf neue Benutzer vertrauensvoll erweitern kann.
  • Apache HDFS wird verwendet, um die Apache HBase WALs zu schreiben.
  • Objektspeicher wie Amazon S3 und Microsoft ADLS Gen2 werden verwendet, um die Apache HBase HFiles zu speichern.
  • Shared Data Experience (SDX) wird für Sicherheits- und Governance-Funktionen verwendet. Sicherheits- und Governance-Richtlinien werden einmal festgelegt und auf alle Daten und Workloads angewendet.
  • IDBroker ist eine REST-API, die als Teil der Authentifizierungsdienste von Apache Knox entwickelt wurde. Es ermöglicht einem authentifizierten und autorisierten Benutzer, einen Satz von Anmeldeinformationen oder ein Token gegen Zugriffstoken von Cloud-Anbietern auszutauschen.

Betriebsdatenbank in der CDP-Reihe 

Dieser Artikel gab Ihnen eine Einführung in OpDB auf CDP und seine Architektur. In den kommenden Artikeln dieser Reihe können Sie mehr über jeden Aspekt der OpDB erfahren und sich über die neuen Features und Möglichkeiten von OpDB informieren. Wir werden die Links zu jedem Blogbeitrag aktualisieren, sobald sie veröffentlicht werden.

Barrierefreiheit

OpDB von Cloudera stellt sicher, dass Benutzer auf gespeicherte Daten zugreifen oder diese abrufen können. Es unterstützt sowohl Auto-Sharding als auch vordefiniertes Sharding, drei Abfrage-Engines und mehrere Datenintegrationstools. Dieser Artikel bietet einen Überblick über diese Funktionen und andere Funktionen, die sicherstellen, dass ein hohes Maß an Barrierefreiheit erreicht wird.

Verwaltung

OpDB von Cloudera bietet mehrere Verwaltungstools und -funktionen zur Verwaltung Ihres OpDB-Workloads. Administratoren können OpDB als vollständig sicheres, teilweise verwaltetes Angebot in CDP Public Cloud – Data Hub und als vollständig anpassbares Angebot in CDP Data Center (ähnlich dem, was in CDH und HDP verfügbar ist) bereitstellen. Dieser Artikel bietet Ihnen einen allgemeinen Überblick darüber, welche Features und Tools zur Verwaltung von OpDB in CDP unterstützt werden.

Verwaltung

OpDB von Cloudera bietet Verwaltungstools, mit denen Sie Ihre OpDB-Workloads effektiv verwalten können. Dieser Artikel gibt Ihnen einen Überblick über die OpDB-Verwaltungstools und -funktionen in CDP.

Verfügbarkeit

Die OpDB von Cloudera hält ein hohes Maß an Datenverfügbarkeit aufrecht und stellt sicher, dass die erforderlichen Daten jederzeit und überall zugänglich sind, selbst wenn ein Knoten ausfällt. Dieser Artikel bietet einen Überblick über Funktionen, die ein hohes Maß an Verfügbarkeit ermöglichen, wie z. B. sofort einsatzbereite Hochverfügbarkeit, Datenreplikation und Fehlerschutz.

Integrität

OpDB von Cloudera bietet verschiedene Datenintegritätsfunktionen, darunter Entitäts- und Domänenintegrität, ACID-Transaktionen und nicht relationale Integrität. Dieser Artikel bietet einen Überblick über die Datenintegritätsfunktionen von OpDB.

Anwendungsunterstützung

OpDB von Cloudera unterstützt verschiedene gängige Sprachen, Frameworks und Anwendungen, mit denen Sie auf Daten zugreifen können, die in Ihrer OpDB gespeichert sind. Dieser Artikel gibt Ihnen einen Überblick über die unterstützten Sprachen, Frameworks und Anwendungen.

NoSQL und verwandte Funktionen

Da OpDB von Cloudera die NoSQL-Datenbank HBase zum Speichern von Daten enthält, verfügt es über NoSQL-Funktionen wie Schlüsselwerte, Tabellenfunktionen und flexible Datentypen. Eine enge Integration im gesamten Hadoop-Ökosystem wird ebenfalls bereitgestellt, einschließlich HDFS, Spark und Kafka. Dieser Artikel bietet einen Überblick über diese Funktionen.

Skalierbarkeit

OpDB von Cloudera ist auf hohe Skalierbarkeit ausgelegt und unterstützt sowohl vertikale als auch horizontale Skalierbarkeit mit flexiblem Datentyp und unbegrenzter Datengröße. Dieser Artikel bietet eine Übersicht über unterstützte Skalierbarkeitsfunktionen und -tools.

Sicherheit

OpDB von Cloudera bietet mehrere Sicherheitslösungen auf verschiedenen Ebenen in Bezug auf Verschlüsselung, Authentifizierung, Autorisierung und Audit. Dieser Artikel bietet einen Überblick über diese sicherheitsbezogenen Funktionen und Tools.

Weitere Informationen finden Sie unter:Erste Schritte mit Operational Database.