Database
 sql >> Datenbank >  >> RDS >> Database

Analysieren Sie Big Data mit Microsoft Azure Tools

Große Daten

Big Data beschreibt die große Menge an strukturierten oder unstrukturierten Daten, die ein Unternehmen täglich überschwemmt. Big Data behandelt Möglichkeiten zur Analyse, Extraktion von Informationen oder zum Umgang mit Datensätzen, die zu groß oder komplex sind, um von normaler Datenverarbeitungssoftware verarbeitet zu werden.

Big Data hat die folgenden Eigenschaften:

  • Lautstärke: Die Menge der generierten und gespeicherten Daten
  • Vielfalt: Art und Beschaffenheit der Daten
  • Geschwindigkeit: Die Geschwindigkeit, mit der Daten generiert und verarbeitet werden
  • Wahrheit: Datenqualität und der Datenwert

Der Einfluss von Azure auf Big Data

Microsoft Azure wandelt Daten mithilfe von Tools für maschinelles Lernen in umsetzbare Erkenntnisse um. Es ermöglicht Ihnen, beliebige Daten in beliebiger Größenordnung zu kombinieren und Modelle für maschinelles Lernen in großem Umfang zu erstellen und bereitzustellen.

Mit den folgenden Azure-Produkten können erweiterte Analysen für Big Data durchgeführt werden:

  • SQL-Data Warehouse
  • Datenfabrik
  • Azure BLOB-Speicher
  • Azure Databricks
  • Azure Cosmos DB
  • Power BI

Sehen wir uns jeden von ihnen einzeln an.

SQL-Data Warehouse

SQL Data Warehouse ist ein Cloud-basiertes EDW (Enterprise Data Warehouse), das Massively Parallel Processing (eine große Anzahl von Prozessoren, die eine Reihe von Berechnungen parallel ausführen) verwendet, um komplexe Abfragen über Petabytes von Daten auszuführen.

Sie importieren Big Data einfach mit PolyBase T-SQL-Abfragen (Abfragen, die Daten aus Hadoop lesen) in SQL Data Warehouse und führen dann mit der Leistung von MPP Hochleistungsanalysen durch. Das Data Warehouse wird dann zur Single Version of Truth, auf die Sie sich für Erkenntnisse verlassen können.

Datenfabrik

Data Factory ist ein Cloud-Datenintegrationsdienst, der Dienste zum Speichern, Verschieben und Verarbeiten von Daten in automatisierten Datenpipelines zusammenstellt. Azure Data Factory ist ein hybrider Datenintegrationsdienst, mit dem Sie ETL/ELT-Workflows (Extrahieren, Transformieren, Laden) erstellen, planen und orchestrieren können.

Azure BLOB-Speicher

Azure BLOB-Speicher ist ein massiv skalierbarer Objektspeicher für unstrukturierte Dokumente, Bilder, Videos und Audio. Azure BLOB-Speicher ist für das Speichern großer Mengen unstrukturierter Daten (Daten, die keinem bestimmten Datenmodell oder keiner bestimmten Definition entsprechen), beispielsweise Text- oder Binärdaten, optimiert.

Azure BLOB-Speicher hat die folgenden Funktionen:

  • Dokumente oder Bilder direkt einem Browser bereitstellen
  • Speichern von Dateien für verteilten Zugriff
  • Streaming von Audio und Video
  • Schreiben in Protokolldateien
  • Speichern von Daten für Notfallwiederherstellung, Sicherung und Wiederherstellung sowie Archivierung

Azure Databricks

Azure Databricks ist eine einfache, schnelle und kollaborative Analyseplattform auf Apache Spark-Basis (Open-Source-Framework für verteiltes Allzweck-Cluster-Computing, das eine Schnittstelle zum Programmieren von Clustern mit impliziter Datenparallelität bereitstellt).

Azure Cosmos DB

Azure Cosmos DB ist ein global verteilter Datenbankdienst. Es wurde entwickelt, um geringe Latenz, elastische Skalierbarkeit des Durchsatzes, klar definierte Semantik für Datenkonsistenz und hohe Verfügbarkeit bereitzustellen.

Power BI

Power BI ist eine Suite von Geschäftsanalysetools, die Erkenntnisse liefern. Mit Power BI können Sie eine Verbindung zu einer Vielzahl von Datenquellen herstellen, die Datenvorbereitung vereinfachen, Ad-hoc-Analysen vorantreiben sowie Berichte erstellen, die im Web und auf Mobilgeräten verwendet werden können.

Schlussfolgerung

Big Data hat sich weiterentwickelt und entwickelt sich weiter. Mithilfe von Azure-Tools wird Big Data immer besser beherrschbar.