Große Daten
Big Data beschreibt die große Menge an strukturierten oder unstrukturierten Daten, die ein Unternehmen täglich überschwemmt. Big Data behandelt Möglichkeiten zur Analyse, Extraktion von Informationen oder zum Umgang mit Datensätzen, die zu groß oder komplex sind, um von normaler Datenverarbeitungssoftware verarbeitet zu werden.
Big Data hat die folgenden Eigenschaften:
- Lautstärke: Die Menge der generierten und gespeicherten Daten
- Vielfalt: Art und Beschaffenheit der Daten
- Geschwindigkeit: Die Geschwindigkeit, mit der Daten generiert und verarbeitet werden
- Wahrheit: Datenqualität und der Datenwert
Der Einfluss von Azure auf Big Data
Microsoft Azure wandelt Daten mithilfe von Tools für maschinelles Lernen in umsetzbare Erkenntnisse um. Es ermöglicht Ihnen, beliebige Daten in beliebiger Größenordnung zu kombinieren und Modelle für maschinelles Lernen in großem Umfang zu erstellen und bereitzustellen.
Mit den folgenden Azure-Produkten können erweiterte Analysen für Big Data durchgeführt werden:
- SQL-Data Warehouse
- Datenfabrik
- Azure BLOB-Speicher
- Azure Databricks
- Azure Cosmos DB
- Power BI
Sehen wir uns jeden von ihnen einzeln an.
SQL-Data Warehouse
SQL Data Warehouse ist ein Cloud-basiertes EDW (Enterprise Data Warehouse), das Massively Parallel Processing (eine große Anzahl von Prozessoren, die eine Reihe von Berechnungen parallel ausführen) verwendet, um komplexe Abfragen über Petabytes von Daten auszuführen.
Sie importieren Big Data einfach mit PolyBase T-SQL-Abfragen (Abfragen, die Daten aus Hadoop lesen) in SQL Data Warehouse und führen dann mit der Leistung von MPP Hochleistungsanalysen durch. Das Data Warehouse wird dann zur Single Version of Truth, auf die Sie sich für Erkenntnisse verlassen können.
Datenfabrik
Data Factory ist ein Cloud-Datenintegrationsdienst, der Dienste zum Speichern, Verschieben und Verarbeiten von Daten in automatisierten Datenpipelines zusammenstellt. Azure Data Factory ist ein hybrider Datenintegrationsdienst, mit dem Sie ETL/ELT-Workflows (Extrahieren, Transformieren, Laden) erstellen, planen und orchestrieren können.
Azure BLOB-Speicher
Azure BLOB-Speicher ist ein massiv skalierbarer Objektspeicher für unstrukturierte Dokumente, Bilder, Videos und Audio. Azure BLOB-Speicher ist für das Speichern großer Mengen unstrukturierter Daten (Daten, die keinem bestimmten Datenmodell oder keiner bestimmten Definition entsprechen), beispielsweise Text- oder Binärdaten, optimiert.
Azure BLOB-Speicher hat die folgenden Funktionen:
- Dokumente oder Bilder direkt einem Browser bereitstellen
- Speichern von Dateien für verteilten Zugriff
- Streaming von Audio und Video
- Schreiben in Protokolldateien
- Speichern von Daten für Notfallwiederherstellung, Sicherung und Wiederherstellung sowie Archivierung
Azure Databricks
Azure Databricks ist eine einfache, schnelle und kollaborative Analyseplattform auf Apache Spark-Basis (Open-Source-Framework für verteiltes Allzweck-Cluster-Computing, das eine Schnittstelle zum Programmieren von Clustern mit impliziter Datenparallelität bereitstellt).
Azure Cosmos DB
Azure Cosmos DB ist ein global verteilter Datenbankdienst. Es wurde entwickelt, um geringe Latenz, elastische Skalierbarkeit des Durchsatzes, klar definierte Semantik für Datenkonsistenz und hohe Verfügbarkeit bereitzustellen.
Power BI
Power BI ist eine Suite von Geschäftsanalysetools, die Erkenntnisse liefern. Mit Power BI können Sie eine Verbindung zu einer Vielzahl von Datenquellen herstellen, die Datenvorbereitung vereinfachen, Ad-hoc-Analysen vorantreiben sowie Berichte erstellen, die im Web und auf Mobilgeräten verwendet werden können.
Schlussfolgerung
Big Data hat sich weiterentwickelt und entwickelt sich weiter. Mithilfe von Azure-Tools wird Big Data immer besser beherrschbar.