Translate

on

Klicken Sie hier, um mehr über Gilad David Maayan zu erfahren.

Rohdaten sind bedeutungslos. Es ist der Prozess der Big-Data-Analyse, der bedeutungslose Datensätze in umsetzbare Erkenntnisse verwandelt. Die Big-Data-Analyse ist die Grundlage datengetriebener Entscheidungen, die es Unternehmen ermöglichen, Vermutungen und hoffnungsvollen Anschauungen zu entgehen.

Bevor Sie Ihre Rohdaten in Erkenntnisse umwandeln können, müssen Sie einen Analyseprozess einrichten. Jedes Projekt verdient einen anderen Ansatz. Sie können eine Kombination eines cloudbasierten Data Warehouse mit einem kompatiblen Analysedienst verwenden. Alternativ können Sie verwaltete Dienste mit privaten Clouds kombinieren. Oder Sie richten Ihren eigenen Hybridbetrieb ein.

Wenn Sie Azure-Clouddienste verwenden oder in Betracht ziehen, finden Sie in diesem Artikel Informationen zu acht gängigen Optionen für die Big Data-Analyse in Microsoft Azure, zu den Unterschieden zwischen den einzelnen Diensten und zu typischen Anwendungsfällen für die einzelnen Optionen.

1. Azure Synapse Analytics

Azure Synapse Analytics ist die nächste Generation von Azure SQL Data Warehouse. Sie können eine beliebige Anzahl von Datenquellen laden – sowohl relationale als auch nicht relationale Datenbanken, ob lokal oder in der Azure-Cloud. Es vereinheitlicht alle Daten und ermöglicht es Ihnen, sie in der SQL-Sprache zu verarbeiten und zu analysieren. Darüber hinaus wird das Azure Synapse Studio bereitgestellt, das einen Arbeitsbereich für Big Data-Analysen und KI-Aufgaben bietet und ansprechende Visualisierungen Ihrer Daten erstellt.

Bildquelle: Microsoft Azure

2. Azurblau
Databricks

Databricks
ist ein Analysedienst, der auf Apache Spark basiert. Apache Spark ist ein erfahrenes Tool
wird verwendet, um große Mengen unstrukturierter Daten mit hoher Geschwindigkeit zu verarbeiten. Databricks
unterstützt Sprachen wie Python, Scala, Java, SQL und R sowie AI / ML
Bibliotheken wie TensorFlow und PyTorch, mit denen Sie mit Spark-Daten arbeiten können
Verwendung einer dieser Sprachen und Frameworks. Darüber hinaus integriert Databricks
mit Azure Machine Learning (siehe unten) erhalten Sie Zugriff auf eine große Anzahl von
vorgefertigte Algorithmen für maschinelles Lernen.

Databricks
Ermöglicht das Einrichten von verwalteten Apache Spark-Clustern mit automatischer Skalierung und
Automatische Beendigung, wodurch die Komplexität der Einrichtung von Spark in Ihrem lokalen System entfällt
Rechenzentrum.

3. Azure HDInsight

Apache
Hadoop war im letzten Jahrzehnt ein riesiges Geschäft für Big Data, und die Nutzung hat es auch getan
abgelehnt, ist das Hadoop-Ökosystem immer noch unglaublich leistungsfähig. Es erlaubt Ihnen zu
Führen Sie komplexe, verteilte Analyseaufgaben mit praktisch jedem Datenvolumen aus.
Mit HDInsight können Sie mithilfe von Hadoop schnell Big Data-Cluster erstellen und skalieren
Nach oben oder unten, je nach Ihren Bedürfnissen. Es lässt sich mit anderen Azure-Diensten wie z
Data Factory und Data Lake Storage, auf die Sie Hadoop-Analysen anwenden können
die Daten hast du schon da.

HDInsight
wird mit allen gängigen Hadoop-Tools geliefert, einschließlich Apache Spark,
Apache Kafka, HBase, Hive und Storm. Es bietet Unternehmensskala
Infrastruktur in Form von Überwachung, Sicherheit, Compliance und Hoch
Verfügbarkeit über Azure-Redundanzoptionen.

4. Azure Data Factory

Azure
Data Factory ist ein ETL-Dienst (Extract Transform Load). ETL ist ein Begriff aus der
alte Zeiten der groß angelegten Verarbeitung strukturierter Daten. Ein ETL-Prozess dauert a
strukturierte Datenbank, bereinigt sie und konvertiert die Daten in ein Format, das ist
zur Analyse geeignet. Data Factory unterstützt Sie beim Erstellen von ETL und beim Extrahieren von Lasten
Transformieren Sie (ELT) Strategien ohne Code oder Konfiguration mit einem visuellen Editor.

Data Factory bietet integrierte Connectors mit über 90 Datenquellen, darunter Amazon S3, Google BigQuery und viele lokale Datenquellen. Sie können die Daten auch von Data Factory in den Azure-Dateispeicher kopieren.

Image-Quelle: Microsoft Azure

5.
Azure Machine Learning

Dies ist eine riesige Bibliothek vorgefertigter, vorgefertigter Algorithmen für maschinelles Lernen. Es bietet auch eine Umgebung, in der diese Algorithmen verwendet und auf reale Aufgaben angewendet werden können. Azure ML beschleunigt die Modellerstellung mit einer praktischen Benutzeroberfläche für maschinelles Lernen, mit der Sie Pipelines für maschinelles Lernen erstellen können, in denen mehrere Algorithmen kombiniert werden
Darüber hinaus bietet Azure ML Lösungen für interpretierbare KI. Es enthält
Visualisierung und andere Daten, die zum Verständnis des Modellverhaltens beitragen können, gelten
Fairness – Metriken und Vergleiche zwischen Algorithmen, um das zu verstehen
beste Variante zur Auswahl.

6. Azure Stream Analytics

Azure
Mit Stream Analytics können Sie eine End-to-End-Pipeline für das Streaming von Ereignissen erstellen. Es
basiert auf serverloser Technologie. Mit Stream Analytics können Sie eine definieren
Analyse-Pipeline für das Streaming von Daten, wobei die Datenverarbeitung mit SQL definiert wird
Syntax und in wenigen Minuten zur Produktion. Es skaliert elastisch je nach
das Volumen und den Durchsatz Ihrer Streaming-Daten.

Weil
Das Streaming von Daten erfordert häufig eine sehr leistungsfähige Verarbeitung und Echtzeit
Antworten bietet Azure Stream Analytics eine garantierte Latenz von weniger als einer Sekunde
Ereignisverarbeitung "genau einmal". Es bietet auch eine Verfügbarkeit von 99,9%.

7. Data Lake Analytics

Azure
Mit Data Lake Analytics können Sie Datenumwandlungsprogramme unter Verwendung von entwickeln
Eine Vielzahl von Sprachen, einschließlich U-SQL (eine von Microsoft bereitgestellte Spezialsprache)
das kombiniert die Vorteile von SQL und C #), Python, .NET und R. Es kann verarbeiten
Petabyte an Daten.

Data
Lake Analytics unterscheidet sich von Azure Synapse Analytics darin, dass dies nicht der Fall ist
Ziehen Sie alle Ihre Daten in einen Datensee und verarbeiten Sie ihn dann. Stattdessen verbindet es
auf Azure-basierte Datenquellen, z. B. Azure Data Lake Storage, und führt
On-the-Fly-Analyse unter Verwendung des von Ihnen bereitgestellten Codes.

8. Azure Analysis Services

Azure Analysis Services können mit dem Azure Resource Manager eingerichtet werden, der Daten aus mehreren Quellen kombiniert und ein vertrauenswürdiges semantisches Modell erstellt. Damit können Sie leistungsstarke BI-Lösungen mit sicherem Zugriff und schneller Lieferfrist entwickeln. Die Skalierung erfolgt je nach Analyseaufwand und Sie zahlen nur für die Ressourcen, die Sie verbrauchen. Mit Analysis Services können Sie auch vorhandene Modelle oder tabellarische SQL Server 2016-Modelle importieren.

Fazit

Hoffentlich
In diesem Artikel haben Sie Informationen zu den Optionen für die Big-Data-Analyse unter Microsoft erhalten
Azurblau. Stellen Sie sicher, dass Sie Ihre Bedürfnisse und Anforderungen richtig einschätzen und experimentieren Sie anschließend
mit verschiedenen Dienstleistungen und Lösungen. Die Big-Data-Architektur ist bereits komplex
und das Einführen neuer Werkzeuge sollte mit Vorsicht erfolgen.

Der Beitrag Acht Big Data Analytics-Optionen unter Microsoft Azure erschien zuerst auf Business Intelligence Online.



Weiterlesen: https://ift.tt/2uRceUC

0 comments:

Post a Comment