Da die Datenqualität für viele Unternehmen ein Problem darstellt, hilft ihnen Data Wrangling-Software beim Zugriff auf die richtigen Informationen.
Unternehmen sammeln Unmengen von Daten und speichern sie in Data Warehouses und währenddessen Einige dieser Daten sind strukturiert viele sind es nicht. Und wenn diese Organisation dann ihre Fülle an Informationen nutzen und all diese Daten in umsetzbare Erkenntnisse umwandeln möchte, hilft Data Wrangling-Software dabei.
Trifacta wurde 2012 gegründet und hat seinen Sitz in San Francisco von Daten-Wrangling-Software.
In den acht Jahren seit der Gründung des Unternehmens hat sich die Speicherung von Daten von den lokalen in die Cloud verschoben, und damit auch die Umwandlung von Analysevorgängen in die Cloud .
Als Reaktion darauf befragte Trifacta kürzlich 646 Datenexperten zu den Herausforderungen der Cloud-Migration und veröffentlichte am 23. Januar einen Bericht: "Hindernisse für die Einführung von KI und Analytik in der Cloud". [19659002] Die wichtigsten Entdeckungen waren, dass 66% der Befragten angaben, dass alle oder die meisten ihrer Analysen und Initiativen für mehr Intelligenz und maschinelles Lernen in der Cloud ausgeführt wurden, und 60% der Befragten auf Führungsebene d Ihr Unternehmen verwendet Datenanalysen, um Entscheidungen zu treffen. 75% gaben jedoch kritisch an, dass sie der Qualität ihrer Daten nicht vertrauen, und 46% gaben an, dass Datenungenauigkeit AI-Projekte stoppte.
Joe Hellerstein, Professor für Informatik an der University of California in Berkeley, ist es einer der Gründer von Trifacta und dessen CEO. Kürzlich beantwortete er Fragen zu Themen im Zusammenhang mit Analysen in der Cloud.
In Teil I einer zweiteiligen Frage- und Antwortrunde erörtert er Data Wrangling-Software und die Migration von Datenspeicherungs- und Analysevorgängen in die Cloud – ein Trend, den er beobachtet hat den letzten Jahren. In Teil II geht Hellerstein detaillierter auf den Bericht von Trifacta ein und erklärt, wie Data Wrangling-Software dazu beitragen kann, die Bedenken hinsichtlich der Migration von Clouds zu zerstreuen.
Was genau ist Data Wrangling?
Joe Hellerstein: Aus unserer Sicht ist Data Wrangling all die Arbeit, die Sie mit Ihren Daten vor der Analyse machen. Dazu gehört die Beurteilung der Datenqualität und des Datenkontexts, also die Ermittlung des Inhalts Ihrer Daten, die Betrachtung der Datenqualität und die anschließende Umwandlung der Daten in das gewünschte Format. Dann ist es auch die Operationalisierung der Ergebnisse dieses Prozesses – in der Lage zu sein, die von Ihnen geleistete Arbeit zu übernehmen, um Daten zu bewerten, zu verstehen und zu transformieren, und dies zu einem täglichen, stündlichen, minutengenauen Prozess zu machen, der dies kann Als Datenströme ausführen. Wir bezeichnen diesen gesamten Lebenszyklus als Daten-Wrangling.
Joe Hellerstein Mitbegründer und CEO von Trifacta
Ist die Trifacta-Datenverwaltungssoftware cloudbasiert oder funktioniert sie auch mit lokalen Kunden?
Hellerstein: Trifacta ist derzeit weitgehend cloudbasiert, es gibt jedoch auch eine Reihe von lokalen Kunden.
War das eine Evolution? Als Trifacta seine Data Wrangling-Software vorstellte, gab es mehr lokale Kunden und Sie haben seitdem eine Migration in die Cloud gesehen?
Hellerstein: Auf jeden Fall haben wir eine Migration gesehen. Als wir das Unternehmen 2012 gründeten, war unser ausdrücklicher Plan, zu prüfen, ob wir zuerst eine Lösung für große Datenmengen oder eine Cloud-Lösung entwickeln sollten. Im Jahr 2012 war die Antwort, die wir von Unternehmen erhielten, allgemein, dass dies nicht der Fall sein würde in der Cloud für diese Art von Daten und dass wir uns auf die Big-Data-Bewegung ausrichten sollten, in der sich die Aktivität zu dieser Zeit befand. Ich würde sagen, dass dies bis vor ungefähr zwei Jahren der Fall war. Vor zwei bis drei Jahren haben wir mit Hilfe von Google begonnen, in Cloud-Lösungen zu investieren. Im letzten Jahr wird beispielsweise mehr als die Hälfte unseres Netto-Neugeschäfts als Cloud-Geschäft abgewickelt, und wir gehen davon aus, dass dieser Prozentsatz im kommenden Jahr zunehmen wird.
Was die Cloud betrifft, kann eine Organisation keinen On verwenden -premises Plattform statt Migration in die Cloud – was hält diese Transformation zurück?
Hellerstein: Ein Teil davon ist regulatorisch, insbesondere bei einigen der größten Unternehmen. Einige der Finanz-, Arzneimittel- und Gesundheitsunternehmen haben regulatorische Anforderungen, die den Wechsel in die Cloud erschweren. Es ist nicht so, dass sie es nicht tun, aber sie tun es langsamer. Es ist offensichtlich, dass eine bereits installierte Basis, die das Geschäft erfolgreich betreibt, Teil des Überwindens des Abgrundproblems ist und dass eine Investition getätigt werden muss, um den Übergang zu vollziehen, und dass Übergangsinvestitionen störend sein können.
Und die Kosten dieses Übergangs können sein Heutzutage recht hoch: Die Migration bestimmter Prozesse in eine Cloud-Infrastruktur ist teurer als andere Prozesse. Aus diesem Grund werden einige Dinge zuerst in die Cloud verschoben, z. B. neue webbasierte und appbasierte Anwendungen, da keine Übergangskosten anfallen. Ein Teil davon sind die Altschuldenkosten. Ich kenne auch Beispiele von Kunden, die glauben, dass sie es billiger machen können als die Cloud-Anbieter zu bezahlen – das ist eine Minderheitsmeinung, aber es gibt sie, und es gibt sicherlich Unternehmen, die heute nach dieser Meinung handeln.
Warum? ein Unternehmen, das eine Migration in die Cloud wünscht, wenn es eine erfolgreiche Analyse vor Ort durchführt?
Hellerstein: Ich verwende gerne eine Analogie zu dem Zeitpunkt, als ich hier an der Universität anfing. Es gab eine Zeit in der Abteilung hier, in der wir unsere eigene Modem-Bank betrieben, damit die Leute von zu Hause anrufen und an den Computern arbeiten konnten, und irgendwann wurde uns klar, dass AOL dies besser und billiger und schneller machen würde. Das nächste, was passierte, war, dass einige meiner Kollegen meinten, es wäre wirklich cool, hier in der Abteilung ein Rechenzentrum zu errichten, das den Rechenzentren ähnelt, die wir an anderer Stelle gesehen haben – es würde in einem Container stehen Ein LKW, in den die Kühlung verkabelt wäre, und wir könnten das alles vor Ort berechnen lassen. Und im Laufe der Zeit haben wir festgestellt, dass es nicht besser, billiger oder schneller als die Cloud ist.
Was Sie aus der Cloud erhalten, sind die Vorteile konzentrierter Professionalität und Skalierbarkeit. Es ist nur so, dass Amazon schon seit langer Zeit in großem Umfang daran arbeitet – genau wie Microsoft und Google – und es gibt nur sehr wenige Unternehmen auf der Welt, die ein effizienteres Rechenzentrum betreiben können als diese Leute . Tatsächlich gibt es keine. Die Frage ist also nur, ob der IT-Betrieb Ihres Unternehmens billiger ist als der, den Ihnen die Cloud-Anbieter verkaufen, da Sie unter dem Strich mit ziemlicher Sicherheit nicht effizienter sind. Die Frage ist wirklich das Markup.
Anmerkung des Herausgebers : Diese Fragen und Antworten wurden aus Gründen der Klarheit und Prägnanz bearbeitet.
Der Beitrag Daten-Wrangling-Software hilft beim Zugriff auf relevante Informationen und deren Interpretation erschien zuerst auf Business Intelligence Online.
Weiterlesen: https://ift.tt/31lCAuo
0 comments:
Post a Comment