In der Welt des IoT ist die Erzeugung großer Datenmengen durch Sensoren weit verbreitet und stellt eine der Herausforderungen dar, denen sich das IoT heute gegenübersieht – sowohl aus Sicht der Übertragung als auch aus Sicht der Datenverwaltung. Ein Beispiel hierfür sind die Sensoren, die in Flugzeugen der kommerziellen Luftfahrtindustrie eingesetzt werden.
Beispiele aus der Praxis für IoT-Datenanalysen
Vergleich strukturierter und unstrukturierter Daten
Dynamische Daten und statische Daten
Überblick über die IoT-Datenanalyse
Beispiele aus der Praxis für IoT-Datenanalysen
Moderne Triebwerke in Flugzeugen sind mit Tausenden von Sensoren ausgestattet, um einen stabilen Betrieb des Flugzeugtriebwerks zu gewährleisten und bis zu 10 GB Daten pro Sekunde zu erzeugen. Wie in Abbildung 1.1 dargestellt, sind moderne Verkehrsflugzeuge allein in ihren Triebwerken mit etwa 5.000 Sensoren ausgestattet. Wenn also ein zweimotoriges Verkehrsflugzeug eine durchschnittliche Betriebszeit von 8 Stunden hat, übersteigen die pro Tag generierten Daten 500 TB, und das allein vom Triebwerk! Heutige Flugzeuge verfügen über Zehntausende anderer Sensoren, die mit verschiedenen Teilen der Flugzeugsysteme verbunden sind. Tatsächlich verfügen moderne große Düsenflugzeuge allein an ihren Flügeln über 10.000 Sensoren.
Abbildung 1.1 Strahltriebwerk eines Verkehrsflugzeugs
Die Schwierigkeit, Petabytes (PB) an Daten pro Tag für jedes Flugzeug zu erhalten, ist nicht erheblich – dies gilt nur für ein Flugzeug. Derzeit gibt es weltweit über 100.000 kommerzielle Flüge. Die von diesen kommerziellen Luftfahrtunternehmen generierten IoT-Daten sind erstaunlich.
Dieses Beispiel ist nur eines von vielen Beispielen für die zunehmend gravierenden Big-Data-Probleme im IoT. Es ist wichtig, diese Daten so effektiv wie möglich zu analysieren. Die Datenanalyse muss in der Lage sein, rechtzeitig nützliche und umsetzbare Erkenntnisse und Erkenntnisse aus den Daten zu gewinnen, unabhängig davon, wie die Daten präsentiert werden, sonst kann sie die Vorteile des IoT nicht vollständig widerspiegeln.
Vor der Datenanalyse ist es notwendig, Schlüsselkonzepte im Zusammenhang mit Daten zu definieren. Erstens sind nicht alle Daten gleich; Sie können aus verschiedenen Perspektiven und Methoden klassifiziert und analysiert werden. Abhängig von der Klassifizierung der Daten können verschiedene Datenanalysetools und Verarbeitungsmethoden angewendet werden. Aus Sicht des IoT sind diese beiden Übersichten wichtige Grundlagen für strukturierte und unstrukturierte Daten sowie für die Bewertung, ob Daten dynamisch oder verboten sind.
Vergleich strukturierter und unstrukturierter Daten
Die Datenstruktur ist eine wichtige Klassifizierung von Daten, da aus Sicht der Datenanalyse normalerweise unterschiedliche Datenanalyse-Toolsets verwendet werden müssen. Abbildung 1.2 bietet einen Vergleich der Unterschiede zwischen strukturierten und unstrukturierten Daten.
Abbildung 1.2 Vergleich strukturierter und unstrukturierter Daten
Strukturierte Daten folgen einem Modell/Muster, das den Ausdruck und die Organisation der Datenstruktur definiert, was bedeutet, dass sie sich sehr gut für traditionelle relationale Datenmanagementsysteme (RDBMS) eignen.
Strukturierte Daten sind in den meisten Computersystemen zu finden, von Rechnungsstatistiken nach Banktransaktionen bis hin zu Protokolldateien und Routerkonfigurationen auf Computern. IoT-Sensordaten verwenden typischerweise strukturierte Werte wie Temperatur, Luftfeuchtigkeit und Luftdruck, die in bekannten Formaten gesendet werden. Strukturierte Daten lassen sich einfach formatieren, speichern, abfragen und verarbeiten; Aufgrund dieser Merkmale war es schon immer der wichtigste Datentyp für die Entscheidungsfindung in der Branche.
Bei unstrukturierten Daten mangelt es an Interpretation und Dekodierung durch herkömmliche Programmierung. Dieser Datentyp umfasst Text, Sprache, Grafiken und Video. Im Allgemeinen werden alle Daten, die nicht vollständig dem vordefinierten Datenmodell entsprechen, als unstrukturierte Daten klassifiziert.
Laut Statistik sind derzeit etwa 80 % der Geschäftsdaten unstrukturierte Daten. Aus diesem Grund sind Analysemethoden für unstrukturierte Daten relativ komplex, wie beispielsweise Cognitive Computing, maschinelles Lernen, Natural Language Processing (NLP) und künstliche Intelligenz. Diese Technologien können wichtige Informationen aus einer Vielzahl unstrukturierter Daten extrahieren.
Derzeit sind strukturierte Daten einfacher zu verwalten und zu verarbeiten als unstrukturierte Daten. Es ist wichtig, mit diesen beiden Datenklassifizierungsstrukturen vertraut zu sein, damit Sie beurteilen können, welche Datenklassifizierung einfacher zu verwenden ist, und geeignete Datenanalyselösungen anbieten können.
Dynamische Daten und statische Daten
Wie bei den meisten Netzwerkanwendungen sind Daten im IoT entweder „unterwegs“ (dynamische Daten) oder wurden bereits gespeichert bzw. gespeichert (statische Daten). Dynamische Daten umfassen den traditionellen Austausch zwischen Clients und Servern, wie zum Beispiel Benutzerdaten, die über WEB-Browser über das Netzwerk übertragen werden, E-Mail-Übertragungen usw. Auf physischer Hardware wie Festplatten, USB-Speichergeräten usw. gespeicherte Daten gehören zu den statischen Daten.
Aus Sicht des IoT gelten Daten von intelligenten Geräten normalerweise als Bewegungsdaten, da sie letztendlich über das Netzwerk an den endgültigen Bestimmungsort übermittelt werden. Die gesammelten Daten werden nach der Edge-Erfassung durch Fog Computing verarbeitet, dann hochgeladen und gelangen schließlich in das Datenspeicherzentrum.
Nachdem die Daten das Rechenzentrum erreicht haben, verarbeitet das Rechenzentrum die gesammelten Daten erneut und die verarbeiteten Daten sind noch in Bewegung. Derzeit befinden sich die Analyse- und Verarbeitungstools für dynamische Daten noch im Anfangsstadium.
Statische Daten im IoT-Netzwerk sind normalerweise im gesamten IoT-Daten- oder Proxy-Netzwerk zu finden. Aus Sicht der Datenanalyse gibt es viele Tools, die verwendet werden können, insbesondere für strukturierte Datenverarbeitungstools, die nicht nur Datenverarbeitung, sondern auch Datenspeicherdienste bereitstellen.
Überblick über die IoT-Datenanalyse
Daten von intelligenten IoT-Geräten erfordern in der Regel verarbeitete und gefilterte Daten, um ihren kommerziellen und analytischen Wert zu entfalten. Die Datenanalyse wird normalerweise entsprechend ihren Ergebnissen klassifiziert und zerlegt, wie in Abbildung 1.3 dargestellt, wobei es vier Arten der Datenanalyse gibt.
Abbildung 1.3 Vier Arten der Datenanalyse
Deskriptive Analyse: Diese Art der Datenanalyse beschreibt das Geschehen mithilfe einer deskriptiven Methode. Beispielsweise meldet ein Reifendruckmesser jede Sekunde einen Druckwert. Durch diese Daten kann der Gerätebetreiber jederzeit den Status des Geräts überwachen, um den sicheren und stabilen Betrieb des Geräts zu gewährleisten.
Diagnoseanalyse: Diese Art der Analyse versteht, warum das Gerät Daten erzeugt, indem es die Funktionsweise des Geräts analysiert und so Geräteprobleme diagnostiziert.
Prädiktive Analyse: Bei der prädiktiven Analyse geht es darum, das Auftreten von Problemen vorherzusagen, bevor sie auftreten, um einen stabilen Gerätebetrieb zu erreichen. Wenn beispielsweise die Temperatur des Wassertanks in einem fahrenden Auto allmählich ansteigt, deutet dies darauf hin, dass das Auto möglicherweise das Öl ersetzen muss oder der Wassertank gewartet werden muss.
Präskriptive Analyse: Die präskriptive Analyse geht über die prädiktive Analyse hinaus und bietet Lösungen für anstehende Probleme. Beispielsweise bieten Datenanalyseverarbeitungsmethoden für Wassertankkletterprobleme verschiedene alternative Lösungen.
Prädiktive Analyse und präskriptive Analyse sind ressourcenintensive Datenanalysemethoden, deren Wert weit über die Daten selbst hinausgeht. Wie in Abbildung 1.4 dargestellt, ist die deskriptive Analyse die einfachste und die präskriptive Analyse die schwierigste unter den vier Arten der Datenanalyse, wobei die Schwierigkeit mit zunehmendem Gradienten zunimmt. Die präskriptive Analyse bietet den größten Wert, ist aber auch die komplexeste. Derzeit basieren die meisten IoT-Datenanalysen auf deskriptiver Analyse und diagnostischer Analyse, aber die Nachfrage nach prädiktiver Analyse und präskriptiver Analyse ist für aktuelle Unternehmen dringend.