KI, Wissensarbeit und strukturierte vs. unstrukturierte Daten


Künstliche Intelligenz (AI) verändert die Wissensarbeit jeden Tag, da jede neue Innovation sich weiterentwickelt schneller und schneller. Wir haben uns mit Ville Somppi, Vice President of Industry Solutions bei M-Files, um über diese Veränderungen zu sprechen, was sie für die Zukunft der Wissensarbeiter bedeuten und ob (oder wie) KI Unternehmen dabei helfen wird, die Kluft zwischen strukturierten und unstrukturierten Daten zu überbrücken.
Künstliche Intelligenz und die Zukunft der Arbeit
Einige Wirtschaftsführer sagen voraus, dass die KI die Arbeit ganz abschaffen wird. Welche Auswirkungen wird KI Ihrer Meinung nach auf die Zukunft der Arbeit haben?
Die KI wird den menschlichen Einfallsreichtum und die Kreativität fördern. Computer tun das, was man ihnen sagt. Wenn man die richtige Frage kennt, weiß eine KI auch die Antwort. Im Falle der generativen KI ist der Output wahrscheinlich schon zur Hälfte oder sogar zu 90 Prozent da, vorausgesetzt, man hat eine Vorstellung davon, was produziert werden soll. KI wird den Arbeitnehmern neue Möglichkeiten zur Automatisierung von Wissensarbeit eröffnen.
KI wird nicht zufällig wissen, was sie erstellen soll - es muss einen Menschen geben, einen intelligenten Akteur, der sie auffordert, etwas zu tun, und dann bestätigt, dass der produzierte Inhalt den Anforderungen entspricht. Der langsame Teil jeder kreativen Arbeit, bei dem man tatsächlich Assets auf der Grundlage der ursprünglichen Idee produzieren muss, wird sich beschleunigen, aber KI wird nicht die Notwendigkeit von Wissensarbeitern ersetzen, eine Vision zu verwirklichen und ihre Kreativität einzusetzen, um diese Vision zum Leben zu erwecken.
Der Weg zur Automatisierung der Wissensarbeit
Wenn von der Optimierung der Arbeitsleistung die Rede war, ging es im Allgemeinen um Dateiverwaltung und Prozessmanagement, die uns in die nächste Phase der Automatisierung führen. Ist diese Entwicklung das Ergebnis besserer Bandbreiten und Verarbeitungsgeschwindigkeiten, und war dies schon immer der Traum, oder handelt es sich um eine Veränderung?
Das war schon immer der Traum, aber es war ein sehr langsamer Prozess. Die Geschichte der IT umfasst nur 50 oder 60 Jahre. Die ersten Computer waren kaum in der Lage, Daten zu speichern. Schließlich kamen grafische Schnittstellen auf den Markt, und wir fanden Möglichkeiten, Informationen auf einem Bildschirm zu visualisieren - und nicht nur auf Papier. Dank der grafischen Benutzeroberfläche musste man kein Wissenschaftler sein, um zu verstehen, was ein Computer tut, aber wichtige Aufgaben wie die Verwaltung von Dokumenten und Arbeitsabläufen wurden immer noch vollständig manuell erledigt.
Die Vision war schon immer die Automatisierung der Wissensarbeit und die Innovation, um jede Arbeit zu erleichtern und die Produktivität zu steigern. Wenn man einen Computer bittet, etwas zu erstellen, braucht man nur gesprochene oder geschriebene Sprache. Vor Jahrzehnten konnten Computer wirklich coole, leistungsstarke Berechnungen oder Simulationen durchführen, um etwas so Komplexes wie eine Weltraummission zu einer anderen Galaxie zu entwerfen. In Zukunft werden Sie sagen können: "Hey, ChatGPT, kannst du für mich ein Raumschiff anhand dieses Beispiels entwerfen?" Anstatt Tausende von Stunden mit Maus und Tastatur zu verbringen, um den 3D-Entwurf zu zeichnen, ist es viel schneller, zu einem brauchbaren Entwurf zu kommen, den man dann verfeinern kann. Man muss nicht alles wörtlich erklären - das ist die Revolution.
Strukturierte vs. unstrukturierte Daten
Viele unserer heutigen Systeme - von der Dateiverwaltung bis zu den Geschäftsprozessen - sind alle um strukturierte Daten wie Word- oder PowerPoint-Dateien. Aber Tweets sind vor Gericht rechtlich auffindbar und gelten als unstrukturiert. Gibt es bei der Wissensarbeit wirklich einen Unterschied zwischen strukturierten und unstrukturierten Daten, oder sind die Grenzen einfach nur verwischt worden?
Traditionell brauchen Computer eine Struktur, um Daten zu verstehen. Nehmen wir an, der Name Ihres Unternehmens besteht nur aus Text. Ein strukturiertes System wie ein Tool für das Kundenbeziehungsmanagement (CRM) kann eine ID-Nummer auslesen, die dem Namen Ihres Unternehmens entspricht, und dann interessiert es sich nur für die ID und weiß immer, welche ID-Nummer Ihr Unternehmen repräsentiert. Bei unstrukturierten Daten, die von Menschen geschrieben wurden und keine explizit definierte Bedeutung haben, wird ein Computer sie nicht verstehen - es ist einfach nur ein Text.
Bei großen Sprachmodellen ist die Struktur weniger wichtig, da Computer unstrukturierte Daten effizienter verarbeiten können, um die Bedeutung und alle interessanten Datenpunkte zu extrahieren. Angenommen, ein Vertrag ist 2024 gültig. Wenn wir diesen Zeitraum als strukturierte Daten extrahieren, weiß der Computer, wann der Vertrag gilt. Mit generativer KI und ihrer Inferenzmaschine können Sie fragen, was ein bestimmtes Element in einem unstrukturierten Asset bedeutet, und die KI versteht es, weil sie unstrukturierte Inhalte lesen und interpretieren kann.
Es gibt einen Unterschied zwischen strukturierten und unstrukturierten Daten. Die einen sind dazu bestimmt, von Computern gelesen und verstanden zu werden, während die anderen frei fließend sind - Computer hatten es bisher schwer, sie zu verstehen. Heute ist es nicht mehr so wichtig, alles als strukturierte Daten zu haben, aber strukturierte Daten sind immer noch die Art und Weise, wie Computer miteinander kommunizieren. Man kann den Satz "Viertel nach zwölf" nicht wirklich berechnen, weil ein Computer standardmäßig nur Text sieht. Ein umfangreiches Sprachmodell kann diesen menschlichen Ausdruck in für den Computer verständliche strukturierte Daten umwandeln, so dass normale Berechnungen möglich sind.
Die Bedeutung der Informationsabsicht
Warum sind strukturierte Daten für Computer leichter zu verarbeiten, und wie verarbeitet M-Files unstrukturierte Daten?
Bei strukturierten Daten haben Sie nicht nur den Wert der Daten, sondern auch die Bedeutung, den Typ und die Informationsabsicht. Ein Typ ist zum Beispiel der Name eines Unternehmens. Jedes System, das diesen Datenpunkt verwendet, weiß, dass sich die Bezeichnung auf den Namen des Unternehmens und die Art der Daten bezieht. Strukturierte Daten können einem System helfen, zwischen einem Textfeld und einem Zahlenfeld zu unterscheiden. Und was bedeutet die Zahl in einem Zahlenfeld? Handelt es sich um einen Geldbetrag oder um eine Postleitzahl? Mit strukturierten Daten wissen die Computersysteme, was Sie mit einer bestimmten Information meinen.
Wenn Sie einen Vertrag hochladen auf M-Fileshochlädt, ist es nur ein Dokument. Es ist unstrukturiert und wurde von Menschen erstellt, aber wir können interessante Datenpunkte wie strukturierte Metadaten extrahieren. Da M-Files Dokumente mit Metadaten wie z. B. der Vertragsgültigkeit versehen kann, können wir Teile dieser unstrukturierten Daten in strukturierte Daten umwandeln, so dass Computer sie verarbeiten können, um Geschäftsregeln anzuwenden und alle Arten der Automatisierung von Wissensarbeit zu ermöglichen.
Generative KI kostet Kapital
Beeinflusst das Datenformat die Kosten für den Einsatz generativer KI? Ist die Verarbeitung unstrukturierter Daten teurer, und haben neue Sprachmodelle dies geändert?
Der Einsatz von generativer KI könnte teuer werden, weil der Computer eine Menge Verarbeitungsarbeit leisten muss, um den Inhalt zu verstehen, um das vorhandene organisatorische Chaos zu durchforsten oder um eine bestimmte gültige Vertragslaufzeit zu finden, im Gegensatz zu jemandem, der diese Informationen einfach aus den Metadaten liest. Wenn Sie das eine Million Mal machen, zahlen Sie wahrscheinlich 50.000 Dollar an das Unternehmen, das den generativen KI-Service anbietet, weil die KI so viel harte Arbeit leistet.
Aber man kann es für immer aus einem strukturierten Datenfeld heraus tun, und das zu geringen Kosten, weil es trivial ist. Große Sprachmodelle sind einfach gigantische mathematische Formeln, die von tiefen neuronalen Netzen angetrieben werden. Man gibt einen Eingabewert ein, und der Ausgabewert kommt heraus. Aber die Kosten für die Durchführung dieser mathematischen Operation sind sehr hoch im Vergleich zu den normalen Dingen, die wir vor 50 Jahren tun konnten.
Das Gedankenkostenelement ist sehr wichtig. Wir können nicht einfach die gesamte alte IT ersetzen und künstliche Intelligenz und generative KI für alles einsetzen, denn das ist etwa eine Milliarde Mal teurer.
Ich habe hier ein Smartphone mit mehr Rechenleistung und mehr Kontrolle über die Informationstechnologie als alle Supercomputer in den 1990er Jahren hatten. Große Sprachmodelle und generative KI, die Sprache verstehen, sind möglich, weil wir im Vergleich zu früher so viel mehr Rechenleistung haben - das macht es nicht billig, nur möglich. Jedes Unternehmen, das diese Technologien einsetzt, muss eine Kosten-Nutzen-Analyse durchführen. Wann sollten wir diese coolen, neuen, teuren Technologien einsetzen, im Gegensatz zu billigeren, eher mechanischen und traditionellen IT-Technologien?