Was ist Machine Learning?

Künstliche Intelligenz, neuronale Netzwerke und die Suche nach automatisiertem Wissen

Im Informationszeitalter sind Daten zu einem Schlüsselelement unseres modernen Lebens geworden. Sie umgeben uns, sie leiten uns und in einigen Fällen fordern sie uns auch heraus. Die Menge und Geschwindigkeit mit denen Daten uns täglich konfrontieren, hat in den vergangenen Jahren spürbar zugenommen und es wird immer schwieriger diese zu verwerten und all die Informationen zu kategorisieren, die uns über verschiedene Kanäle auf uns einstürmen. Um diese Herausforderungen zu meistern hat die Informationstechnologie eine Reihe von Methoden und Mechanismen entwickelt um wertvolle von wertlosen Informationen zu unterscheiden. Auf dieser Seite wollen wir einen kurzen Überblick geben, was sich hinter Begriffen wie künstlicher Intelligenz, maschinellem und tiefen Lernen eigentlich verbirgt und wie diese Methoden gewinnbringend genutzt werden können.

Was ist Intelligenz bei Computern?

Bevor wir in die Feinheiten künstlicher Intelligenz einsteigen, sollten wir zunächst die Frage nach Intelligenz generell kurz umreißen. Intelligenz ist eine Eigenschaft, die hauptsächlich Menschen und einigen höher entwickelten Lebewesen wie bspw. Primaten zugeordnet wird. Auch wenn es keine allgemein gültige Definition dazu gibt, versteht man unter Intelligenz die Fähigkeit zum Verständnis und zur Einsicht für spätere Handlungen und Entscheidungen. Anders als Tiere kann der Mensch bspw. Zusammenhänge einordnen, verinnerlichen, abstrahieren und für zukünftige Ereignisse anwenden. Während ein Hund auf ein bestimmtes Verhalten trainiert und konditioniert wird, erschließen sich Menschen Verhaltensweisen aus einem abstrakten Lernprozess.

Computern, als vom Menschen erdachte Maschinen mit ausgeklügelten Abläufen, die heute bereits einen Großteil der Menschheit im Detail unverständlich bleiben, fehlt die Fähigkeit abstrakt und intelligent zu "Denken". Stattdessen agieren sie nach vorher definierten Mustern (Algorithmen) um komplexe Aufgaben zu verrichten. Der Computer ist häufig nur so schlau, wie der Entwickler, der ihn konstruiert und programmiert hat. Dabei folgen die Maschinen universellen mathematischen Sachzwängen und es mangelt ihnen an abstrakter Kreativität. Dennoch sind die Konzepte und Methoden in den letzten Jahren weit fortgeschritten und die Entwicklungen in der Speicher- und Prozessortechnologie machen Rechenoperationen in Bruchteilen von Sekunden möglich, die bis vor kurzem noch Stunden oder Tage gedauert hätten.

Der Begriff "künstliche Intelligenz" ist eng mit den Arbeiten des britischen Mathematikers Alan Turing verknüpft und der nach ihm benannte Test ist ein populärwissenschaftlicher Ansatz die Schwelle zu künstlicher Intelligenz zu beschreiben. Ein menschlicher Fragesteller führt blind (also ohne direkten Kontakt) eine Konversation mit einem oder mehreren unbekannten Gesprächspartnern von denen einer eine Maschine ist. Wenn der Fragesteller durch seine Befragung nicht sicher sein kann, ob ihm eine Maschine antwortet, hat die Maschine den Test bestanden und man kann von einer künstlichen Intelligenz sprechen. Auf den ersten Blick mag das trivial klingen. Die Leistung der intelligenten Maschine liegt jedoch in der Unvorhersehbarkeit von Fragen und die entsprechende Reaktion darauf. Themengebiete, Nuancen in der Gesprächsführung oder Timing sind Parameter, die ein Mensch durch Lernen und Intelligenz spielend bewältigt. Eine Maschine benötigt dafür wesentlich mehr technischen Hintergrund zur Evaluierung aller Parameter.

Künstliche Intelligenz erlebt zur Zeit ein Hoch in Forschung und den Medien. Beinahe täglich werden neue Entwicklungen vermeldet, Konferenzen abgehalten, Unternehmen gegründet und Durchbrüche erzielt. Jeder Lebensbereich scheint davon betroffen zu sein. Dennoch ist künstliche Intelligenz derzeit eher ein Schlagwort als eine genaue Technolgie. 

Machine Learning und neuronale Netzwerke

Unter dem Mantel künstlicher Intelligenz haben sich verschiedene Technologien herausgebildet, die moderne Konzepte der Datenverarbeitung nutzen, um noch schneller und umfassender Informationen zu bearbeiten. Maschinelles Lernen ist dabei eine der erfolgversprechendsten Methoden. Allen gemeinsam ist derzeit die Nutzung größerer Datenmengen und das automatische Verarbeiten unter verschiedenen Gesichtspunkten.

Machine Learning verfolgt den Ansatz über bestimmte Abläufe und ein vorheriges Training, ein Computersystem in die Lage zu versetzen Daten eigenständig und ohne weitere Kontrolle zu verarbeiten. Dabei entwickelt die Maschine ein Modell mit Entscheidungsrichtlinien, die entweder bestätigt oder verfeinert werden. Was bei einfachen Ja und Nein Entscheidungen noch einfach sein mag, erfordert bei komplexen, auf mehreren Parametern beruhenden Fragestellungen, ein hohes Maß an Abwägung und Wahrscheinlichkeitsrechnung. 
Möglich wird Machine Learning zum einen durch verbesserte Computerhardware, die kostengünstig unzählige parallele Rechenoperationen ausführen kann und zum anderen durch moderne Programmierkonzepte und breitere Datenbasen. Allein die Menge an Texten und Bildern, die tagtäglich im Internet und speziell in sozialen Medien produziert werden, liefern eine Unsumme an verwertbaren Informationen.

Zur Verarbeitung von Information mit Machine Learning durchlaufen die Daten in mehreren Stufen einen Evaluierungsprozess - einem Netz - dessen Basis das vorher trainierte Modell ist. Will man z.B. eine Maschine darauf trainieren grüne T-Shirts in Bildern zu erkennen, enthalten die Trainingsdaten sowohl positive als auch negative Beispiele. Liefert die Maschine während dieser Phase ein fehlerhaftes Ergebnis, greift der Trainer ein und markiert den Datensatz entsprechend. Die Maschine vermerkt das innerhalb ihres Modells und zieht Schlüsse. Ab einem gewissen Zeitpunkt werden die richtigen Ergebnisse mehr und das Modell insgesamt robuster. Ab da kann die Maschine unbeobachtet arbeiten und auf die Korrektheit der Ergebnisse vertraut werden.

Cognitive Search

Ein Anwendungsfeld für maschinelles Lernen ist die Nutzung in Suchmaschinen. Anders als eine exakte Suche, die auf den Abgleich von Suchbegriffen basiert, unterstützt Machine Learning eher eine unscharfe Suche mit Konzepten. Das ist gerade in größeren Datenbeständen von Interesse, wo Begriffe mitunter nicht immer einheitlich verwendet werden. Sucht man bspw. nach einem "Elektrorad", wird die Suchmaschine all diejenigen Dokumente auslassen, in denen stattdessen von E-Bikes die Rede ist. Dieses Problem wurde bisher durch das Pflegen von Synonymlisten umgegangen (Elektrorad = E-Bike), die aber aufwendig und arbeitsintensiv sind.
Cognitive Search sieht Dokumente ganzheitlich und überträgt enthaltene Informationen in ein mathematisches Modell (einen mehr-dimensionalen Vektorraum). Jedes Dokument ist damit einzigartig und durch einfache mathematische Operationen vergleichbar. Dokumente, die innerhalb des Vektorraumes nah beieinander liegen, haben so eine gewisse Ähnlichkeit und werden in die Suchtreffer einbezogen. Nicht mehr einzelne Begriffe sind relevant, sondern der Kontext als solches. Damit erweitert die Cognitive Search die Suchfunktionalität von einer exakten zu einer konzeptionellen Suche.