Sinnzusammenhänge

Worum geht es in meinem Text?

Mit dem Cognitive Service zur Erkennung von Sinnzusammenhängen können Sie automatisch die Bedeutung eines Texts erkennen lassen. Diese Methode des maschinellen Lernens scannt Texte, identifiziert Schlüsselbegriffe und erkennt den Bedeutungszusammenhang.

Nehmen wir an Sie haben einen Text über ein Thema, was einen Begriff nutzt, der eine doppelte Bedeutung hat. Das Word Jaguar ist hier ein gutes Beispiel, da es sich hier zum einen um eine Wildkatze und zum anderen um eine Automarke handeln kann. Als Vorlage nutzen wir den Wikipedia Eintrag für die Katze und später für das Auto um zu zeigen, wie das System arbeitet. Die Maschine wurde mit zusätzlichen Daten aus der Online-Enzyklopädie gefüttert und erstellte ein Modell die Relevanz des Inhalts automatisch zu erkennen.

Jaguar - Die Wildkatze

Den hier verwendeten Text findet sich auf Wikipedia und wir fügen diesen in die Suchbox ein.

"Der Jaguar (Panthera onca) ist die einzige auf dem amerikanischen Doppelkontinent vorkommende Art der Großkatzen (Pantherinae), der kleinere Puma wird den Kleinkatzen zugeordnet. Eine ältere Bezeichnung für den Jaguar ist Unze, Onze oder Onza. Dieses Raubtier sieht dem Leoparden ähnlich, der in Afrika und Asien lebt, und war einst bis in die südlichen US-Bundesstaaten Kalifornien, New Mexico, Arizona und Texas verbreitet. Heute kommt der Jaguar fast nur noch in Mittel- und Südamerika vor. Die IUCN (International Union for Conservation of Nature and Natural Resources) führt die Großkatze in der Roten Liste derzeit als „gering gefährdet“ (Near Threatened).[...]"

Das Modell ist dahingehend trainiert Orte, Organisationen und relevante Begriffe zu erkennen und automatisch mit einem Wikipedia Eintrag zu verlinken.

Was auf den ersten Blick wie ein Klacks aussieht, entpuppt sich bei genauerer Betrachtung als ziemlich ausgefeilt. Das Modell hat unabhängig Begriffe im Text ausgewählt, da es den eigentlichen Inhalt verstanden hat. Es wählte Worte wie "Puma" oder "Großkatze" aus. Technisch könnte man jetzt behaupten, dass es lediglich bei Wikipedia geprüft haben könnte, ob es einen Eintrag gibt und die Treffer automatisch verlinkt. Aber das ist nicht der Fall. Hinter dieser Technik steht eine trainierte Maschine, die gelernt hat, eigenständig zu entscheiden.

 

Jaguar - Das Auto

Was würde das Modell tun, wenn man einen weiteren Artikel zu Jaguar einfügt? Diesmal die Automarke anstatt der Katzenart? Würde das Modell überhaupt einen Unterschied bemerken? Noch einmal nehmen wir einen Text aus der Wikipedia:

"Jaguar (engl. Aussprache: [ˈdʒægjuːə] in Großbritannien, [ˈdʒægˌwɑɹ] in den Vereinigten Staaten) ist eine britische Automobil-Marke des Herstellers Jaguar Land Rover. Es besteht ein Entwicklungszentrum in Whitley im Süden von Coventry sowie Werke in Castle Bromwich bei Birmingham und Halewood bei Liverpool (alle in Großbritannien). Ab Ende 1989 gehörte das Unternehmen zur Premier Automotive Group von Ford, die es im März 2008 zusammen mit Land Rover an Tata Motors verkaufte.[1] Am 28. Dezember 2012 wurde das Geschäft der Land Rover Private Unlimited Company[2] auf die Jaguar Cars Limited übertragen und im Zuge dessen auf Jaguar Land Rover Limited umfirmiert. Die Land Rover Private Unlimited Company besteht weiterhin, die Markennamen werden separat weitergeführt."

Normalerweise würde das Programm ein Problem damit haben den Unterschied zwischen einer Katze und einem Auto zu erkennen, wenn es lediglich das Wort "Jaguar" suchen müsste. Da der Text aber weitere Begriffe aus dem Automobil-Umfeld aufweist, vermutet die Maschine, dass es sich hierbei um Automobilbau und nicht Biologie handelt. Interessanterweise wurde dieses Modell trainiert nicht nur Orte und Organisationen zu finden, sondern auch Personen mit historischer Relevanz mit Wikipedia zu verlinken.

 

Warum ist das so wichtig?

Wofür kann ich diesen Service nutzen?

Auch wenn der Service wie eine nette Spielerei anmuten mag, wenn Sie mehr über Jaguars (Autos oder Katzen) wissen möchten, was ist der Mehrwert dieses Ansatzs? Nun, mit dem Sinnzusammenhang sind Sie in der Lage Deine Daten in einem einheitlichen Ansatz zu kategorisieren und zu verlinken und das Wissen Deiner Organisation zu sammeln. Sobald alle Datenquellen mit Deiner Enterprise Search vernetzt sind, kann die Maschine damit beginnen den Inhalt zu "verstehen". Ein Dokument könnte automatisch anhand seines Inhalts klassifiziert werden. Daten aus den Inhalten könnten in die META Daten übertragen und in anderen Applikationen verwendet werden. Die Anwendungsfälle sind breit gestreut und der Service sollte als Hilfe verstanden werden mit der täglichen Datenflut fertig zu werden.

Photo by Gwen Weustink on Unsplash