21.07.2020 | News Transfer Learning demokratisiert und vereinfacht KI-Einsatz
Durch Transfer Learning kann das Lernen einer Aufgabe durch generisches Vorwissen beschleunigt werden. Das heißt, es werden weniger Daten und Rechenressourcen benötigt, um eine gute Qualität der gewünschten Arbeitsergebnisse zu erzielen.
Mit Transfer Learning, einer Methode des maschinellen Lernens, können neuronale Netze, die bereits für einen bestimmten Zweck vortrainiert sind, als Ausgangspunkt für eine andere Aufgabe verwendet werden. Durch diesen Ansatz ist das bereits Gelernte eines trainierten Netzes für ein neues Projekt nutzbar. Damit entfallen rechenintensive und zeitaufwändige Tätigkeiten für das Trainieren eines neuen neuronalen Netzes. Vorteile bietet diese Methode etwa beim Einsatz von „Big Data“-Modellen für die Lösung von „Small Data“-Herausforderungen, gerade im Bereich der Verarbeitung von Textdaten mittels Natural Language Processing (NLP).
Transfer Learning kann einen wichtigen Beitrag bei der Demokratisierung von KI leisten, das heißt beim flächendeckenden Einsatz von KI in der Unternehmenswelt. KI funktioniert bisher immer dann besonders gut, wenn ein Unternehmen viele Daten besitzt und maßgeschneiderte Modelle nutzt. Die Google-Bilderkennung etwa kann Chihuahuas von anderen Hunden in Bildern unterscheiden, da Google die erforderliche Datenmenge besitzt und Modelle gezielt für diese Sorte Bildklassifikation zurechtschneiden kann. Auch Internet-Übersetzungsdienste wie DeepL funktionieren dank neuronaler Netze, Deep Learning und einer großen Menge von Daten gut.
„Trotz dieser unbestreitbaren Erfolge werden die meisten Bürojobs durch KI kaum vereinfacht“, erklärt Franz Kögl, Vorstand der IntraFind Software AG. „Die Gründe dafür sind, dass zum einen die Massendaten fehlen und zum anderen die Bürotätigkeiten sehr vielfältig sind. Es ist also praktisch unmöglich, für jede einzelne Tätigkeit große Datenmengen zu sammeln, ein Modell maßzuschneidern und es den Mitarbeitern als fertiges System an die Hand zu geben. Genau an diesem Punkt kommt Transfer Learning ins Spiel.“
Transfer Learning erzielte im Bereich der Bildverarbeitung große Erfolge und wird daher seit 2019 auch verstärkt für Sprachmodelle genutzt. Dabei werden mit der Technik des Transfer Learning auf Basis eines umfassenden Sprachverständnisses vortrainierte Sprachmodelle mit relativ wenigen Trainingsdaten für andere Aufgaben angepasst. Sprachmodelle wie BERT (Bidirectional Encoder Representations from Transformers), ULMFiT (Universal Language Model Fine-Tuning), GPT und die Weiterentwicklungen GPT-2 und -3 (Generative Pretrained Transformer) haben bereits bewiesen, dass die aus einem Datensatz gelernten Informationen relativ einfach auch für Aufgaben in anderen Datensätzen genutzt werden können. Zwei konkrete Anwendungsszenarien zeigen das Transfer-Learning-Potenzial.
Erfolge im Customer Service und im Dokumentenmanagement
Im Customer Service können durch Sprachmodelle sowie Sprach- und Textanalysen Kundenanrufe oder E-Mails basierend auf den Wünschen des Kunden automatisch weitergeleitet werden. Zum Beispiel ist es möglich, Supportanfragen über virtuelle Assistenten aufzunehmen, mit FAQ-Datenbanken abzugleichen und anschließend zügig zu beantworten.
Und im Dokumentenmanagement muss ein Unternehmen unter Nutzung der Transfer-Learning-Methode bei der Erkennung von Fachthemen nicht bei Null anfangen. Stattdessen wird ein allgemeines Sprachmodell verwendet und trainiert beziehungsweise auf ein spezielles Fachgebiet justiert. So werden für die Klassifizierung weniger Dokumente benötigt, da ein Vorwissen in Form allgemeiner Sprachkenntnisse bereits codiert ist.
„IntraFind verfolgt das Ziel, Unternehmen dabei zu unterstützen, einer Maschine beizubringen, was sie von ihr brauchen. Mit Transfer-Learning-Methoden und einer generischen Lernmaschine müssen zwar hinsichtlich maßgeschneiderter Modelle und vollständiger Automatisierung Abstriche gemacht werden, aber die Anwender werden doch entscheidend entlastet“, betont Franz Kögl. „Mit unseren Systemen und Lösungen werden etwa Formulare nicht automatisch ausgefüllt, aber die Nutzer erhalten alle für diese Tätigkeit wichtigen Informationen, zum Beispiel durch die Hervorhebung wichtiger Passagen eines Dokuments.“