Bild
Blick in die Glaskugel

23.04.2018 | Blog Mit Machine Learning Zeit und Geld sparen

Verträge oder Rechtsdokumente liegen meist in großen Mengen und in unstrukturierter Form vor. Machine Learning-Verfahren helfen dabei, diese zu klassifizieren und erzielen dabei einen klar messbaren ROI für das Unternehmen.

ROI-Betrachtungen sind meistens schwierig, weil im Nachhinein nur schwer mit handfesten Zahlen zu belegen ist, wann sich der Einsatz einer neuen Software wirklich amortisiert hat. Es gibt jedoch Projekte, bei denen das Gegenteil der Fall ist und die ich daher besonders gerne bei einem Kunden umsetze: Textklassifikations-Business Cases.

Textklassifikation als Supervised Machine Learning Verfahren bietet konkret messbares Zeiteinsparungspotential. Der Projektleiter des Kunden rechnet sich schnell und belastbar seine Zeiteinsparung aus und kann den Kostenvorteil im Buying Center klar kommunizieren. Das ist ein echter Business Case, nicht mal nur ein Use Case.

Machine Learning und Textklassifikation reduzieren Bearbeitungszeiten

Software für Textklassifikation ist in der Lage, Dokumente automatisch dem richtigen Thema oder einer bestimmten Kategorie zuzuordnen. Dafür wird ein Metadatum, zum Beispiel ein bestimmtes Thema, zu einem beliebigen Textfragment erzeugt und das Dokument wird anschließend auf Grundlage seines Inhaltes diesem Thema zugewiesen. Das Machine Learning Verfahren übernimmt hierbei die Einsortierungsaufgaben. Egal ob es um eine Immobilientransaktion geht, bei der tausende von Dokumenten in einen virtuellen Datenraum geladen und in eine vom Käufer vorgegebene Struktur einsortiert werden müssen oder ob bei Due Diligence-Verfahren hunderte von Verträge zu sortieren sind – in all diesen Situation helfen Machine Learning-Verfahren dabei, eine händisch nur zu schwer zu bewältigende Datenmenge zu klassifizieren und zu verschlagworten oder in eine Taxonomie einzuordnen.

Nur wenige Trainingsdaten erforderlich

Das Machine Learning Verfahren der IntraFind, das hier zum Einsatz kommt, ist mit wenigen Trainingsdaten zufrieden und liefert aus dem Stand eine sehr gute Zuordnungsqualität. Den Nachteil vieler Lernverfahren, dass große Mengen an Trainingsdokumenten benötigt werden, haben wir eliminiert. Beim Training des Lernverfahrens liefert die Software auch Feedback, was an den Trainingsdaten verändert werden sollte, damit das System selbst besser lernt. Damit können auch Nutzer, die keine Informationswissenschaftler sind, ein technisches Lernverfahren bedienen.

Das System sorgt aber auch dafür, dass sich seine Zuordnungsgüte in der produktiven Nutzung weiter verbessert: Einzelne Dokumente, bei denen sich das KI-Verfahren unsicher ist, können händisch eingruppiert werden. Damit wird dann eine Lernschleife angestoßen und das Verfahren wird durch dieses Relevance-Feedback weiter trainiert und verbessert.

ROI von nur wenigen Monaten

Der Nutzen von Machine Learning ist bei der automatischen Textklassifikation besonders schnell nachweisbar. Ein Test auf Ihren Daten kann ohne großen Aufwand umgesetzt werden und es ist belastbar zu sehen, was die automatische Sortierung von Daten für ein konkretes Einsparungspotential mit sich bringt. Das Rentabilitätsgrenze liegt bei einer relativ kleinen Dokumentenmenge. In unseren Kundenprojekten können wir ROI-Zeiten von wenigen Monaten nachweisen. Das Machine Learning-Verfahren spart nicht nur Zeit- und Personalkosten, sondern liefert aufgrund der objektiven Sortierungsarbeit auch bessere Ergebnisse als die menschlichen und damit subjektiven und tagesformabhängigen Einsortierungsentscheidungen

Der Autor

Franz Kögl
Vorstand
Franz Kögl gründete im Jahr 2000 zusammen mit Bernhard Messer die IntraFind Software AG. Gemeinsam entwickelten sie das Unternehmen zu einem etablierten Softwarehersteller für Enterprise Search. Er hält regelmäßig Vorträge und verfasst Fachartikel zu Themen wie Künstlicher Intelligenz, Machine Learning oder Cognitive Search.
Bild
Franz Kögl