23.04.2018 | Blog Mit Machine Learning Zeit und Geld sparen
ROI-Betrachtungen sind meistens schwierig, weil im Nachhinein nur schwer mit handfesten Zahlen zu belegen ist, wann sich der Einsatz einer neuen Software wirklich amortisiert hat. Es gibt jedoch Projekte, bei denen das Gegenteil der Fall ist und die ich daher besonders gerne bei einem Kunden umsetze: Textklassifikations-Business Cases.
Textklassifikation als Supervised Machine Learning Verfahren bietet konkret messbares Zeiteinsparungspotential. Der Projektleiter des Kunden rechnet sich schnell und belastbar seine Zeiteinsparung aus und kann den Kostenvorteil im Buying Center klar kommunizieren. Das ist ein echter Business Case, nicht mal nur ein Use Case.
Machine Learning und Textklassifikation reduzieren Bearbeitungszeiten
Software für Textklassifikation ist in der Lage, Dokumente automatisch dem richtigen Thema oder einer bestimmten Kategorie zuzuordnen. Dafür wird ein Metadatum, zum Beispiel ein bestimmtes Thema, zu einem beliebigen Textfragment erzeugt und das Dokument wird anschließend auf Grundlage seines Inhaltes diesem Thema zugewiesen. Das Machine Learning Verfahren übernimmt hierbei die Einsortierungsaufgaben. Egal ob es um eine Immobilientransaktion geht, bei der tausende von Dokumenten in einen virtuellen Datenraum geladen und in eine vom Käufer vorgegebene Struktur einsortiert werden müssen oder ob bei Due Diligence-Verfahren hunderte von Verträge zu sortieren sind – in all diesen Situation helfen Machine Learning-Verfahren dabei, eine händisch nur zu schwer zu bewältigende Datenmenge zu klassifizieren und zu verschlagworten oder in eine Taxonomie einzuordnen.
Nur wenige Trainingsdaten erforderlich
Das Machine Learning Verfahren der IntraFind, das hier zum Einsatz kommt, ist mit wenigen Trainingsdaten zufrieden und liefert aus dem Stand eine sehr gute Zuordnungsqualität. Den Nachteil vieler Lernverfahren, dass große Mengen an Trainingsdokumenten benötigt werden, haben wir eliminiert. Beim Training des Lernverfahrens liefert die Software auch Feedback, was an den Trainingsdaten verändert werden sollte, damit das System selbst besser lernt. Damit können auch Nutzer, die keine Informationswissenschaftler sind, ein technisches Lernverfahren bedienen.
Das System sorgt aber auch dafür, dass sich seine Zuordnungsgüte in der produktiven Nutzung weiter verbessert: Einzelne Dokumente, bei denen sich das KI-Verfahren unsicher ist, können händisch eingruppiert werden. Damit wird dann eine Lernschleife angestoßen und das Verfahren wird durch dieses Relevance-Feedback weiter trainiert und verbessert.
ROI von nur wenigen Monaten
Der Nutzen von Machine Learning ist bei der automatischen Textklassifikation besonders schnell nachweisbar. Ein Test auf Ihren Daten kann ohne großen Aufwand umgesetzt werden und es ist belastbar zu sehen, was die automatische Sortierung von Daten für ein konkretes Einsparungspotential mit sich bringt. Das Rentabilitätsgrenze liegt bei einer relativ kleinen Dokumentenmenge. In unseren Kundenprojekten können wir ROI-Zeiten von wenigen Monaten nachweisen. Das Machine Learning-Verfahren spart nicht nur Zeit- und Personalkosten, sondern liefert aufgrund der objektiven Sortierungsarbeit auch bessere Ergebnisse als die menschlichen und damit subjektiven und tagesformabhängigen Einsortierungsentscheidungen