06.05.2020 | Blog Enterprise Search kann mehr als Suchen und Finden
Enterprise Search Software wie der IntraFind iFinder ermöglicht es, strukturierte und unstrukturierte Daten aus unterschiedlichen Quellen zu integrieren und damit findbar zu machen. Doch diese Informationen müssen in Relation gesetzt werden, um das Potential dieser smarten und einfach umsetzbaren Datenintegration zu heben. Über Konnektoren werden alle Daten in den iFinder Elasticsearch-Index, letztlich einer beliebig skalierbaren NoSQL-Datenbank, zusammengefasst, mit intelligenten KI-Verfahren auf vielfältige Art und Weise angereichert oder thematisch klassifiziert. So ist es möglich, Inhalte lückenlos nach von Unternehmen oder Behörden gewünschten oder rechtlich vorgegeben Kriterien, wie zum Beispiel DSGVO-Vorschriften, zu analysieren. Es können strukturierte mit unstrukturierten Daten zusammengeführt werden – und ein suchbasierter Zugriff mit smarten Filtern ermöglicht so jede erdenkliche Art von Ad-hoc Analysen, entweder als klassische Trefferliste oder natürlich auch immer häufiger über flexible Dashboards.
Die Einsatzmöglichkeiten sind vielfältig – vom Aufspüren personenbezogener Daten bis hin zur Identifikation von Daten zur Erfüllung von Exportkontrollvorschriften. Auch die Bereitstellung aller relevanten Informationen in der Automobilentwicklung in unterschiedlichen Entwicklungsphasen eines Fahrzeugs ist ein mögliches Einsatzszenario. Es geht letztlich darum, ohne ressourcenintensive IT-Projekte die Grenzen von Datensilos zu überwinden und durch das Zusammenführen von bisherigen Dateninseln echte Mehrwerte zu schaffen. So behalten Unternehmen mit überschaubarem Aufwand den Überblick über ihre Daten, heben ihre Datenschätze und kultivieren ihr Wissensmanagement. Aber auch in der Situation der aktuellen Pandemie könnten Behörden Informationen aus unterschiedlichen Quellen sinnvoll zusammenführen, um daraus Entscheidungen abzuleiten.
Datenintegration als Basis
Daten müssen in Relation gesetzt werden, um sie verstehen und interpretieren zu können. Das Werkzeug dazu ist die Datenintegration und natürlich jede Menge unterschiedlicher Konnektoren und flexible Auswertungsmöglichkeiten.
Unabhängig davon, wo die Daten liegen und ob es sich um unstrukturierte, semi-strukturierte oder strukturierte Daten handelt, führt die Enterprise Search Software iFinder von IntraFind Daten in einem Suchindex zusammen. Technisch gesehen ist das ein Suchindex auf NoSQL-Basis, funktional gesehen handelt es sich dabei um eine mächtige Wissensinfrastruktur. Darauf können völlig flexibel unterschiedlichste Such-, Analyse-- oder Dashboard-Benutzeroberflächen gesetzt werden. Klassische Suche mit Sucheingabefeld sowie Trefferliste mit Navigation und Knowledge Graph ist eine Basisausprägung der Nutzung. Die Auswertung von Zusammenhängen kann aber auch in Dashboards oder beliebigen anderen Applikationen oder Unternehmensprozessen erfolgen. Der Fantasie sind hier keine Grenzen gesetzt.
Semi-strukturierte Daten
Der Search-Spezialist IntraFind bedient sich dabei sowohl der Methodiken der Enterprise Search-Technologie als auch der klassischen Business Intelligence (BI)-Technologien, indem er aufbauend auf dem Stack von Elasticsearch eine KI-getriebene Cognitive Search and Analytics Engine zur Verfügung stellt, die die User befähigt, Daten zu verstehen. Dabei betragen die Kosten hierfür heutzutage nur Bruchteile früherer Datenintegrationsansätze.
Datenaggregation als Kür
Sind die unterschiedlichen (strukturierten und unstrukturierten) Daten einmal in einem zentralen Index gespeichert, fängt die KI der Software erst richtig an. Die Aggregation kann flexibel in vielfältigster Art und Weise erfolgen. Dafür sorgt ein KI-Technologiestack aus Machine Learning sowie regelbasierten, linguistischen und semantischen Verfahren. Dabei ermöglichen die suchgetriebenen Ansätze Ad-hoc-Analysen. Die Fragen müssen jedoch nicht - wie bei BI-Systemen - vorher definiert und das System dahingehend aufwändig vortrainiert werden.
Die Software extrahiert wichtige Datenpunkte, wie beispielsweise personenbezogene Daten für eine DSGVO-Analyse aus beliebigen Dokumenten, führt die relevanten Daten zusammen und liefert über die flexible Aggregation der jeweils für eine Fragestellung relevanten Aspekte die gewünschte Informationsverdichtung, die der User benötigt.
Das Tool normalisiert die Daten in maschinenlesbare und verwertbare Einheiten (Datum, metrische Angaben, GIS Koordinaten etc.). Es übersetzt relevante Inhalte und analysiert Bilder und Videofiles, um maschinenlesbaren Text für die Recherche verwenden zu können. Alle Daten im Unternehmen können zudem automatisch mit den relevanten Metadaten angereichert, also mit Labeln versehen werden, um damit eine weitere Verarbeitung und Sortierung zu ermöglichen. Daten werden so nach bestimmten Themenfeldern klassifiziert.
Wir als Menschen haben die Fähigkeit diese Themenfelder und Kontexte zu definieren und die Daten anschließend für die nächste Handlung zu interpretieren und neue Analysen aufzusetzen. Mittels mächtiger KI-Verfahren führt die Software Daten zusammen und zeigt dem User Zusammenhänge auf - auch für mehrere hundert oder Milliarden Dokumente. Unternehmen und ihre Mitarbeiter erhalten so relevante Informationen, um Entscheidungen zu treffen oder auch, um Risiken oder generell Sachverhalte zu erkennen.
Durchführung übergreifender Analysen - Einsatzszenarien in der Praxis
Die Einsatzszenarien von Enterprise Search als Datenintegrations-Tool sind vielfältig und flexibel, egal wo die Informationen liegen. Im Zusammenhang mit der aktuellen Covid-19 Pandemie könnten Länder- und Bundesbehörden allgemein zugängliche Informationen aus unterschiedlichen Informationsquellen zur Bewertung der aktuellen Situation heranziehen und daraus Handlungsempfehlungen oder Maßnahmen ableiten. Die intelligente Nutzbarmachung und Verknüpfung vorhandener Daten wäre von großem Nutzen. Unterschiedlichste Datenbanken in Behörden, wie z.B. Kapazitäten für Intensivbetten, verfügbare Schutzausrüstung, Informationen des Bundesamts für Arzneimittelforschung, endlich vernetzt und angereichert mit Fachinformationen oder frei zugängliche Quellen aus dem Web wie z.B. vom Robert-Koch-Institut oder der Johns-Hopkins-Universität.
Unabhängig vom Einsatzszenario geht es immer darum verschiedenste Informationen aus unterschiedlichsten Datentöpfen intelligent zu verknüpfen und übergreifende Analysen zu fahren. So lassen sich Verbindungen zwischen Informationen erkennen, die Menschen in kurzer Zeit nicht sehen könnten.