Zurück zur Übersicht
26. Oktober 2023

APARAVI 2.9 eröffnet neue Optionen zur Texterkennung in Bildern, Scans und Videos

Titelbild

München, 26. Oktober 2023 – APARAVI, Anbieter von Lösungen zur Verwaltung unstrukturierter Daten, erweitert die neue Version 2.9 der APARAVI-Plattform mit einem KI-gestützten OCR-System zur verbesserten Texterkennung in Hunderten von Dateitypen.

Die neue Version 2.9 der APARAVI-Plattform findet und extrahiert dank der erweiterten OCR-Features (Optical Character Recognition) durch systematische, automatisierte Schrifterkennung Texte jetzt auch in Hunderten neuer Dateitypen und verbessert damit drastisch die Qualität und Korrektheit der Texterkennung. Aktuell ist sie für über 50 Sprachen der lateinischen und kyrillischen Schrift möglich, von A wie Afrikaans bis V wie Vietnamesisch. In IT-Projekten spielt die Texterkennung eine immer wichtigere Rolle. Viele KI-Anwendungen arbeiten Text-basiert und sind daher auf einen großen Umfang und hohe Qualität an Textinput angewiesen. In der Extraktion dieser Informationen aus bestehenden Datenbeständen liegt daher oft die erste Herausforderung beim Einsatz von Künstlicher Intelligenz.

Basis des neuen OCR-Systems ist eine Deep Learning Engine, die die APARAVI-Plattform um spezifische KI- und ML-Fähigkeiten erweitert. In deren Kern lokalisiert ein auf CRAFT (Character Region Awareness For Text Detection) aufbauendes Detektor-Modell mit Hilfe von Convolutional Neural Networks (CNN) Textabschnitte in Bildern oder Videos. Diese werden dann vom Convolutional Recurrent Neural Network (CRNN) analysiert und anschließend dem Language Recognizer zur entsprechenden Texterkennung und -bereitstellung weitergeleitet.

Die neuen OCR-Fähigkeiten erweitern die Anwendungsszenarien für die APARAVI-Plattform, deren Einsatzmöglichkeiten und Reichweite um ein Vielfaches. So ist es beispielsweise möglich, bei datenforensischen Untersuchungen (e-Discovery) nicht nur textbasierte Dateiformate, sondern auch gemischte, unstrukturierte Informationen wie etwa Chatverläufe mit Text, Bild, Sprachnachrichten und Videos nach prozessrelevanten Informationen zu scannen. Die in der Regel 80 Prozent unstrukturierten Daten in typischen Datenbeständen werden transparenter, zugänglicher und analysierbarer. Dark Data gehört somit der Vergangenheit an. Auch die Aufbereitung von sauberen, echten und relevanten Trainingsdaten für KI-Entwicklung ist damit akkurat und effizient durchführbar.

„Mit den neuen KI-gestützen OCR-Fähigkeiten wird APARAVI 2.9 zum universellen Tool für das Daten- und Informationsmanagement im Unternehmen“, erklärt Adrian Knapp, CEO bei Aparavi. „OCR macht es möglich, große Mengen an Text aus unstrukturierten Dateien zu extrahieren, ganz egal in welchem Ursprungsformat sie vorliegen. Diese Textinformationen sind eine wichtige Voraussetzung, um KI-Anwendungen praxisnah in die Arbeitsprozesse zu integrieren. So sorgt diese KI-Funktionalität von APARAVI 2.9 dafür, dass KI-Anwendungen erfolgreich in Unternehmen eingesetzt werden können.“