Zum Inhalt springen

KI, Cloud und Sicherheit im Fokus – Die Zukunft der Optical Character Recognition

Die Verwendung von Public Software zur Belegerkennung birgt aufgrund diverser Sicherheitslücken viele Gefahren wie beispielsweise Hackerangriffe. Wie lässt sich dieses Risiko reduzieren? Entdecken Sie die Vorteile einer cloudbasierten OCR-Lösung, die nicht nur die Sicherheit verbessert, sondern auch die Erkennungsraten mithilfe von KI optimiert.

Die Optical Character Recognition (OCR) (deutsch: optische Zeichenerkennung) hat sich im Laufe der Zeit zu einer wichtigen Technologie entwickelt, die unter anderem in verschiedenen End-to-End-Prozessen zahlreicher Unternehmensbereiche eingesetzt wird.

Im Fokus stehen kaufmännische Belege mit unterschiedlichen Prozessen und den dazugehörigen Applikationen.

So gilt es, Rechnungen, Kundenaufträge, Bestellbestätigungen, Zahlungsavise und sonstige Belege zu empfangen, zu klassifizieren, zu interpretieren und deren Inhalt zu erkennen.

Je nach Anforderung der verschiedenen Belegtypen werden die für den Prozess erforderlichen Daten extrahiert.

Dabei unterliegt die OCR nicht nur der Anforderung, Gestaltung und Umsetzung von Prozessoptimierung (One-touch-Szenarien), Compliance und Security, sondern ebenfalls der eigenen Transformation durch die Integration neuer Technologien. Im Vordergrund steht vor allem das Thema Künstliche Intelligenz und der move in die Cloud.

Security impliziert Cloud Computing

Mittlerweile erleben alle Marktteilnehmer, dass IT-Sicherheit nicht mehr nur ein technisches Problem ist, das als fünftes Rad am Wagen mitgeführt werden kann. Denn es gibt kaum noch Unternehmen, die nicht zumindest mittelbar schwerwiegende Hackerangriffe erlebt haben. Als Angriffsziele werden Unternehmen aus allen Bereichen und Größenordnungen ausgewählt – etliche staatliche und soziale Einrichtungen und sogar Krankenhäuser sind Opfer geworden.

Um dieser Gefahr zu entgehen, hat man lange Zeit eine Art Abschottung der Systeme betrieben und dachte sich: „Ohne Internetzugang und neue Software kann es keine erfolgreichen Angriffe geben.“ „Das Scannen der Verzeichnisse und Dateien hat keine Relevanz, da es nicht notwendig ist.“ Doch mit der Veränderung der Arbeitsorganisation in Richtung Homeoffice und dem zunehmenden Anspruch, wissensbasierte Dienste in eine Software zu integrieren, ist eine Systemabschottung keine wirkliche Option mehr.

So erhält das Thema Sicherheit bei der Softwareentwicklung nun höhere Priorität. Der Einsatz von Virenscannern und Firewalls ist hierbei ein wichtiger Faktor, denn es besteht die Gefahr, dass die Software selbst zur Bedrohung wird. Das liegt vor allem daran, dass bei der Entwicklung von Software oft Komponenten von Drittanbietern verwendet werden und aktuelle Frameworks stark auf der Einbindung von Bibliotheken beziehungsweise Packages aufbauen.

Diese Softwarepakete liegen in der Regel als sogenannte Public Software vor, was bedeutet, dass sie von mehreren Entwicklern in Gemeinschaftsarbeit erstellt werden. Der Code ist meist öffentlich verfügbar, wodurch ein beachtliches Gefährdungspotential vorliegt.

In solchen Software-Packages werden ständig Sicherheitslücken entdeckt. Eine IT-Sicherheitsfirma gibt an, innerhalb von 6 Monaten 1.300 Pakete im JavaScript-Umfeld identifiziert zu haben, die Sicherheitslücken sogenannte Vulnerabilities darstellen.

Diese werden meist dadurch beseitigt, dass für das entsprechende Package eine neue Version in die Software integriert wird. In Einzelfällen muss jedoch ein gesamtes Paket durch ein Neues oder eine eigene Softwareentwicklung ausgetauscht werden. Die neue Version muss dann über regelmäßige Updates eingespielt werden.

Optical Character Recognition in der Cloud

Um den hohen Sicherheitsbedürfnissen der Unternehmen zu entsprechen, bietet sich eine cloudbasierte Lösung an, da nur über definierte Schnittstellen mit der Infrastruktur des Consumers kommuniziert wird und diese dadurch geschützt bleibt.

Ein Beispiel für eine solche Lösung ist FIS/fci, welche als neuer Dienst in der Cloud gehostet wird und an der Sicherheitsinfrastruktur des Cloud-Hosting-Anbieters partizipiert.

Bei FIS/fci handelt es sich um eine Optimierung für die Dokumentenerkennung, die über das Freiformverfahren und KI-Integration relevante Daten und Dokumente empfängt, verarbeitet und mit zuverlässigem Automatismus an das ERP-System übermittelt.

Mittels Continuous Integration (CI) wird mit jedem Produktzyklus beziehungsweise bei Patch-Releases unmittelbar eine aktuelle Version der Software zur Verfügung gestellt, in der bekannte Vulnerabilities ausgeschlossen sind. Somit kann das Risiko eines Cyber-Überfalls für die Unternehmen signifikant reduziert werden.

Unternehmen, die aus Zeit- und Ressourcenmangel keine eigenen On-Premises-Systeme installieren und betreiben, können zukünftig die OCR als SaaS (Software-as-a-Service) in Anspruch nehmen. Eine lokale Installation ist nicht mehr notwendig, da Ergänzungen erkannter und interpretierter Belegdaten einzig über eine Webapplikation erfolgen.

Neben der der gesteigerten Sicherheit entfallen außerdem alle administrativen Tätigkeiten, da die Applikationen einer regelmäßigen Update- und Innovationsstrategie unterliegen. In Zeiten von Homeoffice und mobilem Arbeiten bildet das eine bewährte und unverzichtbare Konstellation.

KI als unverzichtbarer Bestandteil

Stand bisher für die OCR-Softwareentwicklung im Wesentlichen der funktionale Aspekt im Vordergrund, wird es zukünftig die OCR wohl nur noch mit Künstlicher Intelligenz geben. Denn die Anforderungen und Erwartungen entsprechen immer mehr einer gesamteinheitliche Belegerkennung.

Schriften- und Spracherkennung erfordern den Einsatz komplexer Algorithmen – gleiches gilt für die Interpretation des Beleglayouts. Auch die Kür der OCR – das Auffinden der Positionen, die Datenerkennung der für die Prozesse notwendigen Werte und ihre Zuordnung zum kaufmännischen Prozess bedingt intelligente Algorithmen auf Grundlage von KI.

Eine intelligente Positionsdatenlesung und -interpretation ist mit NLP-Modellen realisierbar, die kontinuierlich mit Daten antrainiert werden. Parallel werden zusätzliche Beleginformationen nicht mehr dezentral, sondern in einer Recognition-Database vorgehalten. Das bedeutet, dass viele Unternehmen untereinander partizipieren, indem sie eine übergreifende zentrale Datenbank zusammen mit antrainierten Machine-Learning-Modellen nutzen.

Zusammenfassung

Die OCR bildet zweifellos eine Schlüsseltechnologie für das digitale Unternehmen. Von der Erfassung bis zu Interpretation kaufmännischer Belege ist sie in zahlreichen Unternehmensbereichen unverzichtbar.

Jedoch unterliegt auch die OCR einem stetigen Wandel – so werden der Umzug in die Cloud und das Thema künstliche Intelligenz verstärkt in den Fokus gerückt. Auch die zunehmende Bedeutung von IT-Sicherheit ist eines dieser Themen, da Drittsoftwarekomponenten – oft als Public-Software verfügbar – erhebliche Sicherheitsrisiken bergen.

Cloudbasierte Lösungen erfüllen diese Sicherheitsbedürfnisse, gleichzeitig entfällt die Notwendigkeit einer lokalen Installation. Zusammen mit der Verwendung komplexer Algorithmen und einer zentralen Datenbank auf Basis antrainierter Machine Learning Modelle erfüllen sie die Anforderung an eine gesamteinheitliche Belegerkennung und zeigen, wie die Zukunft der OCR aussehen kann.

Redaktionsteam
Kontaktformular
Kontaktformular

*“ zeigt erforderliche Felder an

Alle mit einem * gekennzeichneten Felder sind für die Bestellung und Verarbeitung notwendige Angaben. Ihre personenbezogenen Daten werden zum Zwecke der Bearbeitung Ihrer Anfrage gem. unserer Datenschutzerklärung von uns verarbeitet.
Dieses Feld dient zur Validierung und sollte nicht verändert werden.