Erkennungmethoden in HotConnect

Aktualisiert 5 months ago von Michael Bochmann

HotConnect bietet verschiede Methoden um den Text vom Bildschirm zu lesen. Grundsätzlich können mehrere Methoden aktiviert werden. Diese werden der Reihe nach ausgeführt. Sobald ein Wert erkannt wurde bzw. eine Methode einen Wert zurückliefert, wird dieser verwendet.

DirectCapture

DirectCapture versucht nativ den Text aus der geöffneten Anwendung zu lesen. Dies funktioniert bei vielen Anwendungen und liefert die besten Ergebnisse, da der tatsächlich Text gelesen wird, der von der Anwendung angezeigt wird.

RemoteCopy

RemoteCopy versucht den Befehl "kopieren in Zwischenablage" an die Anwendung zu senden. Hierzu sollte der Text markiert sein. In neueren Windows Versionen ist diese Funktion im Betriebssystem häufig abgeschaltet.

FullScrape Capture

Arbeitet ähnlich wie DirectCapture und versucht nativ den Text aus der Anwendung zu lesen. Unterschied ist das hierbei der gesamte Text der Anwendung abgefragt wird. Diese Methode ist nur dann Sinnvoll, wenn DirectCapture zwar funktioniert aber der Text an einer falschen Stelle gelesen wird.

OCR

HotConnect bietet die Möglichkeit den Bildschirmtext per OCR auszulesen. Hierzu wird die tesseract OCR Engine von Google verwendet. Die Erkennungsquote liegt bei etwa 95%. Sinnvoll ist die Erkennung per OCR immer dann wenn DirectCapture nicht funktioniert, da die Anwendung dies nicht unterstützt oder man z.B. Inhalte aus einer RemoteDesktop oder Citrix Session auslesen will.

Die OCR ist für gängige Bildschirmschriftarten optimiert und liefert in vielen Anwendungen gute Ergebnisse. Sie ist dagegen NICHT dazu konzipiert aus z.B. gescannten Dokumenten Werte auszulesen.

Wertmanipulation

Die Erkennungsergebnisse lassen sich über einige Wertmanipulationen noch weiter verbessern/anpassen.

Komma ignorieren

Normalerweise wird ein Komma als Trennzeichen zwischen 2 Werten erkannt. Durch aktivieren der Funktion wird das Komma als Trennzeichen ignoriert. Dies ist z.B. bei Beträgen sinnvoll.

Leerstelle ignorieren

Normalerweise wird eine Leerstelle als Trennzeichen zwischen 2 Werten erkannt. Durch aktivieren der Funktion wird die Leerstelle als Trennzeichen ignoriert. Dies ist z.B. bei zusammengestezten Werten Sinnvoll: Bsp. XY 12345.

Character Blacklist

Die hier aufgeführten Zeichen werden aus dem erkannten String entfernt. Hierdurch lassen sich z.B. Bindestriche aus einem Wert entfernen: XY-12345 wird zu XY12345 wenn - auf der Blacklist steht.

Character Whitelist

Es werden nur die hier aufgeführten Zeichen im String zugelassen, alle anderen werden entfernt Bsp.: 0123456789 extrahiert ausschließlich Zahlen aus einem Wert. Zusätzlich beeinflusst diese Einstellung die OCR Engine und versucht die Werte entsprechend der Whitelist zu interpretieren.

Charachter Replace

Ersetzt zeichen durch ein anderes. Liest die OCR z.B. immer anstelle einer 8 ein B kann hierdurch das B wieder in eine 8 geändert werden.

Character Limit

Beschränkt die Länge des ausgelesenen Textes auf den eingestellten Wert entweder von Links oder Rechts. Dies ist sinnvoll, wenn die Erkennungsmethide mehr Text liefert als erwartet. Steht der Suchbegriff am Ende des erkannten Wertes und hat eine Fixe Länge kann mit dem Limit von rechts dieser ausgelesen werden. Steht der Text am Anfang eines längeren Strings, kann mit dem Limit von Links der Wert am Anfang gelesen werden.


Wie waren wir?