OCRmyPDF – Texterkennung mit Linux-Werkzeugen

Einleitung

OCRmyPDF ist ein Linux Kommandozeilentool, welches verschiedene Linux-Tools zur Erstellung von durchsuchbaren PDF-Dateien nutzt – Texterkennung mit Linux. Hierbei erweitert OCRmyPDF ein PDF um eine zusätzlich Ebene mit Text. Zur Texterkennung nutzt es Tesseract.

Installation

Neben Tesseract werden einige weitere Pakete benötigt:

Sind diese besorgt kann OCRmyPDF installiert werden:

Im Anschluss kann getestet werden.

Test

Hilfe sowie verfügbare Optionen ausgeben:

Dokument mit Sprache „Deutsch“ verarbeiten und unter neuem Namen ablegen:

Mit inotify-tools soll nun ein Verzeichnis auf neue PDF-Dateien überwacht werden, damit diese automatisch verarbeitet werden können.

inotify-iools

Wir besorgen uns zunächst inotify-tools:

Schließlich sorgen wir dafür,dass neue PDFs automatisch verarbeitet werden.

Have fun!

Apache als Reverse-Proxy konfigurieren

Einleitung

In diesem Beitrag wird der Webserver Apache als Reverse-Proxy konfiguriert, um eingehende Verbindungen an interne Applikationen weiterzuleiten.

Eine bestehende Apache-Installation wird vorausgesetzt.

Konfiguration

Zunächst das Paket mit den benötigten Apache-Modulen installieren, dann die gewünschten Module aktivieren:

Jetzt noch testweise eine Konfiguration /etc/apache2/sites-available/reverse-proxy-test erstellen:

Die Konfiguration muss noch aktiviert werden:

Nun ist die Anwendung http://meine-anwendung unter http://mein.server.tld:1234 erreichbar.

Have fun!

openHAB IP-Kamera in Sitemap einbinden

Einleitung

Im Folgenden wird openHAB um die Anzeige einer Webcam erweitert bzw. die openHAB IP-Kamera in die Sitemap einbindet. Die Grundinstallation kann vorherigen Beiträgen entnommen werden. Sehen Sie hier einen Überblick der Beiträge zu openHAB.

Vorgehensweise

Zur einfachen Anzeige ist lediglich das Einbinden der URL in die Konfiguration der Sitemap notwendig: openHAB IP-Kamera in Sitemap einbinden weiterlesen