Information für die Wissenschaft Nr. 15 | 27. Februar 2020

Implementierung der OCR-D-Software zur Volltextdigitalisierung

DFG erbittet Anträge zur Entwicklung generischer Implementierungspakete für die OCR-D-Software zur Volltextdigitalisierung historischer Drucke

Um den Ansprüchen der Wissenschaft an die Nutzbarkeit digitalisierter Drucke zu genügen, werden (maschinenlesbare) Volltexte von Bilddigitalisaten benötigt. Diese Volltexte können durch Verfahren der automatisierten Layout-, Struktur- und Zeichenerkennung (OCR) erzeugt werden. Der Softwareprototyp aus dem seit 2015 geförderten Projekt OCR-D (www.ocr-d.de) verspricht eine flexible Integration in bestehende (bibliothekarische) Workflow- und Digitalisierungssysteme. Die Implementierung der OCR-D-Software ist folglich der nächste Schritt, damit die Erzeugung hochqualitativer Volltexte stattfinden kann.

Ziel der Ausschreibung ist die Entwicklung (generischer) Implementierungspakete der OCR-D-Software mit akzeptabler Performanz. Die Implementierungspakete sind für die spezifischen Anforderungen einer Einrichtung zu beschreiben und müssen zugleich so generalisierbar sein, dass ein entsprechendes Implementierungspaket auch an anderen Einrichtungen mit vergleichbaren Anforderungen nachgenutzt werden kann. Voraussetzung für eine Antragstellung ist unter anderem eine bis zu sechsmonatige Pilotierung der OCR-D-Software für das jeweils angestrebte Anwendungsszenario. In dieser Zeit soll eine intensive Auseinandersetzung mit dem Prototyp der OCR-D-Software erfolgen.

Um das Ziel der Ausschreibung zu erreichen, ist zudem die Förderung der Koordinierung bei der Entwicklung der Implementierungspakete möglich. Das künftige OCR-D-Koordinierungsprojekt soll die Funktionsweise des OCR-D-Gesamtworkflows weiterhin sicherstellen und eine Lösung für die nachhaltige Koordinierung und Betreuung einer Supportstruktur für die OCR-D-Software erarbeiten und aufsetzen. Voraussetzung für die Förderung eines OCR-D-Koordinierungsprojekts ist unter anderem die Analyse der Koordinierungsbedarfe für die Zeit der Implementierungsprojekte.

Bitte legen Sie Ihrem Antrag den vollständigen Ausschreibungstext zugrunde, in dem die Rahmenbedingungen für die Projekte detailliert genannt sind.

Interessentinnen und Interessenten werden gebeten, bis 5. Mai 2020 eine Absichtserklärung an abzugeben. Förderanträge können bis 7. Oktober 2020 über das elan-Portal der DFG eingereicht werden.

Handelt es sich bei dem Antrag um Ihren ersten Antrag bei der DFG, berücksichtigen Sie bitte, dass Sie sich vor der Antragstellung im elan-Portal registrieren müssen. Die Bestätigung der Registrierung erfolgt in der Regel bis zum darauffolgenden Arbeitstag.

Weiterführende Informationen

Weitere Informationen zum OCR-D-Koordinierungsprojekt finden Sie unter:

Ansprechpartner für fachliche Fragen und Förderbedingungen: