Computerprogramm liest Großvaters Briefe

Wissen / 28.08.2015 • 16:05 Uhr
Transkribus heißt die Software, die historische handschriftliche Dokumente lesen kann. Foto: Uni innsbruck
Transkribus heißt die Software, die historische handschriftliche Dokumente lesen kann. Foto: Uni innsbruck

Mittels digitaler Unterstützung können heute historische Handschriften entschlüsselt werden.

innsbruck. (VN) Wer sich schwer tut, einen in Kurrentschrift verfassten Brief seines Großvaters zu entziffern, der könnte bald digitale Unterstützung erhalten. Seit mehreren Jahren schon arbeiten Forscher weltweit daran, digitalisierte historische Dokumente vom Computer automatisch entschlüsseln zu lassen. „Die Grundlagenforschung zur Handschriftenerkennung ist schon recht weit fortgeschritten“, informiert Günter Mühlberger, Leiter der Gruppe Digitalisierung und Elektronische Archivierung an der Universität Innsbruck. „Nun geht es darum, diese Forschungsergebnisse auch für eine breite Öffentlichkeit nutzbar zu machen.“

Serviceplattform im Aufbau

Mit seinem Team arbeitet Mühlberger am Aufbau einer speziell an Archive und Historiker gerichteteN Serviceplattform. „Mit den von der Technischen Universität Valencia und dem Nationalen Forschungszentrum in Athen gelieferten Algorithmen können wir heute bereits 70 bis 80 Prozent eines Dokuments automatisch entziffern.“

Die  dafür angewendeten Computerprogramme sind aber auch mit Schwierigkeiten konfrontiert: Vor allem bereiten das komplexe Layout historischer Dokumente, die unterschiedlich geformten Handschriften, aber auch die verschiedenen Sprachen, die sich im Laufe der Zeit auch stark gewandelt haben, Probleme. „Die Maschine muss zunächst einmal erkennen, wo auf einem Dokument ein Text steht und die einzelnen Zeilen richtig erkennen“, erklärt Mühlberger. Das sei eine technische Herausforderung, „die nicht zu unterschätzen ist“.

Jetzt will das Forscherteam um Mühlberger seine Erkenntnisse der internationalen Wissenschaftsgemeinde und auch der breiten Öffentlichkeit zugänglich machen. Im Rahmen des EU-Projektes READ werden die Wissenschafter dabei mit einer Förderung von insgesamt 8,2 Millionen Euro unterstützt. Mit diesem Geld werde Mühlbergers Team, gemeinsam mit insgesamt 13 Partnern aus Deutschland, Finnland, Frankreich, Griechenland, Großbritannien und Spanien, eine Serviceplattform entwickeln, „über die jede und jeder historische Handschriften bearbeiten kann“. Unter den Partnern seien zahlreiche Archive, die ihre Bestände zur Verfügung stellen. „Denn die eingesetzten Computeralgorithmen müssen trainiert werden, um die Handschriftenerkennung immer weiter zu verbessern“, sagt Mühlberger. „Deshalb wollen wir nicht nur Forscher aus den Geisteswissenschaften einladen, die neue Infrastruktur zu nutzen, sondern auch die breite Öffentlichkeit.“ Je mehr mit den Programmen zur Handschriftenerkennung gearbeitet werde, umso besser würden diese Algorithmen.

Historische Dokumente lesen

Mit der Software und der Unterstützung anderer Nutzer sollte es dann auch möglich sein, den in Kurrentschrift verfassten Brief des Großvaters rasch zu entziffern. So sollen in den nächsten Jahren Katasterbände, Kirchenbücher, Briefe, aber auch unterschiedlichste Personenlisten – etwa von Immigranten oder Passagieren –, Ratsprotokolle und viele andere historische Dokumente computerlesbar gemacht werden. Dafür werden die Forscher auch eine App für Smartphones anbieten, mit der die Handschriften direkt eingescannt werden können.

Gemeinsam mit der Öffentlichkeit sollen auch die Handschriften berühmter Persönlichkeiten gesammelt und automatisch erkennbar gemacht werden. Mühlberger zufolge könnten dann alle digitalisierten Handschriften am Computer durchsucht werden. „Das erspart die sehr aufwändige Abschrift der Texte und gibt einen direkten Zugang zu den Dokumenten.“ Mittels der automatisierten Schreibererkennung könne man in den Archiven auch nach anderen Handschriften einer bestimmten Person suchen, was bisher so nicht möglich war.