Das IMPACT-Konsortium vereint 26 europäische National- und Regionalbibliotheken, Forschungsinstitute und Technologiepartner, die ihr Wissen und ihre Erfahrungen austauschen und gemeinsam innovative Tools zur Erweiterung der Fähigkeiten von OCR-Engines entwickeln. Bereits Ende 2011 wird das Projekt einen deutlich verbesserten Zugang zu historischen Dokumenten und Texten, die vor 1900 entstanden sind, ermöglichen. Durch die vereinten Forschungs- und Entwicklungsanstrengungen aller IMPACT-Mitglieder wird die Digitalisierung des europäischen Kulturerbes einen wichtigen Schritt vorankommen.
ABBYY nimmt bereits seit 2008 eine Schlüsselrolle im IMPACT-Projekt wahr und unterstützt das Forschungsprojekt durch die Bereitstellung modernster OCR-Technologien und mit seiner Expertise bei der Digitalisierung historischer Schriften und der Texterfassung aus alten Dokumenten. Die innovativen OCR-Technologien von ABBYY sind besonders dafür geeignet, Texte aus Bildern historischer Dokumente in den unterschiedlichsten Frakturschriften zu erkennen und digital zu erfassen. Dadurch können historische Dokumente vollständig digitalisiert, durchsuchbar gemacht und in Systeme zum Aufbau von Wörterbüchern eingebunden werden. ABBYYs Forschungs- und Entwicklungsteams arbeiteten eng mit den federführenden Mitgliedern der IMPACT-Projektteams zusammen und befassten sich mit den technologischen Herausforderungen, vor denen Projekte zur Digitalisierung großer Bibliotheksbestände stehen. Durch die Verwendung historischer Beispieldokumente, zur Verfügung gestellt von führenden europäischen Bibliotheken, konnte ABBYY wichtige Technologiefortschritte bei der Bildvorverarbeitung und der Analyse von Dokumenten-Layouts erzielen und damit die Qualität der Zeichenerkennung verbessern.
"OCR-Software hatte bisher nicht alle notwendigen Funktionen, um gescannte Seiten wirklich zufriedenstellend in Volltext- oder XML-Dokumente umzuwandeln, gerade wenn es sich um alte Bücher, Magazine oder Zeitungen handelte", erläutert Aly Conteh, Executive Board Member des IMPACT-Projekts und Digitisation Programme Manager bei der British Library. "Als Teil des IMPACT-Projektes haben wir nun Zugang zu modernster OCR-Technologie von ABBYY, die es IMPACT-Mitgliedern ermöglicht, auch Dokumente mit sehr schlechter Qualität effizienter zu digitalisieren. Und wir wissen, dass wir uns auf diese Zusammenarbeit verlassen können, da ABBYY auch weiterhin sehr eng mit uns und anderen Partnern zusammenarbeitet, um die Kerntechnologie weiter zu verbessern."
"Digitalisierung hilft nicht nur dabei, das intellektuelle Erbe Europas für künftige Generationen zu erhalten. Sie macht diese Schätze auch für Millionen von Forschern, Studenten und Lesern weltweit zugänglich und verfügbar", erklärt Andrey Isaev, Director des SDK Products Department bei ABBYY. "Wir bei ABBYY freuen uns sehr, durch unsere OCR-Technologie und den gemeinsamen Erfahrungsaustausch einen wertvollen Beitrag in diesem Projekt leistet zu dürfen. Ganz besonders schätzen wir die enge und produktive Zusammenarbeit mit Menschen, die sich für das Gebiet der Texterkennung genauso begeistern können wie wir."
ABBYYs Teilnahme am IMPACT-Projekt baut auf früheren erfolgreichen europäischen Digitalisierungsprojekten auf. Für das METAe-Projekt entwickelte ABBYY mit FineReader XIX eine spezielle Omnifont OCR-Lösung zur Erkennung von Fraktur/gebrochenen Schriften wie sie typischerweise in Texten auftauchen, die zwischen 1800 und 1938 veröffentlicht wurden. Ein weiteres Projekt mit ABBYY-Beteiligung ist das "Digitisation-on-Demand"-Projekt, das Millionen von Büchern durch Digitalisierung elektronisch verfügbar machen will. Auch das deutsche Fraunhofer Institut für Medienkommunikation (IMK) hat mit der Fraktur-OCR im ABBYY FineReader SDK erfolgreich das Archiv der Neuen Zürcher Zeitung digitalisiert.
Die neuesten Entwicklungen der ABBYY Texterkennungstechnologien sind ab sofort verfügbar und können von Institutionen und Organisationen weltweit genutzt werden. ABBYY FineReader Engine SDK sowie ABBYY Recognition Server 3.0 bieten einige der neuesten ABBYY Technologieentwicklungen zur Erfassung spezieller Texte und Dokumente.
Weitere Informationen über das IMPACT-Projekt finden sich unter: http://www.impact-project.eu/.
Weitere Informationen über ABBYY OCR-Technologie zur Erkennung historischer Texte stehen unter http://www.frakturschrift.com zur Verfügung.