|  | Modularsequentielle Layoutanalyse: Zeitungsausschnitt durch Algorithmus statt Schere |  |
 |  |  |  | Guido Falk von Rudorf | 19 |
| Ort: Steinfurt |
|  |  |  |  |
|  |  |  |  |  |  | 
Zum Vergrössern ins Bild klicken! |  |  |  |  |
|
 |  |  |  | |  | Schule: Kreisdekanatsbüro Steinfurt Steinfurt |  | Betreuung:
|  | |
|  |  |  |  |
Kurzfassung:  |  |  |  | 1.1 Fragestellung Assoziiert mit dem 7. Forschungsrahmenprogramm der EU fordert das Programm ”i2010: Digital Libraries Initiative“ verstärkte Bemühungen um die Digitalisierung von Archivbeständen ein. Vor diesem Hintergrund stellte sich die Frage, ob eine entsprechende, praxistaugliche Software existiert. 1.2 Methode Eine Analyse der auf dem Markt befindlichen Programme – darunter auch solche, die von Google mitentwickelt werden – zeigte, dass diese Programme bei der Analyse von Zeitungen zu langsam und fehlerbehaftet sind. Es wurde daher von mir ein Algorithmus entwickelt, der Zeitungsseiten schnell, ressourcenschonend und akkurat erfasst. 1.3 Ergebnisse An einer Beispielimplementierung konnte die Funktionsfähigkeit des im Rahmen dieser Arbeit entwickelten Algorithmus nachgewiesen werden. Dadurch wird die Arbeit von Zeitungsausschnittdiensten, Pressestellen, Bibliotheken und Archiven erheblich vereinfacht und beschleunigt, zumal bei der Entwicklung sichergestellt wurde, dass die vorangehenden (Scannen) und nachfolgenden (Texterkennung, Indizierung) Arbeitsschritte bestmöglich eingebunden werden können. Unter den in der Dokumentation genannten Bedingungen benötigt mein Algorithmus etwa 1,4 Sekunden für eine Zeitungsseite und macht dabei einen Fehler, während die bislang führende Software für dieselbe Seite 71 Sekunden benotigt und dabei zehn Fehler macht. 1.4 Diskussion Je enger die typografischen Regeln beim Layout eingehalten werden, desto effizienter arbeitet der von mir entwickelte Algorithmus. Eine Weiterentwicklung erstreckt sich auf die inhaltliche Analyse und konsekutive Zuordnung von Bildern. |  |  |  |  |
Platzierung:

| |