Tools und Datendienste
Mit der Entwicklung von offenen digitalen Arbeitsinstrumenten und Infrastrukturen unterstützt der FID4SA Forschungsprozesse im Bereich der Südasienstudien und Indologie. Auf den nachfolgenden Seiten stellen wir Ihnen Werkzeuge und Dienste vor, die im Rahmen oder mit Beteiligung des FID4SA entstanden sind und bei denen u.a. innovative Methoden aus dem Bereich des Digital Humanities zum Einsatz kamen. Unser Ziel ist es, grundlegende Informationen über Entwicklungen bereitzustellen. Gleichzeitig laden wir Entwickler:innen und Forscher:innen zur Nachnutzung und Vernetzung ein.
Texterkennung für südasiatische Schriften
KI-basierte Ansätze bei der Texterkennung haben die Texterkennung für historische Dokumente einen großen Schritt vorangebracht, vor allem für nicht-lateinische Schriften. Seit Herbst 2018 nutzt der FID4SA für die Texterkennung des Devanāgarī-Bestandes der Naval Kishore Press Sammlung die im Rahmen des READ Projekts entwickelte Plattform Transkribus.
Für die Archivierung und Nachnutzung von Ground Truth Trainingsdaten hat der FID4SA auf dem Heidelberger Forschungsdatenrepositorium mit FID4SA@heiDATA ein Dataverse angelegt. Interessierte Wissenschaftler:innen können die dort archivierten Daten herunterladen und als Trainingsdaten für eigene Texterkennungsmodelle nachnutzen.
