Tools und Datendienste
Mit der Entwicklung von offenen digitalen Arbeitsinstrumenten und Infrastrukturen unterstützt der FID4SA Forschungsprozesse im Bereich der Südasienstudien und Indologie. Auf den nachfolgenden Seiten stellen wir Ihnen Werkzeuge und Dienste vor, die im Rahmen oder mit Beteiligung des FID4SA entstanden sind und bei denen u.a. innovative Methoden aus dem Bereich des Digital Humanities zum Einsatz kamen. Unser Ziel ist es, grundlegende Informationen über Entwicklungen bereitzustellen. Gleichzeitig laden wir Entwickler:innen und Forscher:innen zur Nachnutzung und Vernetzung ein.
Texterkennung für südasiatische Schriften
KI-basierte Ansätze bei der Texterkennung haben die Texterkennung für historische Dokumente einen großen Schritt vorangebracht, vor allem für nicht-lateinische Schriften. Seit Herbst 2018 nutzt der FID4SA für die Texterkennung des Devanāgarī-Bestandes der Naval Kishore Press Sammlung die im Rahmen des READ Projekts entwickelte Plattform Transkribus. Verschiedene Datenmodelle für die Texterkennung wurden mit Transkribus für diesen Bestand trainiert.
Regionaler Zugang zu digitalen Textsammlungen
Um einen regionalen Zugang zu der über Literatur zu Südasien - digital bereit gestellten digitalisierten historischen Literatur anzubieten, wurde dieser Bestand mit Methoden der Geokodierung facettenreicher als bisher erschlossen. Geographische Bezeichnungen im Digitalisat eines historischen Druckwerks, wie Länder, Orte oder auch Tempel, wurden mit Geo-Koordinaten versehen. Die Nutzer:innen können somit über interaktive Karten auf die bereitgestellten Materialien zugreifen.