Der Poster beschreibt den gegenwärtigen Stand des Projekts WALDI (World Atlas of Little Data Infrastructure), das am Institut für Empirische Sprachwissenschaft gemeinsam mit dem StudiumDigitale seit Mai 2015 realisiert wird.
Durch empirische Arbeit in der Sprachforschung entstehen verhältnismäßig kleine Daten, die i. d. R. von einzelnen Forschern erhoben werden und für die aktuelle Zwecke lokal (d. h. nicht-netzbasiert) abgespeichert. Die Verwendung von solchen „Little Data“ ist durch eine konkrete Fragestellung und das Forschungsinteresse beschränkt. Aus diesem Grund geraten sie nach dem Auslaufen einer Forschungsphase schnell in Vergessenheit.
Das primäre Ziel des Projektes ist die Konstruktion eines webbasierten Tools, das den linguistischen Feldforschern erlaubt lokal abgespeicherte Sprachdaten auf einem digitalen Atlas abzubilden und die Existenz dieser Daten für die Nutzer des Atlasses bekanntzugeben.
Eine webbasierte Anwendung erlaubt die freie Nutzeranmeldung auf einer digitalen Weltkarte (basierend auf Google Maps). Die Nutzer_innen editieren die Karte, indem sie die elizitierten Daten der dokumentierten Sprache (kleine Sprachkorpora) geographisch fixieren (pinnen) und den fixierten Pin mit einem TEI-ähnlichen Header versehen. Das Pinnen geschieht anhand von GPS-Angaben, die durch einfache Mauszeigerbewegungen generiert werden (man kann für viele Sprachen z. B. im Amazonas oder kaukasischen Hochland keine Orte in Google Maps lokalisieren). Der Header beinhaltet alle relevanten Sprachdateninformationen, die in folgende 5 Reiter-Kolumnen unterteilt sind: 1. Korpus Information (Autoren, Institutionen, Release, Größe etc.); 2. Sprache (Status, Schrifttum, Typologie etc.); 3. Die Art und der Aufarbeitungsstand der Daten (Transkription, Annotation etc.); 4. Erfasste Texte (Art, Epoche, Genre etc.); 5. Zugänglichkeit und Kontakt.
Zur technischen Realisierung des Tools kommen die Elemente aus Google Maps, JavaScript, MySQL zum Einsatz.