DMG- XXVIII. Deutscher Orientalistentag, Bamberg, 26.-30.3.2001
 
[Hauptseite] [Zentralasien] [Panels]  
 
Abstracts / Zusammenfassungen der Vorträge
Zentralasien

Irina Nevskaya:
Eine elektronische schorische Datenbank: Dokumentation von Sprachmaterialien und ihre linguistische Bearbeitung

Der Vortrag berichtet über ein laufendes wissenschaftliches Projekt Ein schorisches Textkorpus: Dokumentation literarischer und gesprochener Texte zur Sicherstellung von Materialien aus einer bedrohten Sprache und ihre linguistische Bearbeitung. Das Projekt wird im Rahmen des Programms der internationalen wissenschaftlichen Kooperation zwischen der DFG und der Russischen Stiftung für Forschungen in Geisteswissenschaften durchgeführt und von beiden Seiten finanziert.
Das Projekt ist am Novokuznecker Staatlichen Pädagogischen Institut, das ein bedeutendes Zentrum turkologischer Forschungen in Sibirien ist, und an der Universität Frankfurt angesiedelt. Die Leiter des Projekts sind Prof. Dr. Marcel Erdal und Privat-Dozentin Dr. Alisa Esipova.
Gegenstand des Projekts ist das Schorische, eine der am stärksten vom Aussterben bedrohten Sprachen Südsibiriens. Das primäre Hauptziel des Projekts ist die Schaffung einer Datenbank anhand publizierter, aber schwer zugänglicher sowie unpublizierter schorischer Quellen. Als zweites Hauptziel soll anhand des zu erstellenden Corpus die schorische Grammatik in ihrer dialektalen Vielfalt sowie in ihrer Entwicklung näher erkundet werden, um Lücken in der Beschreibung dieser Bereiche zu füllen.
Die primäre Datenbank wird mit dem Programm Shoebox erstellt. Die Dokumentierung der Sprache erfolgt auf mehreren Ebenen der Textbearbeitung inklusive morphologischer Analyse und Lexikonerstellung. Die Struktur der Datenbank wurde von mir in Frankfurt ausgearbeitet; sie enthält folgende Ebenen: Transkription, Transliteration in der modernen schorischen Schrift, Transkription in der lateinischen Schrift, Parsing und Glossierung aufgrund der kyrillischen und lateinischen Transkriptionen, Übersetzung ins Russische und Deutsche (oder Englische), Kommentare. Die schorische Morphophonologie und die Grundlagen des elektronischen Lexikons wurden ebenfalls in der Form, die für die morphologische Analyse erforderlich ist, kodiert. Es ist weiter vorgesehen, dass die Daten auch in das HTML-Format umgewandelt werden müssen, so dass die Datenbank auch online verfügbar werden kann. Der Vortrag illustriert die Einzelheiten der Datenbankstruktur mit Beispielen aus dem laufenden Projekt.

Stand 21. Februar 2001