zum Inhalt springen

Informationsverteilung und Sprachstruktur – Korrelation von grammatischen Ausprägungen der Nomen/Verb-Unterscheidung und lexikalischem Informationsgehalt im Tagalog, Indonesischen und Deutschen (DFG)

 

In Zusammenarbeit mit der Abteilung Automatische Sprachverarbeitung, Universität Leipzig, Prof Dr. Heyer

 

Thema ist die Manifestierung von Variabilität in der formalen Unterscheidung von Wortarten auf der Diskursebene: Korreliert die unterschiedliche formale Ausprägung der Nomen/Verb-Unterscheidung mit Unterschieden im Informationsgehalt der Wortformen? Die Vorhersage ist, dass sprachliche Information in Sprachen mit schwach ausgeprägten formalen Unterschieden zwischen Nomen und Verben anders verteilt ist als in Sprachen mit stark ausgeprägten Unterschieden. Verglichen werden Tagalog (geringe N / V-Unterscheidung), Deutsch (starke N / V-Unterscheidung) und Indonesisch (Zwischenposition). Die Methodik ist Klassifikation von Wortformen auf der Basis ihres Informationsgehalts in Default- (erwartbare) und Non-Default (überraschende)-Formen und die Überprüfung von Korrelationen mit grammatisch definierbaren Klassen. Der technologische Output ist ein Analyse-Tool mit Implementationen der informationstheoretischen Konzepte.