(Advanced) Data Analysis for Linguists
- Veranstaltungstyp: Seminare
- Einrichtung: Fakultät für Geisteswissenschaften
- Förderzeitraum: 01.04.2022 bis 31.03.2023
- Kurztitel: DAforLing
Auszug aus dem Förder-Antrag: "Die Fähigkeit, große Datenmengen zu analysieren und auszuwerten, wird zunehmend zu einer Kernkompetenz in vielen Branchen und Wissenschaftsbereichen, da sie die Möglichkeit bietet, fundierte Erkenntnisse zu gewinnen und effektive Strategien zu entwickeln. Dies gilt auch für die Disziplin der Linguistik (auch: Sprachwissenschaft), die sich der Erforschung von Sprache widmet. Große Datenmengen werden insbesondere in Datenbanken (‚Korpora‘) natürlicher Sprache bereitgestellt und analysiert, die mehrere Milliarden Wörter umfassen können (eine DIN-A4 Seite umfasst 350 bis 400 Wörter). Im Vergleich zur steigenden Bedeutung von Datenkompetenz in vielen Branchen und insbesondere auch der Forschungspraxis in der Linguistik zeigt sich, dass die aktuelle Lehrpraxis in dieser Disziplin hinter den neuesten Entwicklungen in der Big Data-Forschung zurückbleibt."
Das Projekt DAforLing

Um die Studierenden auf die Anforderungen des modernen Arbeitsmarktes vorzubereiten, besteht ein erheblicher Bedarf an Datenkompetenz. Dieser Bedarf war der Auslöser für die Entwicklung des Lehrveranstaltungskonzepts, das darauf abzielt, die Fähigkeiten von Studierenden der englischen Linguistik in der Datenauswertung und -anwendung sowie der kritischen Interpretation von Daten zu verbessern. In diesem Kontext wurden auch Möglichkeiten gesucht, diese Thematik langfristig in den Masterstudiengang Englische Sprachwissenschaft „English as a World Language (ENGAGE)“ und verwandte Studiengänge der Linguistik zu integrieren und den Studierenden die Möglichkeit zu geben, ihre Fähigkeiten in der Datenauswertung und -anwendung in kleineren Forschungsprojekten zu vertiefen.
glen carrie / unsplash
Rückblick und Ergebnisse

Im Einführungskurs "Data Analysis for Linguists" erhielten die Studierenden eine grundlegende Einführung in R und RStudio, um diese Tools effektiv für ihre Datenanalysen nutzen zu können. Des Weiteren wurden grundlegende Konzepte der Datenanalyse erlernt, wie Datentypen, Variablen und Datenaufbereitung. Die Studierenden erlernten auch Methoden zur Beschreibung von quantitativen Daten, wie Maße der zentralen Tendenz und der Streuung sowie grafische Darstellungen von Verteilungen. Darüber hinaus wurden Kenntnisse der Regressionsanalyse vermittelt, um lineare Beziehungen zwischen Variablen zu analysieren. Im vertiefenden Kurs "Advanced Data Analysis for Linguists" wurden den Studierenden weitere fortgeschrittene Methoden der Datenanalyse vermittelt.
Die erworbenen Fähigkeiten und Kenntnisse sind in vielen Bereichen der Linguistik und darüber hinaus anwendbar und stellen somit einen wichtigen Beitrag zur Ausbildung von professionellen Linguist:innen dar. Allerdings hat das Projekt auch unerwartete Herausforderungen aufgezeigt. Obwohl es gelungen ist, viele Studierende anzusprechen, die bereits ein Interesse an Datenkompetenz hatten, stellte sich heraus, dass viele Studierende der Anglistik ohne bestehendes Interesse an diesem Thema Zurückhaltung bei der Beschäftigung mit datenintensiven Methoden zeigen. Aus diesem Grund fokussiert sich unser Folgeprojekt "Analysing Controversial Discourses" im Rahmen des DDLitLab darauf, neue didaktische Ansätze zu entwickeln, die einen breiteren thematischen Bezug haben.
Tipps von Lehrenden für Lehrende

Die zunehmende Bedeutung datenintensiver Methoden in der Forschung und Wirtschaft unterstreicht die Bedeutung der Grundidee der Lehrveranstaltung. Datenkompetenz und die kritische Interpretation von Daten sind dabei weiterhin zentrale Aspekte. Diese Kernkompetenzen sollten auch in zukünftigen Lehrveranstaltungen im Fokus stehen. Die Erfahrung hat gezeigt, dass die Studierenden von interaktiven Lehrmethoden und praktischen Übungen besonders profitieren und das Lernen durch Anwendung in realen Forschungsprojekten gefördert wird. Durch die Eigenanalyse als Lehrperson können Lehrstrategien überdacht und optimiert werden, um eine bessere Vermittlung der Inhalte und eine höhere Motivation der Studierenden zu erreichen. Viele Fächer setzen heute auf datenintensive Methoden, sei es in den Naturwissenschaften, den Geisteswissenschaften oder den Sozialwissenschaften. Daher sind die in unserem Lehrprojekt vermittelten Grundlagen der Datenanalyse potentiell in anderen Lehrveranstaltungen oder Studiengängen von Bedeutung.
Beteiligte Personen
Fakultät für Geisteswissenschaften
Antragstellender: Prof. Dr. Robert Fuchs
Wissenschaftliche Mitarbeitende: Julia Schilling
Förderlinie: Fachspezifische Data Literacy
Förderzeitraum: 01.04.2022 - 31.03.2023
Lehrveranstaltungen:
SoSe 2022: Seminar "Data Analysis for Linguists" (Link zum Stine Vorlesungsverzeichnis)
WiSe 2022/23: Seminar "Advanced Data Analysis for Linguists" & Seminar "Data Analysis for Linguists" (Link zum Stine Vorlesungsverzeichnis)