Versionskontrolle von Code und Daten mit Git und DataLad
„Versionskontrolle ist das Notizbuch für eine digitale Welt und Git das wohl bekannteste Versionskontrollsystem. Es ermöglicht, Veränderungen in digitalen Objekten präzise zu dokumentieren und damit nachzuvollziehen, wer was wann wie und warum in einer Datei verändert hat.“
Studierende der Psychologie bekommen bereits eine umfassende methodische Ausbildung. In diesem DLE-Projekt können sie ihre Datenkompetenzen um praktische Fähigkeiten zur Versionskontrolle und zur kollaborativen Arbeit mit Forschungsdaten und Programmiercode erweitern. Mit Versionskontrollsystemen wie Git (für kleinere Datenmengen wie Text und Code) und DataLad (für größere Datenmengen, z.B. Bilder und Videos) können Veränderungen an Daten und Code dokumentiert, verglichen und revidiert werden. Die Systeme machen es möglich, simultan an der gleichen Datei zu arbeiten und verschiedene Versionen zusammenzuführen. Außerdem kann aus Daten generiertes Wissen mit diesen Systemen transparent und verifizierbar gemacht werden. Die Auseinandersetzung mit Versionskontrollsystemen fördert dadurch auch das theoretische Verständnis von Konzepten wie Reproduzierbarkeit, Open Science, Open Data und Open Source sowie der Prinzipien guter wissenschaftlicher Praxis. In der Veranstaltung werden zunächst die theoretischen Grundlagen in Vorträgen vermittelt, die auch über lecture2go verfügbar gemacht werden. Interaktive Demonstrationen von Git und DataLad führen dann in die Versionskontrollsysteme ein. Diese sind open-source, kostenlos nutzbar und für alle Betriebssysteme (macOS, Linux, Windows) verfügbar. Den größeren Anteil der Veranstaltung nehmen die betreuten, praktischen Übungen ein, in denen die Teilnehmenden in Kleingruppen den Umgang mit der Software über die Kommandozeile oder die grafische Benutzeroberfläche lernen. Vorkenntnisse im Programmieren schaden nicht, werden aber nicht vorausgesetzt. Mit Jupyter Notebooks und Quarto werden Lehrmaterialien erstellt, die auf der Projektwebseite zur Nachnutzung und Weiterentwicklung als Open Educational Resources veröffentlicht werden.
Perspektivisch soll dieser Kurs in einem forschungsorientierten Master-Studiengang in der Psychologie integriert und verstetigt werden. Da die Inhalte für alle Studienfächer, die mit digitalen Daten arbeiten, interessant und relevant sind, ist auch ein Transfer dieses Lehrkonzepts in andere Fächer denkbar und wünschenswert.
Fakultät für Psychologie und Bewegungswissenschaft
Antragstellende: Dr. Lennart Wittkuhn, Prof. Dr. Nicolas Schuck
Förderlinie: Fachspezifische Data Literacy
Förderzeitraum: 01.04.2023 - 31.03.2024
Lehrveranstaltung im WiSe 23/24: Seminar Versionskontrolle von Code und Daten mit Git und DataLad (Link zur externen Projektwebseite)