Data Cases
Was ist eine Datenfallstudie?
Datenfallstudie ist eine handlungsorientierte, lernendenzentrierte Lehr-Lern-Methode. Sie ermöglicht es, Schülerinnen und Schülern ausgewählte Datenpraktiken und -konzepte in vorbereiteten Szenarien nachzuvollziehen, kriteriengeleitet zu bewerten und zu erstellen. Entsprechend dem Ziel der schulischen Bildung zum Thema “Künstliche Intelligenz” werden Schülerinnen und Schülern in datenbasierter Urteils- und Problemlösekompetenz gefördert. Dazu gehört, dass sie
- die Schritte der Datenverarbeitung entlang des Lebenszyklus von Daten in KI-Systemen identifizieren,
- Datenverarbeitungsergebnisse beschreiben,
- diese vor dem Hintergrund des Domainwissens bewerten,
- Datenflüsse modifizieren und eigene erstellen.
Bestandteile einer Datenfallstudie
Zentrale Bestandteile einer Datenfallstudie sind:
- Beschreibung einer Problemsituation aus einem für Schülerinnen und Schüler persönlich relevanten Kontext,
- ein realer dokumentierter, alltagsrelevanter, auf die Situation ausgerichteter, ggf. didaktisch angereicherter Datensatz, an dem ausgewählte Datenkonzepte und -praktiken sinnstiftend und fachgerecht angewendet werden können,
- eine vollständig oder teilweise ausgearbeitete Datenanalyse in Form eines Datenflusses mit Aufgaben zur Beschreibung und begründeten Bewertung der Datenverarbeitungsergebnisse sowie Aufgaben zur Modifikation und Erweiterung des Datenflusses, einschließlich Ideen für weiterführende Datenanalysen,
- eine in Aufgabenstellungen explizit eingebettete Sammlung von Fachinformationen,
- Informationsmaterial zum Datenanalysewerkzeug und zur Interpretation der Ergebnisse,
- Optional - mehrstufiges Hilfematerial, Lernkontrollen, Übungen.
Architekturen einer Datenfallstudie
Für ihren schulischen Einsatz wird die Datenfallstudie in drei Architekturen realisiert: top-down, bottom-up und puzzleartig.
- Die Bottom-up-Datenfallstudie (e.g. Datenfallstudie 2 “Schutz der tasmanischen Abalone”) ist für Einzelarbeit geeignet und bietet eine geleitete Einführung in ein bestimmtes Thema (e.g., Exploration der Daten). Besonders leistungsstarke und interessierte SuS sowie Lehrkräfte profitieren von dieser Variante.
- Die Top-down-Datenfallstudie eignet sich besonders dann, wenn der Fokus auf den Konzepten und Phasen des Datenlebenszyklus liegen soll.
- Die puzzleartige Datenfallstudie eignet sich besonders für den Einsatz dann, wenn abstrakte Datenkonzepte wie Datenfluss vermittelt, sinnstiftend kommuniziert und kooperativ gelernt werden soll.
Schritte zur Durchführung einer Datenfallstudie
Bei der Arbeit an einer Datenfallstudie durchlaufen Schülerinnen und Schüler meist folgende Schritte:
- Vorbereitung der Arbeitsumgebung,
- Kennenlernen der problematischen Situation und der Zielsetzung,
- Sinnstiftende Partner- / Gruppenarbeit an Aufgaben,
- Fachliche Sicherung der Erkenntnisse,
- Optional: Reflexion der Datenverarbeitungsschritte im Datenfluss.
Das Lernprodukt ist ein schriftliches Protokoll mit Erkenntnissen aus der Datenanalyse und der Bewertung der KI-Modelle.
Datenfallstudie ist eine komplexe Lernform, die ausreichend Zeit im Unterricht erfordert. Die minimale Bearbeitungsdauer beträgt in unserer Variante eine Doppelstunde. Datenfallstudien eignen sich für heterogene Lerngruppen. Während ihres Einsatzes sollten jedoch das Datenflusskonzept und einfache Debuggingstrategien explizit behandelt werden. Lehrkräfte sollen sich vertieftes Wissen über die Domäne des Datensatzes aneignen, um die Sicherung der Erkenntnisse aus den Datenfallstudien in Plenumsphasen zu leiten.
Vorbereitung einer Datenfallstudie
Sie benötigen die Open Source Data Mining Software Orange3, um unsere Datenfallstudien bearbeiten zu können. Wenn Sie noch nie mit Orange3 gearbeitet haben, sehen Sie sich das Video “Einführung in Orange3” an.
Datenfallstudie 1: “Die Luftqualität in Berlin”
Freund von Sofia, Marc, hat Asthma. „Weißt du, Sofia, ich kann in der Stadt immer schlechter atmen!“, klagte er gestern in der Kantine. Sofia ist Datenwissenschaftlerin und will Marc helfen. Sie möchte eine Trendanalyse der Luftqualität in der Nachbarschaft von Marc durchführen. Ziel der Analyse ist es, anhand von realen Daten aus der Frankfurter Allee in Berlin, wo Marc wohnt, Trends in der Luftqualität der letzten Jahre zu erkennen, grafisch darzustellen und zu analysieren. Sofia möchte herausfinden, ob sich die Luftqualität in der Nachbarschaft von Marc in letzter Zeit verschlechtert hat.
In dieser Datenfallstudie werden folgende Datenkonzepte und Datenpraktiken behandelt:
- Trendanalyse
- Streudiagramm (Scatter Plot)
- Liniendiagramm (Line Plot)
Schülerinnen und Schüler lernen …
- … einen Datensatz auf fehlende Werte, Minimal- und Maximalwerte zu überprüfen.
- … Linien- und Streudiagramme zu beschreiben und zu interpretieren.
- … die Phasen eines exemplarischen Datenanalyseprozesses zu beschreiben.
Material
Gesamtdownload der Datenfallstudie
Im Ordner finden Sie:
- Beschreibung der problematischen Situation, in der sich Marc befindet,
- einen realen didaktisch angereicherter Datensatz zur Luftqualität des Berliner Luftgütemessnetzes von 1993 bis 2025,
- eine vollständig ausgearbeitete Datenanalyse in Form eines Datenflusses in Orange3,
- Arbeitsblätter mit Aufgaben zur Beschreibung und begründeten Bewertung der Datenverarbeitungsergebnisse sowie Aufgaben zur Modifikation und Erweiterung des Datenflusses,
- eine in Aufgabenstellungen explizit eingebettete Sammlung von Fachinformationen zum Thema “Luftqualität”,
- Hilfekarten zum Data Mining Tool Orange3 und zur Interpretation der Ergebnisse
- Erwartungshorizont
Durchführung
Planen Sie genügend Zeit im Unterricht für die Arbeit an dieser Datenfallstudie ein. Wenn die Arbeitsumgebung bereits eingerichtet ist, durchlaufen die Schülerinnen und Schüler die folgenden Schritte:
- Kennenlernen der problematischen Situation (10 Minuten)
- Bearbeiten der Aufgaben in Partnerarbeit (60 – 80 Minuten)
- Fachliche Sicherung der Erkenntnisse und Reflexion der Datenverarbeitungsschritte im Datenfluss (15 Minuten)
Das Lernprodukt dieser Datenfallstudie ist ein schriftliches Protokoll mit Erkenntnissen aus der Datenanalyse.
Tipps & Tricks
Weitere Daten zur Luftqualität in Berlin finden Sie auf der Internetseite Berliner Luftgütemessnetz. Auch viele andere Städte in Deutschland veröffentlichen Daten zur Luftqualität! Informieren Sie sich, ob auch Ihre Stadt Daten zum Download anbietet.
Olari, V., Lambert, L., Pfeiler, S., Dengg, J. & Romeike, R. (2025). Heft 1: Die Luftqualität in Berlin. In Olari, V. & Romeike, R. (Hrsg.), Data Cases: Datenfallstudien für den Informatikunterricht zum Thema Daten und Künstliche Intelligenz. Freie Universität Berlin, Computing Education Research Group. ISSN 3052-833X. https://computingeducation.de/proj-datacases/
Datenfallstudie 2: “Schutz der tasmanischen Abalone”
Tasmanische Abalonen sind beeindruckende Meeresschnecken, die an den Küsten Australiens leben. Sie haben auffällige, schimmernde Schalen und gehören zu den heute lebenden Fossilien, deren Geschichte bis in die Kreidezeit vor etwa 70 Millionen Jahren zurückreicht. Doch seit Jahren gehen die Wildbestände dramatisch zurück. Einige Arten stehen heute auf der Roten Liste. Gründe dafür sind die Umweltveränderungen aufgrund des Klimawandels sowie die Überfischung. Da das Alter der Meeresschnecken nicht leicht zu bestimmen ist, wird beim Fang häufig nicht unterschieden, ob es sich um junge oder erwachsene Tiere handelt.
In dieser Bottom-up-Datenfallstudie nutzten Schülerinnen und Schüler die Methoden der Datenexploration, um den Unterschied zwischen Jungtieren und erwachsenen Tieren anhand ihrer äußeren Merkmalen (Länge, Breite, Höhe) zu untersuchen. Diese Aufgabe ist knifflig, denn der Datensatz enthält einen Twist! Damit können die Schülerinnen und Schüler lernen, wie wichtig es ist, Daten zu hinterfragen und Auffälligkeiten in Daten auf den Grund zu gehen.
In dieser Datenfallstudie werden folgende Datenkonzepte und Datenpraktiken behandelt:
- Datenexploration
- Auffälligkeiten in einem Datensatz (unplausibler Wertebereich)
- Statistische Kennzahlen (Mittelwert, Median, Modalwert)
- Boxplot
Schülerinnen und Schüler lernen …
- … Beteiligte zu identifizieren, die an oder von dem Ergebnis der Datenanalyse betroffen sind.
- … Auffälligkeiten in einem Datensatz zu identifizieren und zu beseitigen.
- … statistische Kennzahlen (Mittelwert, Median, Modalwert, minimale und maximale Werte) anzuzeigen und zu interpretieren.
- … Boxplots zu erstellen und zu interpretieren.
- … nummerische Merkmale in einem Datensatz zu transformieren.
Material
Gesamtdownload der Datenfallstudie
Im Ordner finden Sie:
- Beschreibung der problematischen Situation, die in das Materail eingebettet ist,
- einen realen Datensatz zu tasmanische Abalonen inklusive Dokumentation,
- eine vollständig ausgearbeitete Datenanalyse in Form eines Datenflusses in Orange3,
- Arbeitsblätter für Gruppe A und B mit Aufgaben mit eingebeteten Hilfestellungen,
- Zusatzinformationen zu tasmanische Abalonen von der Tasmanischen Regierung,
- Erwartungshorizont
Durchführung
Planen Sie etwa 170 Minuten im Unterricht für die Arbeit an dieser Datenfallstudie ein. Das Lernprodukt ist ein schriftliches Protokoll mit Erkenntnissen aus der Datenanalyse.
Tipps & Tricks
Sie können diese Datenfallstudie weiter ausbauen. Sie können beispielsweise Themen wie „Klassifikation” (Vorhersage der Zielvariable „sex”) oder „Regression” (Vorhersage der Zielvariable „rings”) behandeln.
Olari, V., & Romeike, R. (2025). Heft 2: Schutz der tasmanischen Abalone, Version 1.0. In Olari, V. & Romeike, R. (Hrsg.), Data Cases: Datenfallstudien für den Informatikunterricht zum Thema Daten und Künstliche Intelligenz. Freie Universität Berlin, Computing Education Research Group. ISSN 3052-833X. https://computingeducation.de/proj-datacases/
Datenfallstudie 3: “Wann verschwindet der Schneeferner?”
Die Gletscher in den Bayerischen Alpen sind wichtige Zeugen des Klimawandels. Ihre Existenz und ihre kontinuierliche Beobachtung seit dem Ende des 19. Jahrhunderts ermöglichen einzigartige Studien zu den Auswirkungen des Klimawandels. In dieser puzzleartigen Datenfallstudie rekonstruieren Schülerinnen und Schüler den Datenverarbeitungsprozess, mit dem die Veränderung der Gesamtfläche des Schneeferners untersucht wird. Ziel ist es herauszufinden, wann dieser Gletscher vollständig verschwunden sein wird.
In dieser Datenfallstudie werden folgende Datenkonzepte und Datenpraktiken behandelt:
- Datenfluss
- Schritte des Datenlebenszyklus (Datenexploration, Datenvorbereitung, Erstellung eines Vorhersagemodells (Regression))
Schülerinnen und Schüler lernen …
- … den Datenverarbeitungsprozess zu rekonstruieren.
- … die Schritte und Ergebnisse in fertigen Datenflüssen zu verbalisieren.
- … den Datenfluss kriteriengeleitet und dialogisch zu untersuchen.
Material
Gesamtdownload der Datenfallstudie
Im Ordner finden Sie:
- Beschreibung der problematischen Situation, die in das Materail eingebettet ist,
- einen realen Datensatz zur Entwicklung der Gesamtfläche von Schneeferner inklusive Dokumentation,
- eine vollständig ausgearbeitete Datenanalyse in Form eines Datenflusses in Orange3,
- Arbeitsblätter mit Aufgaben und Lösungen,
- Legespiel Druckvorlage,
- Legespiel Erwartungshorizont
Durchführung
Planen Sie 90 Minuten im Unterricht für die Arbeit an dieser Datenfallstudie ein. Das Lernprodukt ist das Spielfeld mit dem rekonstruierten Datenfluss.
Tipps & Tricks
Diese Datenfallstudie eignet sich für eine Klasse, in der die meisten Schülerinnen und Schüler über fortgeschrittene Kenntnisse zu „Orange3” verfügen. Sie berücksichtigt jedoch auch Schülerinnen und Schüler ohne oder mit wenigen Vorkenntnissen.
Olari, V., Lambert, L., Pfeiler, S., Dengg, J. & Romeike, R. (2025). Heft 3: Wann verschwindet der Schneeferner? Version 1.0. In V. Olari & R. Romeike (Hrsg.), Data Cases: Datenfallstudien für den Informatikunterricht zum Thema Daten und Künstliche Intelligenz. Freie Universität Berlin, Computing Education Research Group. ISSN 3052-833X. https://computingeducation.de/proj-datacases/
Datenfallstudie 4: “Palmer-Pinguine”
Im Jahr 2014 hat Palmer Station in der Antarktis in Zusammenarbeit mit Kristen Gorman, Tony Williams und William Fraser 344 Pinguinen aus dem Palmer Archipel ausgemessen. In der Arbeit hat das Team unter anderem die Unterschiede im Aussehen zwischen Männchen und Weibchen untersucht. Die Daten haben sie in einem Datensatz veröffentlicht. Die Aufgabe der Schülerinnen und Schülern ist es, in die Fußstapfen des Forschungsteams zu treten und eine Klassifizierung in männlich und weiblich auf der Grundlage der Körpermaße vorzunehmen.
In dieser Datenfallstudie werden folgende Datenkonzepte und Datenpraktiken behandelt:
- Datenfluss
- Schritte des Datenlebenszyklus (Datenexploration, Datenvorbereitung, Erstellung eines Vorhersagemodells (Klassifikation))
Schülerinnen und Schüler lernen …
- … den Datenverarbeitungsprozess zu rekonstruieren.
- … die Ergebnisse der Rekonstruktion in Orange3 zu überprüfen.
- … die Schritte und Ergebnisse in fertigen Datenflüssen zu verbalisieren.
- … den Datenfluss kriteriengeleitet und dialogisch zu untersuchen.
Material
Gesamtdownload der Datenfallstudie
Im Ordner finden Sie:
- Beschreibung der problematischen Situation, die in das Materail eingebettet ist,
- einen realen Datensatz zur drei Pinguinarten auf den Inseln des Palmer-Archipels in der Antarktis inklusive Dokumentation,
- eine vollständig ausgearbeitete Datenanalyse in Form eines Datenflusses in Orange3,
- Arbeitsblätter mit Aufgaben und Lösungen,
- Legespiel Druckvorlage,
- Legespiel Erwartungshorizont
Durchführung
Planen Sie 60 bis 90 Minuten im Unterricht für die Arbeit an dieser Datenfallstudie ein. Die Lernprodukte sind das Spielfeld mit dem rekonstruierten Datenfluss sowie ein schriftliches Protokoll mit Erkenntnissen aus der Datenanalyse.
Olari, V., Lambert, L., Pfeiler, S., Dengg, J. & Romeike, R. (2025). Heft 4: Palmer-Pinguine und ihr Geschlecht. Version 1.0. In V. Olari & R. Romeike (Hrsg.), Data Cases: Datenfallstudien für den Informatikunterricht zum Thema Daten und Künstliche Intelligenz. Freie Universität Berlin, Computing Education Research Group. ISSN 3052-833X. https://computingeducation.de/proj-datacases/