Abstract
Die Sammlung kleiner bis mittelgroßer Lernerkorpora in PORTA (https://www.porta.eurac.edu/) bildet schriftsprachliche Praktiken in Bildungskontexten, überwiegend aus Südtirol (Italien), ab. Während der Ursprung der Daten einigermaßen homogen ist, zeugen andere Merkmale von großer Heterogenität. So beinhaltet das Lernerkorpusportal etwa Daten aus synchronen Erhebungen genauso wie echte Longitudinaldaten, Korpora in einzelnen Zielsprachen (v. a. Deutsch und Italienisch) genauso wie echte Mehrsprachigkeitskorpora. Weiterhin unterscheiden sich die Korpora in Bezug auf Textgenre, Aufgabenstellung, Erhebungszeitpunkt, Alter und Erstsprachen der Lernenden (vgl. Abel et al. 2014, Glaznieks et al. 2022, Glaznieks et al. 2023)
Die Design- und Entwicklungspraxis der Lernerkorpora von PORTA hat sich über die Jahre an die sozialen Veränderungen und bildungspolitischen Realitäten der mehrsprachigen Gesellschaft Südtirols angepasst. Dennoch sollten die einzelnen Korpora vergleichbar gehalten werden. Dazu wurden die Datenerfassung standardisiert (vgl. zu Metadaten Paquot et al. 2024) sowie Workflows und Formate vereinheitlicht (vgl. Glaznieks et al. 2014, Frey, J.-C., König, A., & Fišer 2020). Dies ermöglicht es, Analysen auch über die Grenzen von Einzelkorpora hinweg durchzuführen, einerseits in Bezug auf den spezifischen Kontext Südtirol, aus dem der Großteil der Daten stammt, andererseits in Bezug auf allgemeinere Fragestellungen im Bereich der Lernerkorpusforschung. So ist es beispielsweise möglich, auf die Korpussammlung zur Erforschung und Beschreibung von Merkmalen der bildungsweltlichen Südtiroler Sprachlandschaft zurückzugreifen, für die insgesamt eine relativ hohe Datendichte vorliegt (vgl. Glaznieks, Frey & Abel 2023). Darüber hinaus können vergleichbare Korpora aus der Sammlung zusammengenommen als größere Datenbasis zur quantitativen Analyse von Spracherwerbsprozessen herangezogen werden (vgl. Spina, Glaznieks & Abel 2025).
Im Vortrag stellen wir das Lernerkorpusportal PORTA vor und argumentieren anhand konkreter Beispiele, dass eine (große) Sammlung kleiner bis mittelgroßer Korpora (vgl. Gilquin 2021) ähnlich leistungsstark wie ein großes Lernerkorpus sein kann, zeigen aber auch Grenzen auf.