GESIS - for a research-based infrastructure
Research output at GESIS
- Watteler, Oliver, Constantin Hammer, and Heidi Schuster. 2024. "'Berechtigtes Interesse' als Rechtsgrundlage für die Erhebung und Archivierung von Social Media Daten." Nachhaltige Archivierung sozialer Medien - Twitter und danach, Deutsche Nationalbibliothek, Frankfurt a.M., 2024-03-20. doi: https://doi.org/10.5281/zenodo.11030035.
- Quandt, Markus, and Peter Schmidt. 2024. "Introduction to the special issue of the International Journal of Comparative Sociology on “National identity, nationalism, patriotism, and globalization”." International Journal of Comparative Sociology 2024 (65, 2): 101-111. doi: https://doi.org/10.1177/00207152241232577.
- Daikeler, Jessica, Leon Fröhling, Indira Sen, Lukas Birkenmaier, Tobias Gummer, Jan Schwalbach, Henning Silber, Bernd Weiß, Katrin Weller, and Clemens Lechner. 2024. "Assessing Data Quality in the Age of Digital Social Research: A Systematic Review." Social Science Computer Review. doi: https://doi.org/10.1177/08944393241245395.
- Behr, Dorothée, Michael Braun, and Luisa Aiglstorfer. 2024. "Showcasing the usefulness of web probing: Do Subtle Variations in Questionnaire Translation Lead to Different Survey Responding?" Quality & Quantity online first. doi: https://doi.org/10.1007/s11135-024-01843-8.
- Singh, Ranjit K., Cornelia Neuert, and Tenko Raykov. 2023. "Assessing conceptual comparability of single-item survey instruments with a mixed-methods approach." Quality & Quantity online first. doi: https://doi.org/10.1007/s11135-023-01801-w.
- Sen, Indira, Dennis Assenmacher, Mattia Samory, Isabelle Augenstein, Wil van der Aalst, and Claudia Wagner. 2023. "People Make Better Edits: Measuring the Efficacy of LLM-Generated Counterfactually Augmented Data for Harmful Language Detection." 2023. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, EMNLP, edited by Houda Bouamor, Juan Pino, and Kalika Bali, 10480-10504. Singapore: Association for Computational Linguistics.
- Dahou, Abdelhalim Hafedh, Mohamed Amine Cheragui, and Ahmed Abdelali. 2023. "Performance Analysis of Arabic Pre-Trained Models on Named Entity Recognition Task." In Proceedings of the 14th International Conference on Recent Advances in Natural Language Processing, edited by Ruslan Mitkov, and Galia Angelova, 458–467. Shoumen: INCOMA Ltd.. https://aclanthology.org/2023.ranlp-1.51.pdf.
- Diera, Andor, Abdelhalim Hafedh Dahou, Lukas Galke, Fabian Karl, Florian Sihler, and Ansgar Scherp. 2023. GenCodeSearchNet: A Benchmark Test Suite for Evaluating Generalization in Programming Language Understanding. Proceedings of the 1st GenBench Workshop on (Benchmarking) Generalisation in NLP. Association for Computational Linguistics (ACL). doi: https://doi.org/10.18653/v1/2023.genbench-1.2.
- Dahou, Abdelhalim Hafedh, and Brigitte Mathiak. 2023. "Subject Classification of Software Repository." In Proceedings of the 15th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KDIR, 1, 30-38. SciTePress. doi: https://doi.org/10.5220/0012159600003598.
- Lietz, Haiko, Mohsen Jadidi, Daniel Kostic, Milena Tsvetkova, and Claudia Wagner. 2024. "Individual and gender inequality in computer science: A career study of cohorts from 1970 to 2000." Quantitative Science Studies online first 1-24. doi: https://doi.org/10.1162/qss_a_00283.
Ein wesentliches Merkmal von GESIS ist, dass das Institut insbesondere bei den Daten, für die es auch die Erhebung verantwortet, sehr hohe Ansprüche und Standards an die Qualität der bereitge- stellten Daten anlegt. Daher ist es für GESIS zentral, eigene Beiträge zur Untersuchung und Verbes- serung von Aspekten der Datenqualität zu leisten. Die Forschung in den GESIS-Forschungsbereichen trägt deshalb direkt zum Schwerpunkt Datenqualität bei. Dies betrifft sowohl Umfragedaten als auch digitale Verhaltensdaten und relevante Metadaten. Datenqualität umfasst Aspekte der (a) Kor- rektheit und Repräsentativität von Daten und (b) Nutzbarkeit und FAIRness von Daten. Beispiele für (a) sind die Vollständigkeit, Korrektheit, Provenienz der Repräsentativität von Daten, während (b) Aspekte wie Findbarkeit, Qualität der Dokumentation, Aufbereitung oder die Interoperabilität von Daten und Metadaten berücksichtigt. Damit wird eine wichtige Voraussetzung dafür erfüllt, dass die Bearbeitung inhaltlicher Fragestel- lungen (Substantive Research) auf Basis dieser Daten zu validen Ergebnissen führt.