Meta-Information des Samples der Media-Analyse Daten: IntermediaPlus (2014-2016)

DOI

Bei dem aufbereiteten Längsschnitt-Datensatzes 2014 bis 2016 handelt es sich um „Big-Data“, weshalb der Gesamtdatensatz nur in Form einer Datenbank (MySQL) verfügbar sein wird. In dieser Datenbank liegt die Information verschiedener Variablen eines Befragten untereinander. Die vorliegende Publikation umfasst eine SQL-Datenbank mit den Meta-Daten des Sample des Gesamtdatensatzes , das einen Ausschnitt der verfügbaren Variablen des Gesamtdatensatzes darstellt und die Struktur der aufbereiteten Daten darlegen soll, und eine Datendokumentation des Samples. Für diesen Zweck beinhaltet das Sample alle Variablen der Soziodemographie, dem Freizeitverhalten, der Zusatzinformation zu einem Befragten und dessen Haushalt sowie den interviewspezifischen Variablen und Gewichte. Lediglich bei den Variablen bezüglich der Mediennutzung des Befragten, handelt es sich um eine kleine Auswahl: Für die Onlinemediennutzung wurden die Variablen aller Gesamtangebote sowie der Einzelangebote der Genre Politik und Digital aufgenommen. Die Mediennutzung von Radio, Print und TV wurde im Sample nicht berücksichtigt, da deren Struktur anhand der veröffentlichten Längsschnittdaten der Media-Analyse MA Radio, MA Pressemedien und MA Intermedia nachvollzogen werden kann. Die Datenbank mit den tatsächlichen Befragungsdaten wäre auf Grund der Größe des Datenmaterials bereits im kritischen Bereich der Dateigröße für den normalen Up- und Download. Die tatsächlichen Befragungsergebnisse, die zur Analyse nötig sind, werden dann 2021 in Form des Gesamtdatensatzes der Media-Analyse-Daten: IntermediaPlus (2014-2016) im DBK bei GESIS veröffentlicht werden. Die Daten sowie deren Datenaufbereitung sind ein Vorschlag eines Best-Practice Cases für Big-Data Management bzw. den Umgang mit Big-Data in den Sozialwissenschaften und mit sozialwissenschaftlichen Daten. Unter Verwendung der GESIS Software CharmStats, die im Rahmen dieses Projektes um Big-Data Features erweitert wurde, erfolgt die Dokumentation und Herstellung der Transparenz der Harmonisierungsarbeit. Durch ein Python-Skript sowie ein html-Template wurde der Arbeitsprozess um und mit CharmStats zudem stärker automatisiert. Der aufbereitete Längsschnitt des Gesamtdatensatzes der MA IntermediaPlus für 2014 bis 2016 wird 2021 in Kooperation mit GESIS herausgegeben werden und den FAIR-Prinzipien (Wilkinson et al. 2016) entsprechend verfügbar gemacht werden. Ziel ist es durch die Harmonisierung der einzelnen Querschnitte die Datenquelle der Media-Analyse, die im Rahmen des Dissertationsprojektes „Angebots- und Publikumsfragmentierung online“ durch Inga Brentel und Céline Fabienne Kampes erfolgt, für Forschung zum sozialen und medialen Wandel in der Bundesrepublik Deutschland zugänglich zu machen. Künftige Studiennummer des Gesamtdatensatzes der IndermediaPlus im DBK der GESIS: ZA5769 (Version 1-0-0) und der doi: https://dx.doi.org/10.4232/1.13530 **English Version** The prepared Longitudinal IntermediaPlus dataset 2014 to 2016 is a "big data", which is why the entire dataset will only be available in the form of a database (MySQL). In this database, the information of different variables of a respondent is organized in one column, one below the other. The present publication includes a SQL-Database with the meta data of a sample of the full database , which represents a section of the available variables of the total data set and is intended to show the structure of the prepared data and the data-documentation (codebook) of the sample. For this purpose, the sample contains all variables of sociodemography, free-time activities, additional information on a respondent and his household as well as the interview-specific variables and weights. Only the variables concerning the respondent's media use are a small selection: For online media use, the variables of all overall offerings as well as the individual offerings of the genres politics and digital were included. The media use of radio, print and TV was not included in the sample because its structure can be traced using the published longitudinal data of the media analysis MA Radio, MA Pressemedien and MA Intermedia. Due to the size of the datafile, the database with the actual survey data would already be in the critical range of the file size for the common upload and download. The actual survey results required for analysis will be published in 2021 in the form of the total dataset of the Longitudinal IntermediaPlus (2014-2016) dataset at the GESIS DBK. The data as well as their data preparation are a proposal for a best practice case for big-data management and/or the handling of big data in the social sciences and with social science data. Using the GESIS software CharmStats, which was extended by big-data features within this project, the documentation and creation of transparency of the harmonization work is carried out. A Python script and an html template have been used to automate the workflow with and within CharmStats. The full dataset of the Longitudinal IntermediaPlus for 2014 to 2016 will be published in 2021 in cooperation with GESIS and made available in accordance with the FAIR principles (Wilkinson et al. 2016). By harmonizing and pooling the cross-sectional datasets to one longitudinal dataset – which is being carried out by Inga Brentel and Céline Fabienne Kampes as part of the dissertation project "Audience and Market Fragmentation online" –, the aim is to make the data source of the media analysis, accessible for research on social and media change in the Federal Republic of Germany. The future study number of full the Longitudinal IntermediaPlus (2014-2016) dataset at the GESIS DBK will be: ZA5769 (Version 1.0.0) and doi: https://dx.doi.org/10.4232/1.13530

Identifier
DOI https://doi.org/10.7802/2030
Source https://search.gesis.org/research_data/SDN-10.7802-2030?lang=de
Metadata Access https://datacatalogue.cessda.eu/oai-pmh/v0/oai?verb=GetRecord&metadataPrefix=oai_ddi25&identifier=70d27eaa54ad0f26754c2077e11651c9fbde7afb0d393f250778260d30613995
Provenance
Creator Brentel, Inga; Kampes, Céline Fabienne; Jandura, Olaf
Publisher GESIS Data Archive for the Social Sciences; GESIS Datenarchiv für Sozialwissenschaften
Publication Year 2020
Funding Reference [Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen, Forschungsverbund Digitale Gesellschaft NRW]
Rights Free access (with registration) - The research data can be downloaded by registered users. CC BY-NC-SA 4.0: Attribution - NonCommercial – ShareAlike (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.de); Freier Zugang (mit Registrierung) - Die Forschungsdaten können von allen registrierten Nutzerinnen und Nutzern heruntergeladen werden. CC BY-NC-SA 4.0: Attribution - NonCommercial – ShareAlike (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.de)
OpenAccess true
Contact http://www.gesis.org/
Representation
Discipline Social Sciences
Spatial Coverage Germany; Germany