Construction of corpus in digital environments

Mixed strategies for studying political communication on X

Authors

DOI:

https://doi.org/10.29105/gmjmx23.44-556

Keywords:

corpus construction, data representativeness, algorithmic bias, digital etnography, hashtags

Abstract

The analysis of sociodigital environments in the field of political communication presents particular challenges, derived both from the speed at which information circulates and from the vast amount of data produced on platforms such as X (formerly Twitter). This article develops a methodological reflection on the production and configuration of political subjectivities around the Ayotzinapa case and its relationship with the X platform in order to illustrate how an analytical corpus was constructed. Based on a mixed methodological strategy that combines digital ethnography with data extraction from the platform, the article discusses the delimitation criteria followed to configure the corpus: thematic relevance, event temporality, and the selection of hashtags linked to protest and public denunciation. It also reviews three common methodological approaches to corpus construction in sociodigital platforms —case studies, the reuse of samples from previous research, and convenience sampling— in order to contrast them with the strategy adopted in this study. In doing so, the text contributes to ongoing reflections on the methodological challenges of research in digital political communication and provides a roadmap for analyzing interactions and discourses in digital environments.

Downloads

Download data is not yet available.

References

Ardila Suárez, E., & Rueda Arenas, J. (2013). La saturación teórica en la teoría fundamentada: su delimitación en el análisis de trayectorias de vida de víctimas del desplazamiento forzado en Colombia. Revista Colombiana de Sociología, 36(2), 93-114. https://www.redalyc.org/pdf/5515/551556228007.pdf

Bárcenas Barajas, K. y Preza Carreño, N. (2019). Desafíos de la etnografía digital en el trabajo de campo onlife. Virtualis. Revista de cultura digital, 10(18), 134-15. https://doi.org/10.2123/virtualis.v10i18.287

Bonilla, L. (2022). Claves para analizar datos en Twitter. Recolección y procesamiento de corpus. Cuadernos de Lingüística Hispánica, (39), 1-21. https://doi.org/10.19053/0121053X.n39.2022.14283

Bustamante-Farías, Ó. D. (2014). Mediatización de la protesta: la activación digital como modalidad de comunicación política. Viaje al centro del movimiento estudiantil 2011 en Chile [Tesis doctoral]. Instituto Tecnológico y de Estudios Superiores de Occidente. http://hdl.handle.net/11117/1270

de la Garza Toledo, E. (2012). Grounded theory. Cantidad, Calidad y comprensión de significados. In E. de la Garza Toledo, & G. Leyva (Eds.), Tratado de metodología de las ciencias sociales: perspectivas actuales (pp. 397-419). Fondo de Cultura Económica, Universidad Autónoma Metropolitana.

Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la investigación. McGraw-Hill.

Hernández-Leal, N., Duque-Méndez, N., & Moreno-Cadavid, J. (2017). Big Data: una exploración de investigaciones, tecnologías y casos de aplicación. TecnoLógicas, 20(39). https://doi.org/10.22430/22565337.685

Otzen, T., & Manterola, C. (2017). Técnicas de muestreo sobre una población a estudio. International Journal of Morphology, 35(1), 227-232. https://intjmorphol.com/es/resumen/?art_id=4049

Pattier, D. (2024). ¿Callejón sin salida?: El problema muestral en el estudio de las redes sociales digitales. Comunicación y Sociedad, 21, e8580, 1-23. https://doi.org/10.32870/cys.v2024.8580

Rodríguez Cano, C. A. (2022). Hipermétodos. Repertorios de la investigación social en entornos digitales. Universidad Autónoma Metropolitana, Unidad Cuajimalpa. http://dccd.cua.uam.mx/libros/investigacion/HIPERMETODOS%202022%20Digital.pdf

Rovira-Sancho, G., & Morales-i-Gras, J. (2023). Femitags in the networks and in the streets: 50 hashtags for feminist activism in Latin America. Profesional de la Información, 32(3), e320319. https://doi.org/10.3145/epi.2023.may.19

Taraborrelli, D., & Sokil, J. P. (2021). Twitter: la construcción de un corpus de trabajo [Ponencia]. XIV Jornadas de Sociología, Facultad de Ciencias Sociales, Universidad de Buenos Aires. https://cdsa.aacademica.org/000-074/59

Zires, M. (2014). Violencia, redes sociales y procesos de subjetivación política. El caso de #verfollow en Veracruz, México. Argumentos. Estudios Críticos de la Sociedad, (75), 119-146. https://argumentos.xoc.uam.mx/index.php/argumentos/article/view/165

Published

2026-01-30

How to Cite

Pérez Reséndiz, E. (2026). Construction of corpus in digital environments: Mixed strategies for studying political communication on X. Global Media Journal México, 23(44), 81–98. https://doi.org/10.29105/gmjmx23.44-556