Construction of corpus in digital environments
Mixed strategies for studying political communication on X
DOI:
https://doi.org/10.29105/gmjmx23.44-556Keywords:
corpus construction, data representativeness, algorithmic bias, digital etnography, hashtagsAbstract
The analysis of sociodigital environments in the field of political communication presents particular challenges, derived both from the speed at which information circulates and from the vast amount of data produced on platforms such as X (formerly Twitter). This article develops a methodological reflection on the production and configuration of political subjectivities around the Ayotzinapa case and its relationship with the X platform in order to illustrate how an analytical corpus was constructed. Based on a mixed methodological strategy that combines digital ethnography with data extraction from the platform, the article discusses the delimitation criteria followed to configure the corpus: thematic relevance, event temporality, and the selection of hashtags linked to protest and public denunciation. It also reviews three common methodological approaches to corpus construction in sociodigital platforms —case studies, the reuse of samples from previous research, and convenience sampling— in order to contrast them with the strategy adopted in this study. In doing so, the text contributes to ongoing reflections on the methodological challenges of research in digital political communication and provides a roadmap for analyzing interactions and discourses in digital environments.
Downloads
References
Ardila Suárez, E., & Rueda Arenas, J. (2013). La saturación teórica en la teoría fundamentada: su delimitación en el análisis de trayectorias de vida de víctimas del desplazamiento forzado en Colombia. Revista Colombiana de Sociología, 36(2), 93-114. https://www.redalyc.org/pdf/5515/551556228007.pdf
Bárcenas Barajas, K. y Preza Carreño, N. (2019). Desafíos de la etnografía digital en el trabajo de campo onlife. Virtualis. Revista de cultura digital, 10(18), 134-15. https://doi.org/10.2123/virtualis.v10i18.287
Bonilla, L. (2022). Claves para analizar datos en Twitter. Recolección y procesamiento de corpus. Cuadernos de Lingüística Hispánica, (39), 1-21. https://doi.org/10.19053/0121053X.n39.2022.14283
Bustamante-Farías, Ó. D. (2014). Mediatización de la protesta: la activación digital como modalidad de comunicación política. Viaje al centro del movimiento estudiantil 2011 en Chile [Tesis doctoral]. Instituto Tecnológico y de Estudios Superiores de Occidente. http://hdl.handle.net/11117/1270
de la Garza Toledo, E. (2012). Grounded theory. Cantidad, Calidad y comprensión de significados. In E. de la Garza Toledo, & G. Leyva (Eds.), Tratado de metodología de las ciencias sociales: perspectivas actuales (pp. 397-419). Fondo de Cultura Económica, Universidad Autónoma Metropolitana.
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la investigación. McGraw-Hill.
Hernández-Leal, N., Duque-Méndez, N., & Moreno-Cadavid, J. (2017). Big Data: una exploración de investigaciones, tecnologías y casos de aplicación. TecnoLógicas, 20(39). https://doi.org/10.22430/22565337.685
Otzen, T., & Manterola, C. (2017). Técnicas de muestreo sobre una población a estudio. International Journal of Morphology, 35(1), 227-232. https://intjmorphol.com/es/resumen/?art_id=4049
Pattier, D. (2024). ¿Callejón sin salida?: El problema muestral en el estudio de las redes sociales digitales. Comunicación y Sociedad, 21, e8580, 1-23. https://doi.org/10.32870/cys.v2024.8580
Rodríguez Cano, C. A. (2022). Hipermétodos. Repertorios de la investigación social en entornos digitales. Universidad Autónoma Metropolitana, Unidad Cuajimalpa. http://dccd.cua.uam.mx/libros/investigacion/HIPERMETODOS%202022%20Digital.pdf
Rovira-Sancho, G., & Morales-i-Gras, J. (2023). Femitags in the networks and in the streets: 50 hashtags for feminist activism in Latin America. Profesional de la Información, 32(3), e320319. https://doi.org/10.3145/epi.2023.may.19
Taraborrelli, D., & Sokil, J. P. (2021). Twitter: la construcción de un corpus de trabajo [Ponencia]. XIV Jornadas de Sociología, Facultad de Ciencias Sociales, Universidad de Buenos Aires. https://cdsa.aacademica.org/000-074/59
Zires, M. (2014). Violencia, redes sociales y procesos de subjetivación política. El caso de #verfollow en Veracruz, México. Argumentos. Estudios Críticos de la Sociedad, (75), 119-146. https://argumentos.xoc.uam.mx/index.php/argumentos/article/view/165
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Global Media Journal México

This work is licensed under a Creative Commons Attribution 4.0 International License.
Global Media Journal México, publicación semestral, editada por el Departamento de Psicología y Comunicación de Texas A&M International University, Laredo, Texas, Estados Unidos; y la Facultad de Ciencias de la Comunicación de la Universidad Autónoma de Nuevo León, México. Editores responsables: Dr. José Carlos Lozano y Dr. Francisco Javier Martínez Garza. Datos de contactos: jose.lozano@tamiu.edu, tel. (956) 326-3117 y francisco.martinezgz@uanl.edu.mx, teléfono (81) 83294000, Ext. 7710 y 7711. Reserva de derechos al uso exclusivo número 04 – 2017- 080814012900- 203, expedido por la Dirección de Reservas de Derechos del Instituto Nacional del Derecho de Autor. ISSN: 2007-2031. El editor no necesariamente comparte el contenido de los artículos, ya que son responsabilidad exclusiva de los autores. Se prohíbe la reproducción total o parcial del contenido, ilustraciones y textos publicados en este número sin la previa autorización que por escrito emita el editor.




