martes, 24 de julio de 2018

Sobre la validez de las encuestas en Twitter

En base a varios intercambios en redes sobre la validez de las encuestas en Twitter, generé un artículo en el blog sobre el tema, y luego aproveché las votaciones que hizo la FIFA en esa red social para intentar explicar cómo el sesgo había dado un resultado tan favorabe a Uruguay.

Luego tuve la oportunidad de charlar sobre el tema en mi columna de Economía Digital, junto a la periodista Cris Richeri, en el programa "Hoy no es un día mas" por la 1410 AM.

Ahora fui invitado a escribir en el espacio Dínamo de la diaria, y publicaron este artículo sobre el tema como parte del ciclo "La democracia y el nuevo contexto digital":

Se acercan tiempos electorales y surgen una y otra vez encuestas en redes sociales virtuales, en especial en Twitter, preguntando por candidatos en las internas, preferencias entre grupos políticos y también posibles presidenciables entre partidos. La tentación es grande: son fáciles de implementar, se pueden obtener muchas respuestas de manera sencilla, los datos quedan visibles de inmediato, la herramienta es muy simple y está al alcance de todos. Pero ¿para qué sirven las encuestas en Twitter?

Este tipo de sondeos tiene múltiples limitaciones, pero las primeras que saltan de la vista son la cantidad de opciones que se pueden presentar (un máximo de cuatro) y la imposibilidad de presentar dichas opciones en un orden aleatorio.

Además, la política de Twitter respecto de las encuestas establece que cuando un usuario vota, su participación “no se muestra a otras personas: ni el creador de la encuesta ni los demás participantes pueden ver quién ha votado o cuál fue su voto”, lo cual es bueno en término de protección de la privacidad, pero hace imposible cualquier intento de análisis de los resultados obtenidos.

La clave en una encuesta, como instrumento de investigación descriptiva, está en determinar una muestra representativa y/o poder segmentar los resultados obtenidos, para hacer la extrapolación que permita brindar conclusiones sobre el universo analizado.

Las encuestas de Twitter son abiertas a cualquiera que las reciba y quiera participar, por lo que se hace imposible tener una muestra representativa, ya que no hay control sobre quienes responden. Algunos usuarios en las redes sostienen que si la cantidad de votos es un número “grande”, se puede inferir que la encuesta llegó a tener respuestas de personas muy diversas, traspasando los límites de los círculos de afinidad, y por lo tanto podría ser representativa de la comunidad de usuarios en Twitter. Pero si la encuesta no recibe el retuit de personas que sean referentes de distintos sectores de la sociedad para acceder a nuevos círculos de opinión, los resultados tendrán un sesgo importante relacionado al grupo de seguidores de su creador. Sin embargo, difícilmente se tenga control sobre el comportamiento de los usuarios de la red, y el análisis de comunidades virtuales en su vinculación a temas específicos no es nada sencillo de monitorear durante una acción de este tipo.

Aun si tuviéramos las respuestas de 100% de los usuarios uruguayos de Twitter, ¿sería representativa del total de la población del país? Por supuesto que no. Según los datos del Perfil del Internauta Uruguayo elaborado por Grupo Radar en 2017, Twitter sólo era utilizado por 17% de los usuarios de redes sociales, que a su vez son 85% de los usuarios de internet en Uruguay. Además, si analizamos a los usuarios de Twitter, seguramente exista cierta predominancia de algunos sectores de la sociedad (nivel socioeconómico, edad, educación, etcétera), por lo que también sería un resultado sesgado.

Finalmente, al no tener las características de quienes votaron, tampoco podemos saber qué grupos de personas respondieron las encuestas, a qué círculos de afinidad pertenecen (problema de sesgo) y lo que es aun peor: qué peso tienen los votos de usuarios falsos, personas con múltiples usuarios o acciones realizadas con cuentas automatizadas (bots).

Es importante tener presente que este tipo de funcionalidades en Twitter fueron creadas para generar interacción entre los usuarios (por ejemplo, a través del humor) y para desarrollar estrategias de marketing, pero no para hacer investigaciones científicas que posibiliten extraer conclusiones válidas.

Nada de lo anterior se debe confundir con técnicas estadísticas como las utilizadas para recoger respuestas por internet en una consulta online autoadministrada, en las que se obtienen datos sobre los individuos para corregir el sesgo natural de la muestra ponderando los resultados según la composición del universo, para lo cual generalmente se utiliza una encuesta tradicional.

Las encuestas requieren de una muestra representativa o una estrategia de segmentación posterior a los resultados, para poder extrapolar y aportar datos válidos. Nada de esto es factible de realizarse por medio de encuestas en Twitter. Es posible que, en tiempos electorales, las encuestas de este tipo en redes sociales virtuales tengan un objetivo de promoción más que de analizar las opiniones de la población. Ciertamente, el desconocimiento de las limitaciones de estas herramientas por parte de los usuarios puede llevar a decisiones influenciadas por información sesgada y sin respaldo científico.

[Artículo publicado en la diaria, 24/07/2018]
.
.