martes, 26 de febrero de 2019

A Quién Voto? Un modelo predictivo

En los últimos días se habló mucho en redes sociales sobre la web http://aquienvoto.uy y mucha gente no está entendiendo su funcionamiento, por lo que me pareció importante escuchar a su principal creador (Juan Pablo Blanco) y realizar algunos comentarios que ayuden a la reflexión sobre el tema.

Aqui se lo puede escuchar responder las siguientes preguntas:
  • ¿Cómo y por qué se creó AQuienVoto?
  • ¿Cómo elaboraron las preguntas que se utilizan para el análisis?
  • ¿Tienen especial interés en el comportamiento electoral o fue sólo un caso de uso de la herramienta?
  • ¿Creen que la gente ha entendido qué hace y cómo funciona AQuienVoto?
  • ¿Con cuántos datos comenzaron y cuántos datos tienen actualmente? ¿Tienen registro de cuántas veces se ha utilizado la herramienta?

Lo primero que hay que explicar es que esta herramienta no trabaja con el análisis de los discursos de los candidatos, sino con la relación entre las respuestas de las personas y sus preferencias.

Así que "no es un motor de recomendación", sino que muestra a quiénes vota otra gente que respondió parecido”. No importa el “significado” de las respuestas, como bien decía Daniel Carranza. Al no ser predicción electoral y no pretender estimar el comportamiento de la población en general la cantidad de respuestas por candidato no es relevante. Sólo se busca estimar la preferencia individual a partir de opiniones de semejantes.

Es un modelo predictivo en base a respuestas anteriores, por lo que la calidad del resultado en las primeras horas depende de los datos con los que fue entrenado.

Si el modelo fue entrenado con respuestas "falsas" o "sesgadas", dará inicialmente datos equivocados, pero a medida que la gente lo usa y al final declara su candidato, el modelo se ajusta (aprende).

Es importante destacar que la herramienta se desarrolló de manera colaborativa y con softwarede código libre: ¿qué significa esto?

Básicamente cualquier persona con conocimientos de programación puede analizar el código y saber cómo funciona. Por lo que los riesgos de trampa, campaña o robo de datos son minimizados por el control social.

La herramienta es tan buena como lo es la comunidad que la desarrolla... así que puede haber errores y sesgos, pero cuánta más gente se involucre, mejor funcionará.

En el poco tiempo que ha pasado desde su lanzamiento, varios referentes en temas de política, democracia y sociedad han señalado algunos problemas con las afirmaciones usadas, las categorías y su significancia para el análisis del comportamiento electoral.

En los modelos predictivos es necesario encontrar una verdadera correlación, y si las afirmaciones usadas para modelar no funcionan hay que corregir la herramienta para que sea efectiva.Está bueno que esta experiencia haya sucedido, pues es novedoso y dispara muchos análisis e intereses nuevos.

Los periodistas que aborden esto en los medios deberían buscar referentes en las áreas de: ciudadanía digital, inteligencia artificial, modelos estadísticos, ciencia de datos, ciencia política y comportamiento de usuarios en redes sociales, si de verdad quieren entender el tema.

En estos días estuvo la robot Sophia en un evento en Punta del Este, y se habló mucho de su "inteligencia artificial", pero lo que más se hace con inteligencia artificiar es justamente clasificar, y no "pensar", ni "decidir". Por lo que quizás la principal queja que tengo con esta web es cómo ha comunicado su funcionamiento y objetivos.

El algoritmo que usa http://aquienvoto.uy “aprende” porque se nutre de respuestas anteriores, pero no ajusta parámetros del modelo como consecuencia, algo que sí haría una herramienta de Machine Learning con cosas como tensor flow. Tiene poco de Machine Learning y está más en el ámbito de la estadística tradicional usando el método de clasificación k-nn.

Las personas que sepan de programación y que estén interesadas en el tema pueden sumarse al proyecto en github para revisar, aprender y aportar.

[Sobre esto conversamos hoy en mi columna de Economía Digital en la 1410 AM]
.
.

No hay comentarios:

Publicar un comentario