martes, 26 de febrero de 2019

A Quién Voto? Un modelo predictivo

En los últimos días se habló mucho en redes sociales sobre la web http://aquienvoto.uy y mucha gente no está entendiendo su funcionamiento, por lo que me pareció importante escuchar a su principal creador (Juan Pablo Blanco) y realizar algunos comentarios que ayuden a la reflexión sobre el tema.

Aqui se lo puede escuchar responder las siguientes preguntas:
  • ¿Cómo y por qué se creó AQuienVoto?
  • ¿Cómo elaboraron las preguntas que se utilizan para el análisis?
  • ¿Tienen especial interés en el comportamiento electoral o fue sólo un caso de uso de la herramienta?
  • ¿Creen que la gente ha entendido qué hace y cómo funciona AQuienVoto?
  • ¿Con cuántos datos comenzaron y cuántos datos tienen actualmente? ¿Tienen registro de cuántas veces se ha utilizado la herramienta?

Lo primero que hay que explicar es que esta herramienta no trabaja con el análisis de los discursos de los candidatos, sino con la relación entre las respuestas de las personas y sus preferencias.

Así que "no es un motor de recomendación", sino que muestra a quiénes vota otra gente que respondió parecido”. No importa el “significado” de las respuestas, como bien decía Daniel Carranza. Al no ser predicción electoral y no pretender estimar el comportamiento de la población en general la cantidad de respuestas por candidato no es relevante. Sólo se busca estimar la preferencia individual a partir de opiniones de semejantes.

Es un modelo predictivo en base a respuestas anteriores, por lo que la calidad del resultado en las primeras horas depende de los datos con los que fue entrenado.

Si el modelo fue entrenado con respuestas "falsas" o "sesgadas", dará inicialmente datos equivocados, pero a medida que la gente lo usa y al final declara su candidato, el modelo se ajusta (aprende).

Es importante destacar que la herramienta se desarrolló de manera colaborativa y con softwarede código libre: ¿qué significa esto?

Básicamente cualquier persona con conocimientos de programación puede analizar el código y saber cómo funciona. Por lo que los riesgos de trampa, campaña o robo de datos son minimizados por el control social.

La herramienta es tan buena como lo es la comunidad que la desarrolla... así que puede haber errores y sesgos, pero cuánta más gente se involucre, mejor funcionará.

En el poco tiempo que ha pasado desde su lanzamiento, varios referentes en temas de política, democracia y sociedad han señalado algunos problemas con las afirmaciones usadas, las categorías y su significancia para el análisis del comportamiento electoral.

En los modelos predictivos es necesario encontrar una verdadera correlación, y si las afirmaciones usadas para modelar no funcionan hay que corregir la herramienta para que sea efectiva.Está bueno que esta experiencia haya sucedido, pues es novedoso y dispara muchos análisis e intereses nuevos.

Los periodistas que aborden esto en los medios deberían buscar referentes en las áreas de: ciudadanía digital, inteligencia artificial, modelos estadísticos, ciencia de datos, ciencia política y comportamiento de usuarios en redes sociales, si de verdad quieren entender el tema.

En estos días estuvo la robot Sophia en un evento en Punta del Este, y se habló mucho de su "inteligencia artificial", pero lo que más se hace con inteligencia artificiar es justamente clasificar, y no "pensar", ni "decidir". Por lo que quizás la principal queja que tengo con esta web es cómo ha comunicado su funcionamiento y objetivos.

El algoritmo que usa http://aquienvoto.uy “aprende” porque se nutre de respuestas anteriores, pero no ajusta parámetros del modelo como consecuencia, algo que sí haría una herramienta de Machine Learning con cosas como tensor flow. Tiene poco de Machine Learning y está más en el ámbito de la estadística tradicional usando el método de clasificación k-nn.

Las personas que sepan de programación y que estén interesadas en el tema pueden sumarse al proyecto en github para revisar, aprender y aportar.

[Sobre esto conversamos hoy en mi columna de Economía Digital en la 1410 AM]
.
.

martes, 19 de febrero de 2019

TIC y Partidos Políticos en 2015-2020 (FA)

Como analizamos previamente el Programa de Gobierno del Frente Amplio para el período 2015-2020 hacía énfasis en los siguientes ítems, asociados a la Economía Digital:

INNOVACIÓN (75 menciones)
TECNOLOGIA (63 menciones)
INVESTIGACIÓN (62 menciones)
CIENCIA (24 menciones)
SOFTWARE (10 menciones)
TIC (7 menciones)
CEIBAL (6 menciones)
Otros Temas (15 menciones)

El documento está estructurado en 7 capítulos
i Visión de Desarrollo
ii País Productivo, sustentable e innovador
iii Desarrollo y distribución
iv Sustentabilidad
v Igualdad y Derechos (educación)
vi Estado y Sociedad
vii Inserción Internacional

En todos los capítulos se incorporan temas de la economía digital en mayor o menor medida, pero en particular se hace mayor énfasis en relación a la visión de desarrollo, la innovación, el impacto en los sectores prioritarios (agro, industria, minería y turismo), como infraestructura clave y en lo que tiene que ver con la sustentabilidad.

El Frente Amplio hace hincapié en el desarrollo asociado a los sectores con mayor potencial de incorporación de tecnología y puestos de trabajo de mayor calidad. Se propone priorizar aquellos sectores donde la agregación de tecnología sea posible en toda la cadena de valor, de manera de capturar el valor generado en el país.

Para ello se propone la articulación de ciencia y tecnología, con especial atención al uso de tecnología para el desarrollo sustentable, las energías limpias y la eficiencia energética.

Se señala la importancia de las redes de investigación, y la cooperación entre académicos y los saberes acumulados de trabajadores. También se menciona el Sistema de Innovación, Ciencia y Tecnología con participación de actores como ANII, CONICYT, Instituto Pasteur, y Cudim, los Parques Tecnológicos y la exoneración de impuestos para actividades de I+D.

En la articulación de la ciencia y la tecnología con el aparato productivo, por ejemplo se indica la necesidad de innovación en el agro y en el sector audiovisual (también hace referencia a la TVdigital).

En cuanto al uso de tecnología en la gestión pública, prioriza la atención al público, facturación, resolución de reclamos y aseguramiento de datos, por lo que señala la importancia de los trámites on line.

Pero también señala la necesidad de desarrollar una política de software y normativa para computación en la nube, con prioridad para el uso de software libre en el Estado, para asegurar la soberanía tecnológica y racionalización de recursos.

Hay referencias a la necesidad de leyes de protección de derechos, en particular el acceso a datos personales.

Finalmente destaco la mención a la tecnología para la educación, a través del Plan Ceibal, un programa para adultos mayores (que luego se conoció como Ibirapitá) y la alfabetización digital, a través de los Centros MEC.

En la misma línea y asociado también al desarrollo productivo, se señala la importancia de la conectividad, tanto en relación al cable submarino, como a la fibra óptica en los hogares.

[Este análisis se presentó el 19/02/2019 en 1410 AM]
.
.

martes, 12 de febrero de 2019

TIC en Programas de Gobierno 2015-2020


El trabajo realizado consistió en analizar los Programas de Gobierno que los cinco partidos políticos que obtuvieron representación parlamentaria (Frente Amplio, Partido Nacional, Partido Colorado, Partido Independiente y Asamblea Popular) presentaron a la Corte Electoral para el período 2015-2020.

Los términos buscados fueron los siguientes: TIC, TECNOLOGIA, INFORMÁTICA, SOFTWARE, DIGITAL, ON LINE, PLATAFORMAS, CIENCIA, INNOVACIÓN, INVESTIGACIÓN, DATOS ABIERTOS, CEIBAL, CONECTIVIDAD, TELETRABAJO y NEUTRALIDAD, de acuerdo a las áreas identificadas como relevantes para el análisis (ver esta primer entrada en el blog sobre el tema).

De este grupo elegido, las palabras con mayor cantidad de menciones son: Ciencia, Tecnología, Investigación e Innovación. Todos los partidos mencionan los cuatro términos en sus programas de gobierno.

El único término de búsqueda que no arrojó resultados en ninguno de los programas de gobierno, fue "datos abiertos", sólo el Partido Nacional tiene menciones relacionadas al concepto de "neutralidad", pero en el resto de los temas aparecen en el menos dos de los programas de los partidos.

Los programas de gobierno son diferentes en cuanto a la extensión de su contenido (FA 158, PN 647, PC 352, PI 128, AP 41 páginas), por lo que para expresar gráficamente los resultados y realizar comparaciones se utilizó una ponderación en cada caso de acuerdo a la cantidad total de palabras en cada documento (FA 70.431, PN 190.559, PC 112.346, PI 37.300, AP 18.159 palabras).

Si analizamos las 4 áreas más mencionadas (gráfico 1) se destaca el énfasis del Partido Nacional en "ciencia", del Partido Colorado en "Tecnología" y del Frente Amplio en "Innovación", siendo muy similares el Partido Colorado y el Frente Amplio en "Investigación".

Gráfico 1
En el caso del Frente Amplio la cantidad de menciones son similares en Innovación (75), Tecnología (63) e Investigación (62) , y en menor medida Ciencia (24), en un total de 70.431 palabras.

El Partido Nacional pone foco en Ciencia (477), seguida de Tecnología (143) e Investigación (106), quedando en último lugar del grupo: Innovación (51), entre las 190.559 palabras utilizadas.

Para el Partido Colorado la mayor cantidad de menciones son de Tecnología (155) e Investigación (120), luego aparecen Ciencia (95) e Innovación (60), dentro de las 112.346 palabras de su programa de gobierno.

El Partido Independiente, con su documento de 37.300, prioriza Tecnología (24) e Innovación (17), y luego aparecen Investigación (6) y Ciencia (1).

Finalmente el breve programa de gobierno de Asamblea Popular (18.159 palabras), hace mayor referencia a Tecnología (13), y en menor medida: Investigación (4), Ciencia (2) e Innovación (1). 

En relación a los demás términos identificados en los programas de gobierno de los distintos partidos políticos (gráfico 2) se pueden destacar las menciones del Partido Nacional a Informática (con mucha mayor énfasis que los demás partidos - gráfico 3) y el Frente Amplio (gráfico 4) y el Partido Colorado (gráfico 5) a Software y TIC. El Partido Independiente (gráfico 6) sólo menciona Informática, Conectividad y Software, mientras que Asamblea Popular (gráfico 7) menciona exclusivamente: Software (en particular software libre), Ceibal y Digital.

Gráfico 2


Gráfico 3 Partido Nacional

Gráfico 4 Frente Amplio

Gráfico 5 Partido Colorado

Gráfico 6 Partido Independiente

Gráfico 7 Asamblea Popular


Es claro que cuánto más extenso es el documento, los partidos logran tener un mayor detalle de los temas tratados, por lo que los términos buscados logran identificarse con mayor claridad.

La dispersión en cuanto a la cantidad de páginas de los distintos programas de gobierno analizados, hace necesario un análisis cualitativo de los distintos temas para poder profundizar en los énfasis e intereses de cada uno de los partidos. Lo cual podremos ver en la próxima entrega de esta serie relacionada a los políticos y la economía digital.

[Este informe se presentó el 12/02/2019 en 1410 AM]
.
.





miércoles, 6 de febrero de 2019

Nuevo ciclo en radio: Economía digital y políticos

El pasado martes 5 de febrero dimos inicio a la segunda temporada de mi columna de Economía Digital en el programa "Hoy no es un día cualquiera" conducido por Cris Richeri en 1410 AM.

En este primer programa presentamos la idea general de lo que será el ciclo 2019: ¿Cuál es la visión del sistema político respecto a los temas de Economía Digital? ¿Qué importancia le habían dado a estos temas en sus programas del período anterior? ¿Qué mantendrían y qué cambiarían en el rumbo del actual gobierno? ¿Hay una Política de Estado respecto a estos temas?

Entre los temas que esperamos abordar, se pueden destacar:
- FinTech: dinero electrónico, interoperabilidad, nuevos actores en el sistema financiero
- Girls in Tech: participación de la mujer en STEM (ciencia y tecnología)
- Gobierno Digital: participación ciudadana, trámites en línea, transparencia de información pública (indicadores OPP), acceso a datos digitales, conectividad gobierno
- Ciberdelitos: AGESIC, Ministerio del Interior, lineaverde911
- Software Libre: prioridad en los sistemas de gobierno
- ANTEL: datacenter, cable submarino, fibra óptica
- Ceibal/Ibirapitá: nuevas iniciativas, integración con ANEP, perfil técnico o educativo
- ANII: inversión en investigación e innovación
- Trabajo online: regulación, incentivo, control
- Areas prioritarias de Uruguay XXI: arquitectura, diseño, informática, biotecnología?
- Historia clínica online: integración, propiedad, seguridad
- Derechos de autor: información en internet, creative commons, fotocopias
- Plataformas: uber, airbnb, nuevos actores de la economía digital
- Portabilidad numérica (celulares)
- Neutralidad en la red o control (whatsapp antel/claro/movistar, netflix)
- Protección de Datos personales y responsabilidad de las empresas/organizaciones

[Los audios de la radio se irán publicando en el blog, Twitter y RadioCut]
.
.