Rango Finito

fotoscódigoobservatorioshermanocerdo temas plots

gráficos

17

diferencias.resultados.participacion

Un problema de las denuncias de Uribe usando conteo de votos como un indicador de fraude es que no toma en cuenta que el total de participación también aumentó. Para hacer un análisis mínimamente serio sería importante considerar la diferencia de resultados como porcentajes del total de participación en cada vuelta. Esto daría una medida más justa del ascenso de los candidatos en los diferentes municipios. En esta gráfica calculo este valor para ambos candidatos y lo comparo con el cambio en la participación (como porcentaje del potencial electoral). Ambas nubes son relativamente similares salvo por ligeras diferencias regionales como un repunte de Santos en la costa caribe y el suroccidente y un repunte de Zuluaga en el nororiente. Otro punto clave es que Zuluaga perdió fuerza (diferencia de resultados negativa) en muchos más municipios que Santos). En todo caso, muy probablemente es posible encontrar ejemplos de saltos notables de votación para Zuluaga en Santander similares a los que Uribe denuncia para Santos en la costa como prueba de fraude (aunque en ese caso me imagino que la interpretación de Uribe será que el sentir popular motivó a los votantes independientes (“de opinión”) para apoyar al señor Zuluaga). En el gráfico de cajas a continuación presento las distribuciones de cambios de resultado para ambos candidatos para cada región. La pelea fue pareja pero entre Bogotá, sobre todo Bogotá, y la costa le dieron a Santos la victoria:

cajas.regiones.dif.resutados

En Foco Económico, Nicolás Idrobo y Pablo Querubín publicaron este análisis sobre los resultados de las elecciones utilizando algunos de los datos que recopilé. Vayan y lean.

28

En el anterior gráfico me dio la impresión de que la diferencia de abstenciones confundía más de lo que ayudaba así que aquí va uno en el que uso en su lugar la abstención para las presidenciales (en porcentaje sobre el potencial electoral a nivel municipal). Describen fenómenos ligeramente distintos pero relacionados. El efecto es similar:

Diferencia en resultados y abstención

Clic para agrandar. Agregué colores y tamaños a los municipios de acuerdo a su potencial electoral.

26

Dividiendo los municipios de acuerdo a la diferencia entre los votos de Santos y los de Zuluaga (igual que acá), esto fue lo que pasó ayer:

votos.municipios

Añadí los votos en blanco y también el número de abstemios (?) porque todo eso hará parte del juego electoral. El 40.17% de los potenciales votos están en municipios donde Santos tiene ventaja. El resto (59.82%) están en municipios donde Zuluaga tiene ventaja. El proselitismo a nivel muy local será decisivo en lo que viene. Por eso podría ser clave considerar esta clasificación de los municipios como punto de partida para el diseño de una estrategia de campaña hacia la segunda vuelta.

Por comparar, repito el gráfico correspondiente a las elecciones al senado:

cd.v.lu.votos

Toda la ventaja que parecía que Santos y Vargas Lleras tenían como equipo se refundió.

21

Hoy vi a Pascual Gaviria recopilando los resultados de las elecciones al Senado en ciudades colombianas para comparar cómo le había ido al partido de Uribe (Centro Democrático) en relación al partido de Santos (Partido de la U).

Dado un municipio, una forma de comparar las fuerzas relativas entre los dos partidos es calcular un índice del estilo $$ \frac{CD – LU}{CD + LU} $$ donde CD son los votos en el municipio para Centro Democrático y LU los votos para el Partido de la U. El rango de este índice va de -1 a 1. Cuando es -1 quiere decir que La U recibió votos y Centro Democrático no recibió ni uno. Cuando es 1 quiere decir que Centro Democrático recibió votos y La U no recibió ninguno. Cuando el índice es cero quiere decir que sacaron el mismo número de votos. Puntos intermedios representan diferentes proporciones a favor de uno u otro (negativos para La U y positivos para Centro Democrático).

Ad portas de la elección presidencial no viene mal revisar estos índices pues aunque la estructura de la elección es distinta las contiendas a nivel local son similares. Por ejemplo: un municipio donde los votos de Santos son más que el doble de los de Uribe (i.e., indice ≤-0.33) es uno donde es muy complicado que Uribe (o sea su títere, Zuluaga) se imponga. Al contrario, lo mas probable (al menos ingenuamente) es que Santos se fortalezca (por ejemplo sumando los votos que recibió Cambio Radical, el partido de su fórmula vicepresidencial (o los conservadores que se han declarado santistas)). Mejor dicho, este tipo de análisis podría servir para saber cuáles son los votos que realmente están en juego y cuales están más asegurados.

En este primer gráfico represento el número de municipios dado el índice. La barra dice: en este rango de índices hay tanto por ciento de municipios y en estos municipios ganaron tales partidos en esta proporción.

lu.vs.cd

Un problema obvio de este gráfico es que los municipios tienen diferente fuerza electoral dependiendo de su tamaño y al final lo que importa es cuántos votos se suman (no cuántos municipios se ganan). Así, tal vez el gráfico correcto debería representar en las barras el número de votos (en municipios con tal índice) y cómo esos votos se distribuían entre los distintos partidos. Ese es el que viene a continuación:

cd.v.lu.votos

Hay 5.601.216 votos a la derecha del cero y 5.324.366 a la izquierda. El aporte partido conservador parece decisivo. Santos debería estar preocupado.

La gran duda es cómo se moverán esos colores entre las barras el próximo domingo.

12

partido.contra.partido

Lo que quería ver, y no estoy seguro de ver bien, es cómo compiten los partidos entre ellos a nivel municipal. Supongo que hay mejores formas de “visualizar” algo así pero este es mi primer (y fallido) intento. Cada mini-gráfica es una nube de puntos (uno por cada municipio) donde las coordenadas están dadas por las proporciones de votos al senado en ese municipio para los dos partidos correspondientes a su posición en la cuadrícula. En el triángulo superior están las correlaciones esas mismas variables (la interpretación de estas correlaciones ya no la tengo tan clara como cuando las generé, si es que alguna vez la tuve clara). Creo que esperaba ver algún patrón o irregularidad que fuera difícil de apreciar de otro modo, pero creo que no es mucho lo que se ve más allá de lo obvio. Algo que parecen sugerir los gráficos es que los partidos “tradicionales” y sus derivados (i.e., los cuatro primeros) apelan al mismo tipo de votante (lo que permite mayor concentración en el centro de la mini-gráfica) mientras que los partidos minoritarios en realidad no compiten entre ellos: hay pocos municipios en los que ambos sean relativamente fuertes. Pero de nuevo ese es el tipo de cosas que no necesitan un diagrama tan complicado para verlas (si es que se ven).

Me preguntaba Daniel Vaughan por qué hice el gráfico si no sabía bien como leerlo y me puso a pensar en la metodología improvisada y casi artesanal de estos procesos de exploración de datos, tan alejada, en últimas, del análisis formal y estructurado (casi de receta) que promueven los economistas. Supongo que la respuesta corta es que el propósito de estas búsquedas es encontrar perspectivas que iluminen los datos (que permitan verlos ampliamente y ojalá de alguna forma “renovada”) y a veces (casi siempre) hay que escalar al mirador sin saber muy bien qué se verá y qué no. Tal vez lo otro que pasa es que mi intención con la mayoría de los gráficos que hago no es demostrar nada. Eso me permite experimentar sin preocuparme demasiado por entender hacia dónde voy. El reto técnico de aprender a armar el gráfico que quiero a veces paga solo el paseo.

*

El caos institucional colombiano expuesto en un detalle mínimo: la registraduría tiene un código numérico para identificar municipios y corregimientos departamentales donde monta puestos de votación. El Dane también cuenta con un código númerico para identificar lugares poblados. Increíblemente (o no tanto) estos códigos no tienen nada que ver el uno con el otro. Otro similar: los códigos de colegios que usa la secretaría de educación del distrito son diferentes de los códigos que maneja el Icfes.

En aras de facilitar las traducciones idiotas que exigen las burocracias, aquí armé una tabla de municipios con el código del dane y el de la registraduría. Esto es con el apoyo de Alejandro Peláez y Daniel González.

*

Aquí dejo para descarga libre las tablas de votaciones a representantes a la cámara a nivel municipal. Una por cada departamento (más la de la circunscripción de los exiliados.) No creo que haga con ellas pero los programitas que escribí para bajar las otras se adaptaban fácil para bajar estas. Y ya puestos, por qué no.

Círculos y viajes

La vida se basa en la repetición de rutinas que describen órbitas no alrededor sino a través de puntos estables por intervalos de tiempo prolongados. Las transiciones de punto ancla son suaves. La niña nace y gira alrededor de la camilla donde está su mamá y luego es trasladada a un cuarto del que sale y entra a medida que las enfermeras administran evaluaciones, exámenes y baños. Un taxi nos trae al apartamento y el punto de referencia de su mundo se establece en la cama, entre mi almohada y la de Mónica, con viajes regulares a la sala, el baño, el consultorio del pediatra, el supermercado y el hospital. Ayer fuimos a Toronto, caminamos por el barrio coreano y luego bajamos a la avenida de la reina y dimos vueltas un poco más, con paso obligado por el barrio chino y el mercado de Kensington. La ciudad nos sienta bien. Hoy iremos a las cataratas de Niágara. Los círculos de Laia se expanden, cada vez más lejos de su centro primigenio. Algún día se alejará de nosotros también.

Los colores del mundo

El orden de aparición de términos para los colores (de acuerdo a observaciones de Brent Berlin y Paul Kay en 1969 que casi corroboraban, sin saberlo, observaciones previas de Lazarus Geiger en 1867 (!)) es generalmente blanco y negro → rojo → verde ↔ amarillo → azul. Para 1800 todos estos términos estaban desde hace mucho tiempo disponibles en el idioma inglés, pero aún así las frecuencia de uso de los términos se sostenían en ese orden primigenio natural. Aquí un zoom de la gráfica en inglés desde 1800 hasta 1820, justo antes del inicio del misterioso ascenso del azul:

Mónica me hizo caer en cuenta de lo extraño que es que para ese momento el orden de frecuencia todavía corresponda con el orden original. Si mi interpretación del libro de Deutscher es correcta, el orden original está relacionado con la utilidad práctica de tener términos para cada color y esta utilidad práctica a su vez estaría relacionada con la distribución de colores en la vida cotidiana de las personas (el cielo, por cierto, no hace parte de la vida cotidiana, es sólo un telón). Parecería entonces que hasta bien entrados en el siglo diecinueve (¿la revolución industrial, quizás?) la paleta de colores prácticos (lo que quiera decir) de la vida cotidiana no cambió significativamente y de hecho el gráfico podría ser una buena manera de argumentar por qué surgieron en ese orden (según Deutscher eso todavía no está claro): precisamente porque ese era el orden en el que eran necesarios para colorear el mundo hasta 1820.

Mejor dicho: no es que el conteo de frecuencias refleje el orden sino que el orden es explicado burdamente por el conteo de frecuencias.

Autorretrato de Anders Zorn de 1896. Aquí mi amigo Sonat Süer muestra cómo autopintarlo utilizando la paleta de colores que Zorn lleva en el cuadro.

Dado lo anterior, reformulemos la pregunta que hacía al final de la entrada pasada: ¿qué pasó en el mundo hacia 1800 para que la paleta de colores útiles de repente requiriera mayor uso del azul?

Ejercicio computacional semisencillo: recopilar un archivo de cuadros figurativos digitalizados en buen formato que cubra con suficiente detalle la producción desde, por decir algo, 1500 hasta la actualidad (esto, creo, es lo complicado) y calcular, como con n-gramas (esto debería ser mucho más fácil), el porcentaje de uso de una lista de colores básicos (normalizando tonos, claro está). ¿Cuál será el gráfico correspondiente? ¿Se relacionará con el orden primigenio? ¿Será detectable el ascenso (lingüístico) del azul? ¿El orden de predominancia cambiará sustancialmente con el tiempo? ¿Qué tan distintas serán las distribuciones de colores de la pintura producida en Europa y la producida en China?

Bogotá en bola

El ejercicio era hacer una versión automatizada y animada de esto usando la mezcla HTML5+JScript (de la que sabía/entendía muy poco). Bogotá en bola representa, usando bolas, algunos datos sobre Bogotá (recopilados mayoritariamente por Miguel con ayuda de sus contactos en el bajo mundo burocrático — estamos en el proceso de aclarar las fuentes) a nivel de localidades. En varios de los gráficos (o en las transiciones entre uno y otro) quedan en evidencia las disparidades y contradicciones de la ciudad. En un área relativamente pequeña caben muchas ciudades con características dispares (casi universos paralelos) y estas disparidades a su vez generan barreras (algunas físicas y otras más sutiles y poderosas) que refuerzan las diferencias.

*

Aporte de homicidios por localidad al total de la ciudad en 2011

Aunque puse una leyenda explicativa en la esquina inferior izquierda de cada gráfico, tal vez valga la pena explicar mejor qué quiere decir cada una. Si dice “Aporte porcentual por localidad al total de la ciudad” entonces la bola sobre cada localidad representa (ejem) el porcentaje que la localidad aporta al conteo total de la ciudad. Si, en cambio, dice “Porcentaje sobre el total en la localidad” entonces cada bola representa el porcentaje de población en la localidad con tal o cual característica sobre el total de la localidad. Así, el grafo de Hogares con teléfono similar al de Población (porque el aporte por localidad al total de la ciudad es muy parecido al aporte de población total) pero en el grafo de Teléfono (relativo) (del segundo tipo) las bolas son todas de tamaño similar, porque el porcentaje de teléfonos por localidad es casi uniforme en toda la ciudad (con internet, por ejemplo, ya no es así).

*

Para representar la ciudad por localidades la describimos con un grafo de contigüidad (entre la localidad A y la localidad B hay un vértice si comparten una frontera) y calculamos la disposición del grafo utilizando la librería arbor.js, que determina la posición de los nodos (asunto en el que francamente no quería pensar) de acuerdo a un modelo físico. Es muy práctica (aunque tal vez un poco pesada). Un primer problema de esta aproximación es que La Candelaria está totalmente rodeada por Santa Fe y por tanto en el grafo se vuelve una cola. Otro problema obvio es el siguiente: dado que la configuración inicial de nodos es semi-aleatoria, existe la posibilidad de que el grafo generado sea una imagen especular del grafo deseado (o que salga enredado). Para compensar el grafo admite la opción de ser reconfigurado moviendo nodos como si fuera de caucho. Esto permite, con un poco de maña, adecuar la ciudad a la imagen preferida por el usuario. (Una posible tarea que surge de acá es cómo generar y describir con algo parecido a arbor.js grafos que sean orientados sobre una superficie bidimensional. No he mirado.)

Tasa de homicidios (i.e. número de homicidios por cada 100 Khab) por localidad en 2011

Gráfico

El tiempo hace lo que puede, pero eso nunca es suficiente para usted. Claro que tengo derecho a sentirme así y usted no es quién para concederme ese derecho. Me sentiría igual con o sin su permiso. Mi consuelo es que ahora al menos sé con cierta precisión cuál es el valor que usted otorga a lo que siento, a lo (poco) que le doy. También tengo claro lo que debo esperar de usted. En una realidad paralela seguro que seguimos siendo felices. En otra realidad paralela todos estamos muertos. ¿Quiere posibilidades? Un día me levanto y siento que esto ya no es para mí así que me esfumo de mi vida y de la suya. Por amor, desaparezco. ¿Otra? Un día me levanto y recuerdo que olvidé algo en la oficina. Es sábado, decido caminar, eso es lo último que recuerdo. Cuando abro los ojos de nuevo estoy en un lugar donde pasé muchos años siendo niño: el hospital donde internaban a mi abuelo luego de cada crisis. Cuando le pregunto al médico por usted el médico me responde que usted ya no está. El médico me pregunta datos básicos sobre mi vida y se sorprende cuando le respondo correctamente, pero hay algo que está mal. El médico no me lo dice, no al principio, pero yo lo sé. Me veo las manos y lo sé. Cuántos años, le pregunto al doctor. Poco a poco recupero la memoria. Me muestran videos de lo que fui, de lo que quedó de mí después del accidente. Accidente. Nadie sabe qué pasó. Usted se cansó de esperar mi regreso. Me dejó una carta para cuando despertara, para cuando volviera a responder correctamente a las preguntas fáciles. En la carta me decía que no sabía si alguna vez leería esa carta pero que de todas maneras la escribía porque sentía que me debía eso. Luego me hablaba del dolor de verme y lo que veía en mis ojos cuando la llamaba por otros nombres. Me listaba los nombres. Me listaba las historias que le había contado de mi vida. Me preguntaba cuántas personas de esas era yo y cuántas me había inventado para complacerla. Me pedía que fuera feliz. Eran cosas que yo debía entender si no es que ya las entendía desde antes. Esa es la duda siempre: tal vez el accidente sólo facilitó lo inevitable. En la carta había una foto de los dos el día que nos conocimos en esa fiesta hace cinco años. Nuestra primera foto juntos. Atrás estaba la fecha. Tengo un juego en el que grafico la distancia entre los dos. Esa fecha marca el tiempo cero. Hablo de distancia en un sentido emocional. Pienso en las veces cuando nos miramos y sabíamos que no había nada que nos separara. Eso pasó. Usted tal vez no lo recuerda pero eso pasó. Y se sentía bien. La línea ondula y cae y vuelve a escalar en pendientes que miden odios y tristezas. Ahí vamos nosotros, pienso, sobre y contra este tiempo que nunca fue suficiente para usted. Calculo puntos de inflexion y máximos. Así me entretengo. Refino la asíntota sostenida en el ahora. Esa línea somos los dos. Es lo que queda de los dos.