Rango Finito

fotoscódigoobservatorioshermanocerdo temas plots

colombia

Compromisos

A raíz del anuncio desde La Habana he encontrado gente o preocupantemente esperanzada o escandalosamente pesimista. En ambos lados cunde la claridad sobre el futuro. La diferencia está es el tono de la predicción.

Y no es que unos u otros sepan menos o más. Todos saben lo mismo. Y de lo mismo desprenden infiernos y paraísos. Pareciera que no es momento para incertidumbres.

Preferiría menos certezas y más compromisos. Compromisos personales, quiero decir. Porque las abstracciones usan las palabras con ligereza, no las sienten. No importa si es la paz o la guerra, lo común es que se espere que la carga del proceso le corresponda a alguien más. Cuando fracasa, siempre son otros los que tienen la culpa.

Patrones de violación en Colombia (2010-2014)

Vía Alejandro Peláez me enteré de la existencia de este sitio de estadísticas criminales que mantiene la policía colombiana desde 2010. De todos los sitios de datos abiertos colombianos este es probablemente el que más se acerca al ideal soñado de la página sencilla donde se puedan descargar tablas bien armadas. Tomé las tablas de Delitos Sexuales y armé esta gráfica de porcentajes de violaciones por día del año, mes del año, día de la semana y hora del día. Para este conteo uso los delitos categorizados como ‘violación’ del capítulo 1 de esta ley:

Artículo 205. Acceso Carnal Violento. El que realice acceso carnal con otra persona mediante violencia […].

Artículo 206. Acto Sexual Violento. El que realice en otra persona acto sexual diverso al acceso carnal mediante violencia […].

Artículo 207. Acceso Carnal o Acto Sexual en Persona puesta en Incapacidad de Resistir. El que realice acceso carnal con persona a la cual haya puesto en incapacidad de resistir o en estado de inconsciencia, o en condiciones de inferioridad síquica que le impidan comprender la relación sexual o dar su consentimiento […].

violaciones

El 89,5% de las víctimas de violaciones en estos datos son mujeres.

Click en la gráfica para agrandar.

Secuestros (sobre persona específica)

De nuevo los datos vienen de acá. Esta vez es una tabla de secuestros desde 1970 hasta 2010 que supongo es la misma que usa Natalia Springer en sus investigaciones para la fiscalía. Difícil saber qué tan válidos son esos datos (las fuentes cambian un montón). Me restrinjo para estos gráficos a secuestros sobre persona específica, la modalidad de secuestro más popular en Colombia. Por lo pronto me limito a números absolutos y no a índices relativos a población. No encuentro series de población por departamento en la página del DANE desde 1970. Sólo están disponibles, hasta donde pude ver, desde 1985.

Haga clic en los gráficos si quiere verlos más grandes.

Primero, contemos año por año:

secuestros.totales

Ahora contemos por autor (presunto):

porcentaje.secuestros.autor

A continuación la series año por año para cada departamento excluyendo a Antioquia:

secuestro.por.departamento

Excluyo a Antioquia porque la escala es totalmente distinta. En el siguiente gráfico, de arriba a abajo, vemos: (1) la serie para Antioquia en tono sólido y las series del gráfico anterior difuminadas; (2) la serie para Antioquia junto a la serie para el total nacional (punteada); (3) el porcentaje año a año de secuestros sobre persona específica en Antioquia con respecto al total nacional.

secuestros.caso.antioquia

Ahora contemos los secuestros atribuídos a las FARC comparados con los totales nacionales tanto en números absolutos como en porcentaje:

secuestros.caso.farc

Y de nuevo discriminemos por departamento esta vez limitados a secuestros de FARC:

secuestros.farc.departamentos

Aquí están el código y los datos en formato CSV.

Asesinatos selectivos

Con datos de acá, cuatro gráficos sobre asesinatos selectivos en Colombia desde 1981 hasta 2012.

Así definen el asesinato selectivo:

Es el homicidio intencional de 3 o menos personas en estado de indefensión en iguales circunstancias de modo, tiempo y lugar, perpetrados por los actores del conflicto armado.

Primero, asesinatos selectivos por año con la atribución dividida en cuatro grandes categorías:

asesinatos.selectivos.montanas

Segundo, una vez más por año pero ahora dividiendo por departamento (en número en la esquina superior derecha de cada panel es el total departamental):

conteoyeardepartamento

Tercero, asesinatos selectivos por período presidencial con la atribución a mayor nivel de detalle (ojo a la escala logarítmica en el eje horizontal) y promedio por día para cada gobierno:

conteoporpresidente

Finalmente, asesinatos selectivos en total por atribución:

conteototalautor

PISA nos pisa

En esta entrada de su blog, Arthur Charpentier intenta evaluar qué tan “elitista” es la educación francesa de acuerdo a los resultados del examen PISA (concluye que no particularmente). Inspirado en sus cálculos organicé algunas gráficas intentando visualizar/evidenciar desigualdades en los resultados de PISA 2012 con énfasis en Colombia. Por lo pronto sólo hay gráficas y muy poco comentario (tal vez porque prefiero no forzar interpretaciones y me gustaría, más bien, conversarlas por acá si alguno se anima). El código que genera el documento está acá.

Aquí, por ejemplo, está una gráfica que permite comparar las distribuciones de puntajes en matemática para varios países (diferenciadas por sexo):

Distribuciones puntajes PISA 2012

En el documento hay otras formas con diferentes énfasis de hacer esta misma comparación.

16

diferencia.resultados

Para cada municipio tomo el total de votos depositados y para cada uno de los dos candidatos calculo la proporción de votos que le corresponden (un número entre cero y uno). Lo hago en primera y segunda vuelta por separado y después resto el valor de primera vuelta del de segunda vuelta. El resultado es un número que, para cada candidato, me dice cómo mejoró (o empeoró, si es menor que cero) su resultado en el municipio. En el gráfico están las distribuciones de estos valores para los dos candidatos de la segunda vuelta. Los puntos sugieren potencial electoral de los municipios. La caja difuminada es la representación tradicional de distribuciones de valores numéricos. Los colores son las regiones que usa el Banco de la República.

15

Esta gráfica se podría llamar “Por qué Santos ganó”:

diferencias.participación.segunda

Y aquí está la tabla con el conteo de votos a nivel municipal hasta donde va a las 11:30pm de hoy.

A ver en qué termina ese tal proceso de paz.

7

Porque Alejo lo pidió: la diferencia con el líder etapa a etapa para el top 10 de la clasificación general del Giro d’Italia:

top10-cuadrado

6

Creo que pienso más en Colombia de lo que debería.

Alguna vez Alejo me dijo que Colombia, como tema, sólo existe en el exilio o algo así. Que en realidad en la vida cotidiana, en la experiencia del país, Colombia no es nunca un tema para nadie que lo habite. De pronto estoy tergiversando lo que me dijo. Fue hace miles de años.

El miércoles estaba una mujer colombiana en la piscina. Tenía las facciones y acento de bogotana de clase alta. Jugaba con su hijo gordito y rubio. Cuando me oyó hablar en español a su lado se alejó incómoda. A veces eso es Colombia también: esa distancia esencial, la identidad que parte de la desconfianza en el igual.

Hace poco le decía a Luis que tal vez lo correcto, de poder votar, sería entregarle mi voto a los amigos que viven allá. Proponerles que decidan ellos por quién voto y aceptar su decisión. Lo que pase allá los afecta mucho más a ellos que a mí. Desde acá (este momento y este lugar) me cuesta cada vez más entender realmente qué pasa. Es complicado diferenciar los anuncios constantes de crisis inminente de la angustia sincera que algunos expresan, o sopesar su optimismo ocasional.

El contacto que me permiten los medios digitales es intenso pero engañoso: su flujo es modulado por los oleajes emocionales más potentes. El rumor de la vivencia se pierde entre los gritos consternados, alegres o indignados, entre los sentimientos más manipulables y explosivos. Es como estar en la tribuna de un estadio deportivo de espaldas a un partido eterno, viéndolo sin verlo y con una comprensión cada vez más escasa de las reglas del juego.

1

Los colombianos Nairo Quintana y Rigoberto Urán lograron primero y segundo puesto en el Giro d’Italia. El ciclismo me interesa casi cero, pero no me aguanté la tentación de armar una tabla con los tiempos acumulados etapa a etapa usando los datos disponibles en la página oficial del Giro.

Aquí está la diferencia en segundos con el líder para los corredores colombianos:

Colombianos Giro d'Italia 2014

Aquí está la diferencia en segundos con el líder para todos los 196 corredores:

Diff Leader Giro d'Italia 2014

Finalmente, velocidades promedio de los colombianos para cada etapa (con cajas de distribución de las velocidades promedios de todos los competidores atrás, para comparar):

velocidades.promedio

En todos los gráficos, clic para agrandar.

Dejo la tabla en el repositorio para que otros con más interés y conocimiento la aprovechen.

25

Resultó bien fácil adaptar los programitas que escribí cuando recolecté los datos de las elecciones legislativas para hoy sacar los datos de la registraduría para la elección presidencial. Aquí está una tabla con los votos a nivel municipal de acuerdo a lo que tenía la registraduría hoy domingo 25 de mayo a las 11:55 de la noche.

Hace doce años estaba en Chicago. El 26 de mayo fui a votar con unos amigos. Allá me agarró el nacimiento de Uribe, alguien del que sabía muy poco pero no me inspiraba confianza. Nunca me hubiera imaginado que una década y pucho más tarde estaría todavía dando lora y moviendo votos ese señor con tanta fuerza.

21

Hoy vi a Pascual Gaviria recopilando los resultados de las elecciones al Senado en ciudades colombianas para comparar cómo le había ido al partido de Uribe (Centro Democrático) en relación al partido de Santos (Partido de la U).

Dado un municipio, una forma de comparar las fuerzas relativas entre los dos partidos es calcular un índice del estilo $$ \frac{CD – LU}{CD + LU} $$ donde CD son los votos en el municipio para Centro Democrático y LU los votos para el Partido de la U. El rango de este índice va de -1 a 1. Cuando es -1 quiere decir que La U recibió votos y Centro Democrático no recibió ni uno. Cuando es 1 quiere decir que Centro Democrático recibió votos y La U no recibió ninguno. Cuando el índice es cero quiere decir que sacaron el mismo número de votos. Puntos intermedios representan diferentes proporciones a favor de uno u otro (negativos para La U y positivos para Centro Democrático).

Ad portas de la elección presidencial no viene mal revisar estos índices pues aunque la estructura de la elección es distinta las contiendas a nivel local son similares. Por ejemplo: un municipio donde los votos de Santos son más que el doble de los de Uribe (i.e., indice ≤-0.33) es uno donde es muy complicado que Uribe (o sea su títere, Zuluaga) se imponga. Al contrario, lo mas probable (al menos ingenuamente) es que Santos se fortalezca (por ejemplo sumando los votos que recibió Cambio Radical, el partido de su fórmula vicepresidencial (o los conservadores que se han declarado santistas)). Mejor dicho, este tipo de análisis podría servir para saber cuáles son los votos que realmente están en juego y cuales están más asegurados.

En este primer gráfico represento el número de municipios dado el índice. La barra dice: en este rango de índices hay tanto por ciento de municipios y en estos municipios ganaron tales partidos en esta proporción.

lu.vs.cd

Un problema obvio de este gráfico es que los municipios tienen diferente fuerza electoral dependiendo de su tamaño y al final lo que importa es cuántos votos se suman (no cuántos municipios se ganan). Así, tal vez el gráfico correcto debería representar en las barras el número de votos (en municipios con tal índice) y cómo esos votos se distribuían entre los distintos partidos. Ese es el que viene a continuación:

cd.v.lu.votos

Hay 5.601.216 votos a la derecha del cero y 5.324.366 a la izquierda. El aporte partido conservador parece decisivo. Santos debería estar preocupado.

La gran duda es cómo se moverán esos colores entre las barras el próximo domingo.

16

Una ventaja de pensar las respuestas al cuestionario de Congreso Visible como un vector en dieciocho dimensiones es que se inyectan en un espacio geométrico de representación, con todas las ventajas que tiene la geometría. Por ejemplo se puede calcular el centroide de las respuestas de los cinco candidatos (i.e., un promedio multidimensional). Cada coordenada del centroide (un número entre cero y uno — cero es “NO” y uno es “SÍ”) sugiere cuál es la tendencia de los candidatos en general con respecto a cada pregunta. Si los candidatos dicen “lo que queremos oír” entonces eso es lo que queremos oír cuando hablan todos al tiempo:

    ¿Despenalización del aborto?: 0.2
    ¿Matrimonio homosexual?: 0.5
    ¿Despenalización de las drogas?: 0.2
    ¿Participación de criminales políticos en política?: 1.0
    ¿Constituyente por la paz?: 0.2
    ¿Eliminación reelección presidencial a cambio de períodos de seis años?: 0.7
    ¿Ley para promover la productividad de recursos naturales de reservas forestales e indígenas?: 0.4
    ¿Reformar facultades del Procurador?: 0.8
    ¿Moratoria minera hasta que no haya reglas claras?: 0.6
    ¿De acuerdo con demandas del Paro Nacional Agrario?: 0.9
    ¿Zonas de reserva campesina?: 0.5
    ¿Exenciones tributarias a la inversión extranjera?: 0.3
    ¿Eliminación consejo superior de la judicatura?: 1.0
    ¿Eliminación servicio militar obligatorio?: 0.9
    ¿Reducción presupuesto militar en “postconflicto”?: 0.2
    ¿Penas alternativas para reducir hacinamiento carcelario?: 0.8
    ¿Cupos indicativos (alias “Mermelada”)?: 0.2
    ¿Alianzas en segunda vuelta?: 0.6

También se puede calcular la distancia de cada uno de los candidatos al centroide. Este número sugeriría qué candidato es más “equilibrado” en sus respuestas con respecto a los demás y cuál es el más “extremo”. Cuando se hace ese cálculo las distancias al centroide son:

    Peñalosa: 1.691153
    López: 1.646208
    Zuluaga: 1.630951
    Ramírez: 1.435270
    Santos: 1.382027

Peñalosa es el más distante de este “centro” y Santos es el más cercano. Si se piensa bien no sorprende tanto.

Actualicé el Gist para que también calcule estos números.

13

Está buena esta gráfica de Miguel Olaya comparando a los candidatos presidenciales de acuerdo a sus respuestas al cuestionario de Congreso Visible.

Una opción alternativa es considerar las respuestas de los candidatos como un vector numérico y medir distancias entre ellos. Remplacé los “SÍ” con 1 y los “NO” con 0. Para llenar las respuestas vacías de algunos candidatos puse 0.5 (porque pareciera que la falta de respuesta fue usada como punto medio entre las dos opciones – “ni SÍ ni NO”). Calculé la distancia euclídea tradicional. Aquí está el código en R. Este es el resultado (entre el número es más alto, más diferentes los vectores de respuestas):

Si ese número de verdad significa algo (altamente discutible), los candidatos más “distantes” son Zuluaga y Peñalosa y los más “cercanos” son Santos y Zuluaga. Por otro lado, eso también se ve en los gráficos de Olaya, que tienen un significado más claro.

Detalle curioso: de acuerdo a las distancias, Peñalosa y López son tan “cercanos” (o tan “distantes”) como Ramírez y Santos o Zuluaga y Ramírez. Peñalosa es el candidato más cercano a López (y viceversa). Zuluaga y Santos empatan en la competencia por ser los más cercanos a Ramírez (pero son todavía más cercanos entre ellos).

No sé cómo habrán diseñado el programa de apareamiento los de Congreso Visible. Probablemente lo hicieron también usando coincidencias en respuestas. Quién sabe cómo habrán tomado en cuenta la opción de declarar la importancia de cada pregunta. Es chévere la idea aunque tal vez habría valido la pena un cuestionario más extenso y amplio y menos coyuntural.

12

Decía Héctor Abad en una columna que era bueno que la campaña presidencial fuera “aburrida” porque eso quería decir que se hablaría de asuntos más sustanciosos.

Pero no se habla de nada.

Se habla de consultorías con estafadores, acosadores y difamadores profesionales. También de sus obras, a las que pese a la intención más que evidente de perturbar y desviar la discusión política (¡necesaria, urgente!) se les otorga un altísimo valor de verdad y atención. Todo se reduce a desinformaciones sobre la posibilidad de que cada candidato sea un criminal o al menos títere de un criminal (o del imbécil de Uribe, que es considerado todavía peor).

Cualquier posibilidad de debate público se evade por estrategia.

A veces se habla de que no se habla de nada, como para que quede claro el vacío.

Que quede claro que nada importa porque la victoria no depende de ideas ni propuestas sino de quién logre sumar más apoyos (a punta de acuerdos más bien oscuros) entre los doscientos o trescientos tipos (a lo más) que canalizan, filtran y distribuyen el botín público.

Pero claro, estas elecciones son importantes. “¡Se decide todo!”, dicen los ansiosos que sienten que siempre están en la coyuntura.

De pronto no se decide nada. De pronto ya todo está decidido y de verdad da lo mismo quién gane entre los dos señores, seamos justos, que pueden ganar.

Cuánta confianza en la farsa.

Es muy jodido atender a las noticias de la campaña presidencial colombiana y no terminar hundido en un pesimismo que sólo admite el cinismo más amargo como antídoto. Así empezaba y terminaba esta entrada. Era sólo esa frase. Se convirtió en esto.