Rango Finito

fotoscódigoobservatorioshermanocerdo temas plots

colombia

2

Laia en nieve

Inicialmente quería mirar si se podían detectar, dentro de la nube de políticos tuiteros colombianos, los cúmulos de clientes de empresas de compra de seguidores robot. Con paciencia me bajé el jueves las listas de seguidores de los ciento cuarenta y nueve candidatos al senado con cuenta en Twitter de acuerdo a la base de datos de La Silla Vacía. La idea ingenua era hacer un análisis de componentes principales con la matriz resultante pero las dimensiones de la matriz (149 x 700.000) eran demasiado grandes para poder hacerlo en un tiempo razonable con un computador casero. Por un rato me resigné a hacer sólo la representación del grafo de seguidos y seguidores, pero después recordé que hay reductores de dimensionalidad no-lineales que parten de calcular las distancias entre los puntos (una matriz pequeñita). Una vez procesados los puntos y apropiadamente bidimensionalizados en R armé el gráfico de puntos con D3 (estoy enamorado de D3) y le agregué los vértices del grafo al hacer clic sobre un candidato. El resultado es esto.

Sospecho que lo que el gráfico muestra más que nada (y muy superficialmente) las diferencias en estrategia de comunicaciones digital de los diferentes partidos y candidatos. Los que le meten plata a ser presencia en línea y los que no. Los que quieren ser atendidos y los que atienden. Los conservadores mucho más aglomerados que los liberales. Los verdes totalmente disgregados. El sancocho de “centro democrático”. Benedetti y José Obdulio Gaviria apareados por (conjetura) contratos con la misma empresa de seguidores robot. Igual Serpa y Galán. Tres bloques más o menos bien diferenciados de cuentas: arriba a la izquierda los “líderes de opinión”, abajo los políticos en ascenso y arriba a la derecha los que no le paran muchas bolas a internet pero alguien les dijo que había que estar ahí por si las moscas.

Es un juguete medio inútil pero me gusta cómo se ve. De pronto después intento más serio en esta misma línea. Sigo con ganas de hacer algo a fondo sobre seguidores robots en política colombiana. A ver cuándo puedo.

25

Me gusta la idea detrás de Congreso Visible. Siempre me ha gustado. Es un proyecto importante con buenísimas intenciones y que merecería mucha más atención. Problema: la interfaz no es muy práctica y no parece ser muy útil para hacer revisiones panorámicas. En particular, es muy difícil saber cúanta información realmente tienen.

Ayer por curiosidad estuve viendo qué datos tenían sobre los candidatos al congreso para las elecciones de este año y descubrí con agrado que contaban con un API para hablar directamente con su base de datos. Después de cacharrear un rato en R para desenredar el JSON que devuelve el API armé una tabla que condensa la mayoría de los datos que me interesaban (lo único que no incluí fueron las notas biográficas y los conteos de proyectos propuestos por los candidatos que ya han sido congresistas (un indicador pésimo de desempeño)). Tienen mucha menos información de la que pensaba: datos biográficos básicos no están disponibles y también hay problemas elementales, como la ausencia de un campo para el departamento en los candidatos para la cámara.

Lo que más me impresionó, sin embargo, fue lo escasa que es la información de votaciones a proyectos de ley de los candidatos que ya han sido congresistas. Apenas registran cinco proyectos de ley recientes (estatuto de la ciudadanía juvenil (?), justicia penal militar (fuero militar), reforma a la justicia del ejecutivo, implementación del TLC con Estados Unidos (Ley Lleras 2.0), ley estatutaria de reforma a la salud) y por lo general no cuentan con las votaciones para cada uno de ellos por parte de cada candidato-congresista. Dado que es Congreso Visible asumo que si no tienen registro de esas votaciones no es por desinterés.

La tabla me deja con la sensación de que realmente ejercer algún nivel de vigilancia ciudadana sobre los congresistas colombianos es una tarea imposible: ni siquiera se puede saber con claridad cómo votan por los proyectos de ley que discuten. Según entiendo esta es información pública (si no lo es, debería serlo) y sin embargo no hay un mecanismo sencillo para acceder a ella. ¿Si no la tiene Congreso Visible (que lleva años en esas) qué esperanza puede tener un ciudadano común de saber cómo vota su congresista?

23

He seguido jugando con los datos de homicidios. Entre ayer y hoy armé esta página para mirar las tablas de los cincuenta municipios con mayor número de homicidios y los cincuenta municipios con la mayor tasa de homicidios (por cada 100.000 habitantes) entre 1990 y 2013 (de paso resalto los que están en ambas listas al tiempo — los nombres de esos pocos capturan bien los focos de violencia más dura cada año). Son tablas muy sencillas de calcular pero no parecen estar disponibles en un formato amigable en ningún lado. El Observatorio de Derechos Humanos de la Presidencia (más amigable Mordor que ese sitio) tiene unos PDFs viejos que cubren por ahí desde 1998 hasta 2011 pero no encontré buenas listas (mapas sí tienen — son horribles). La semana pasada las generé a la carrera una noche usando R y quedé con ganas de hacer los mismos cálculos usando únicamente javascript. Esta vez fui más metódico y el código es más claro, organizado y hasta reutilizable que el adefesio del mapa (uno aprende montones haciendo esos ejercicios de carpintería). Escribí unas funciones muy básicas para cargar tablas en formato CSV e imprimirlas, seguro no muy óptimas pero funcionales al menos. Tal vez lo use de nuevo más adelante para soltar más tablas. Todavía no sé cómo se puede volver “responsive” el gráfico que encabeza la página. Seguiré investigando. También me parece que es un poco pesada. Tal vez es demasiado pedir que el navegador cargue y procese la tabla entera. El iPad se iba colgando.

Por cierto, el mapa de homicidios ahora contiene los datos desde 1990 hasta 2013.

20

Hoy armé una tabla bien organizada con el número y tasa de homicidios a nivel municipal entre 1990 y 2013. Aquí la dejo en CSV y RDA para descarga y uso libre. Durante el fin de semana incluiré en el mapa de homicidios los datos del 2011 a 2013.

Tres cálculos:

En promedio, entre 1990 y 2013, los cincuenta municipios con mayor tasa de homicidios (homicidios por cien mil habitantes) acumulan el 14.7% de los homicidios de cada año.

En promedio, entre 1990 y 2013, los cincuenta municipios con mayor número de homicidios acumulan el 61.7% de los homicidios de cada año.

En promedio, entre 1990 y 2013, las ciudades de Barranquilla, Bogotá, Cali y Medellín acumulan el 30.46% de los homicidios de cada año.

Pronto más.

Photo 2-20-2014, 9 37 53

19

Por culpa del mapa de homicidios, ayer me crucé con varias personas que se rehusan a aceptar datos (si es que los leen) cuando estos ponen en duda (o incluso cuando no demuestran contundentemente) la mitología política asumida. Frente a una tendencia clara de reducción de homicidios en un cierto período responden con teorías de conspiración de bolsillo y se sostienen (so pena de sonar enajenados o agüevados) en sus narrativas populares de los baños de sangre apocalípticos y la violencia desatada (¡la más alta de la historia!). Una mujer proponía ayer que la reducción de la tasa de homicidios entre 2002 y 2010 se debió (en las narrativas fáciles todo siempre se explica de un escobazo con un solo factor, en lugar de reconocer que detrás hay siempre una red compleja de condiciones no siempre controlables y altamente aleatorias) a manipulaciones perversas de la “tasa demográfica” (?) en la registraduría, para poner un ejemplo. Otros no pueden aceptar los datos porque consideran que la práctica de los “falsos positivos” (un eufemismo periodístico horrible y ya extendidísimo para referirse al asesinato metódico de muchachos por parte de miembros de las Fuerzas Militares para hacerlos pasar por guerrilleros caídos en combate, acreditar éxitos operativos y ganar permisos, recompensas y condecoraciones) debería amplificar contundentemente las estadísticas de homicidios en general (aunque en la práctica correspondan a menos del 3% de los homicidios cometidos en un año). Y es verdad que estos crímenes son una atrocidad inaceptable, una vergüenza. Y son todavía peores cuando se reconfirma todavía hoy que dentro de las Fuerzas Militares son percibidos como errores casi exculpables de la guerra. Pero yo no me atrevería a decir que el resto de homicidios (en la escala de decenas de miles cada año — las tasas de homicidio, incluso ahora que están en caída, siguen siendo preocupantes) son menos serios. Los conteos son burdos e inexactos (a veces incluso tendenciosos) pero ayudan a poner las historias que nos contamos en perspectiva, a contrastarlas, a cuestionarlas. Aprender a leer números y tomarlos en cuenta no limita ni pervierte. No nos debilita. No deforma el mundo (ese está afuera, no en las tablas, y hay que volver a él siempre). Tampoco nos convierte en cínicos. Es una habilidad valiosa (una de tantas) para no perderse en las exageraciones y vaguedades comunes en discursos políticos. Las gráficas y las tablas no son generadores automáticos de conclusiones incontrovertibles sino plataformas para discutir y tomar distancia ocasional. No podemos sobrevalorarlas pero tampoco desestimarlas.

14

Homicidios 2012 y 2013
Clic para agrandar. Datos de la policía colombiana. También hay unos de medicina legal que se supone que son distintos pero esos no los tengo. Como siempre, todo lo que se necesita para generarlo está acá.

13

Embajadores
Presencia diplomática de Colombia en el mundo a febrero de 2014. Países coloreados según el tipo de embajador presente. Haga clic en el mapa para verlo más grande. Datos compilados en colaboración por Alejandro Peláez y Sandra Borda. En este repositorio están los datos y el código para generar el mapa.

12

Los más educados es un pequeño documento interactivo en desarrollo, una herramienta, si se quiere, para pensar los resultados de las pruebas Saber 11 a nivel regional. Todavía no está terminado pero ya hay suficiente para jugar.

El viernes Jorge me escribió con la idea, era realmente sencilla: aparentemente no hay un documento oficial donde el Icfes discuta los resultados de los exámenes a nivel municipal. Y menos centrándose en los colegios públicos. Son dos restricciones fáciles de implementar. Después bastaba hacer algo de estadística descriptiva elemental para mirar los datos e intentar sacar preguntas de ahí. El propósito es que sea algo fácil de leer y usar. Más para la gente que para académicos. Ojalá que promueva una discusión pública del estado de la educación estatal que supere la fase de los “cien mejores colegios” y haga que los gobernantes y funcionarios regionales sean responsabilizados de los resultados de los colegios en su jurisdicción.

A veces pareciera que los colegios públicos no le importan a nadie. Como son públicos entonces pocos los consideran propios. La gente que decide cosas en Colombia por lo general estudió en colegios privados (para ilustrar, aquí hay una gráfica del número de estudiantes de último grado en colegios públicos y privados por “estrato” en 2011). En los círculos sociales de mis amigos nadie tiene hijos estudiando en colegios públicos. Es considerado medio impensable. Es crucial encontrar estrategias que superen las buenas intenciones para revalorar los colegios públicos y que recuperen el prestigio que alguna vez tuvieron (aquí hay una iniciativa seria y bien argumentada en esa dirección). El descuido social y gubernamental en el que se encuentra el sistema de colegios públicos lo ha convertido en un generador de exclusión social financiado con impuestos en lugar de ser el promotor de movilidad social que le corresponde. Un primer paso para devolverles su importancia es seguir atentamente su desempeño.

Es obvio que los resultados de los exámenes de estado no son un indicador contundente de lo que quiera que sea la “calidad de la educación”, pero pueden ser usados como un primer criterio a la mano para medir el impacto de políticas públicas. Lo ideal sería repetir este ejercicio regularmente y difundirlo tanto como se pueda.

El código en R para calcular los gráficos y tablas está disponible en este repositorio. Está desordenadísimo pero supongo que puede ayudar a alguien que quiera hacer gráficas similares. Si tengo tiempo intentaré pulirlo durante las próximas semanas, a medida que añado más información al documento.

6

En algunos de los mapas que he hecho por estos días Bogotá parece una puñalada en el corazón del país.

5

crecimiento.dept

PIB.deptos.porcentaje

Los datos vienen de acá. Clic en los mapas para agrandar.

27

antioquia, cundinamarca y valle
Incidencia de pobreza (de acuerdo al índice de pobreza multidimensional (cálculos de 2005)) en Antioquia, Cundinamarca y Valle del Cauca. Código y datos para generar los mapas en este repositorio.

26

dos_mapas_educacion
De acuerdo a un censo educativo de 2012 y estimados de población del Dane para el mismo año. Código, datos y otras gráficas en este repositorio.

25

raquel_y_el_fin_del_mundo

Raquel y el fin del mundo se enmarca en la tradición del cómic alternativo semirrealista contemporáneo que es obligatoriamente rústico en su factura y melancólico en tono. Trata sobre la disolución de un grupo de amigos desde la perspectiva de quien los ve partir y no sabe cómo dejarlos ir. También hay algunas muertes. Mariana Gil Ríos, su autora jovencísima, dibuja en un estilo muy sencillo (por ratos se pasa de burdo) a blanco y negro con tonos grises en algo que parece acuarela y que ocasionalmente explota en viñetas dinámicas donde sugiere movimiento o cambios mediante colores o multiplicidades. Aunque la historia en sí es bastante minimal, se siente la intención de montar sobre ella algo grande y sustancioso. Esta ambición cauta permite que la narración no se salga de control sin que esto la fuerce a reprimirse. Es una lectura agradable con muy pocos baches. Tal vez algunos diálogos desmerecen y valdría la pena haber ahondado en el drama de la protagonista para que no pareciera una pataleta infantil tardía, pero aún así creo que cuenta lo que quiere contar y lo logra con un estilo propio y sincero. Es una buena primera novela.

19

Gracias a José Rafael Espinosa conseguí una base de datos con los resultados de las pruebas Saber 11 de 2011 a nivel de estudiante (~572K entradas). No tiene los resultados de la prueba discriminados por área, sólo el promedio, pero para compensar tiene como 180 variables con datos sobre el estudiante y su entorno. Todo un banquete para este humilde lector de tablas.

Arranquemos con una gráfica que hace rato me debía, mirando cómo los resultados de la prueba cambian de acuerdo al nivel socioeconómico (medido por el “estrato”) del estudiante. Para enriquecerla diferencio colegios privados de públicos. Todo es más o menos como se espera:

saber-estratos-tipodecolegio

Entre más plata, mejores resultados. Menos promocionado pero también bien sabido: las diferencias en resultados entre colegios públicos y privados no son tan drásticas si se toman en cuenta las condiciones socioeconómicas de las familias de los estudiantes. Para entender el comportamiento de las distribuciones de colegios públicos en los estratos altos hay que tomar en cuenta de cuántos muchachos hablamos en cada grupo:

cuentas-colegios-estratos
Estrato 4: 3657 en público y 16258 en privado. Estrato 5: 452 en público y 7292 en privado. Estrato 6: 156 en público y 4634 en privado.

Mejor dicho: a partir de estrato cuatro las familias prefieren fuertemente los colegios privados para sus hijos. Y ahí es más o menos donde empieza la desigualdad.

*

Otra curiosidad: ¿Qué diferencia hace en los resultados que los padres del estudiante sean maestros?

papamaestro-promedios

Pero claro, si un papá es maestro es probable que la familia sea de estrato medio alto y a eso se deba la diferencia. Miremos cómo se distribuyen los hijos de padres maestros por estrato:

cuentas-padresmaestro-estrato

Tal vez esa es la razón de la diferencia. Otra posible razón es el tipo de colegio que eligen para sus hijos. De la gráfica de arriba sabemos que en estrato tres los estudiantes de colegios públicos todavía superan a los de colegios privados. ¿Pasa lo mismo si nos restringimos a hijos de maestros? ¿Y qué hay de los hijos de padres que no son maestros?

cuentas-estratos-maestros

Hipótesis: los maestros colombianos prefieren que sus hijos estudien en colegios privados.

12

Gráfica de libros en casa y la distribución de puntajes de los estudiantes colombianos en matemática y lectura:

libros
Clic para verla más grande