Rango Finito

fotoscódigoobservatorioshermanocerdo temas plots

colombia

1

Los resultados de Pisa merecen atención pero también cuidado en su interpretación. Pisa, como todo examen, evalúa un contenido dado. Se parte del supuesto de que este contenido es estándar. Se asume que el diseño del examen toma en cuenta sesgos culturales. ¿Qué tanto? Es difícil de saber. Sin duda Pisa se acomoda mejor al sistema educativo de ciertos países que a otros. En últimas lo que Pisa mide es la cercanía del sistema educativo de un país al ideal que la organización propone. No creo que las personas al frente de la educación colombiana tengan claro cuál es ese ideal que Pisa promueve implícitamente con su examen. (Es discutible (o debería serlo) que ese sea un objetivo que debamos adoptar, por cierto.) Ni siquiera creo que esas personas tengan algún objetivo claro en mente. La verdad es que el sistema educativo colombiano está tan a la deriva y su existencia es tan difusa que es casi imposible tomar los resultados de Pisa como demostración de algo distinto a su abandono. La capacidad del examen para evaluar algo profundo (estilo “la capacidad de los muchachos para resolver problemas” — de paso: ¿cómo se puede esperar medir con un examen escrito la capacidad para resolver problemas cotidianos de unos muchachos que no saben leer ni escribir?) es contingente a que contemos con un sistema educativo relativamente organizado y mínimamente funcional, cosa que en Colombia, no nos mintamos, todavía no existe. En tanto que la calidad del sistema educativo dependa de la buena voluntad de héroes anónimos dispersos rodeados de un mar picado de mediocridad los resultados lamentables en las pruebas Pisa no hablarán de maestros ni de estudiantes ni de colegios sino de la ineptitud de los políticos y funcionarios y su desprecio más que evidente por el futuro del grueso de los colombianos.

20

ihh

Un mapa con el índice invertido de Herfinhahl-Hirschman a nivel municipal. El índice invertido de Herfinhahl-Hirschman sirve para estimar el número de partidos efectivos en competencia en un lugar. Para obtenerlo usé (con algunas dudas) el vector de votos para cada partido al senado (nueve partidos) más los votos en blanco con cada número dividido por el total de votos válidos.

Calcularlo es bien sencillo (sospecho que eso ha ayudado mucho a su popularización): dado $v=(v_1, v_2, \ldots, v_{m})$, el vector de proporciones de votos, el índice es

$$ \text{IndHH}(v) = \frac{\left(\sum v_i\right)^2}{\sum v_i^2}.$$

En economía, donde nació, generalmente se usa el denominador (ese es el no invertido), pero en ciencia política se prefiere esta versión tal vez un poco más explícita. Mónica Pachón (excabeza de Congreso Visible) dice que a nivel municipal el índice no es muy elocuente. Suelto el mapa con esa advertencia. Es más una curiosidad que otra cosa.

(Secretamente, más que calcular el índice, el propósito de este ejercicio era probar este código de Mike Bostock para hacer mapas con zoom. Todavía hay varias cosas que no me quedan claras y tuve algunos problemas calibrando la ampliación, pero ahí anda.)

11

Ayer había raspado de la página de la registraduría las votaciones para cada candidato al senado por departamento. Aquí están en una tabla de Google Docs. Quedé con la espinita y hoy por la tarde después de volver de la cafetería, mientras Laia hacía su siesta, raspé los datos y armé la tabla de votaciones para cada candidato al senado por municipio. Son 752 candidatos y 1185 municipios y Google Docs no permite subir tablas con más de doscientas y algo de columnas, así que dejo el CSV en este repositorio para quien quiera usarlo.

Para la raspada usé la librería XML de R. Una vez se superan las molestias estéticas con la sintaxis, R es una herramienta muy práctica y hasta agradable, especialmente cuando se trata de lidiar con datos sucios, descargarlos, limpiarlos y organizarlos. Para ciertas tareas más serias sigo prefiriendo Python (especialmente si conviene usar estructuras de datos), pero cuando necesito mirar una tabla y hacer tres cálculos y una gráfica rápida con ella R es mi arma de preferencia.

10

Hoy un gráfico de la distribución del Senado recién elegido y un nuevo intento (con más información) de representar el dominio territorial de cada partido.

(Raspé de la página de la registraduría los votos para cada candidato en cada departamento. Este es un pequeño subproducto de esos datos. Planeo hacer algo más grande a nivel de candidatos antes de que se acabe la semana.)

9

Aquí un gráfico con la distribución del Senado que parieron las elecciones de 2010 más un estimado de los departamentos donde los partidos tuvieron candidatos fuertes (¿algo así como dominio territorial?). A ver qué pasa hoy.

6

Tasa de homicidio - Buenaventura

El Espectador reporta que en lo que va de 2014 se han registrado 58 homicidios en Buenaventura. De continuar a este ritmo, la ciudad podría terminar el año con 350 asesinatos. El pico de homicidios en la ciudad fue en 2000 y 2001, cuando sumaron 440 y 397 respectivamente. Los datos sugieren que esta ola de violencia actual se inició en 2013 tras una caída en el número de homicidos que venía desde 2006. ¿Cuál será el desencadenante?

3

A Colombia se le nota la falta de democracia en que no hay encuestas serias para elecciones parlamentarias. Entre el caudillismo y la reelección, las elecciones presidenciales colombianas son cada vez más idiotas y predecibles. Las parlamentarias, por su parte, son oscuras y esencialmente desinformadas. Pese a su importancia, parece que las posibles distribuciones de fuerzas en el congreso no merecen la atención de las encuestadoras y sus clientes de los medios (o si la merecen, lo disimulan muy bien). Me pregunto si esto estará relacionado con la naturaleza regional de las elecciones parlamentarias y el desprecio del centro (que hace encuestas, noticieros y periódicos) a las provincias. Si a esto se le suma la opacidad de las actividades en el congreso, realmente hay muy poca información disponible afuera para que el ciudadano pueda estudiar sus alternativas. Esto reduce las elecciones a meros concursos de popularidad muy superficial, que obviamente favorecen a los escasos “líderes de opinión” (con foco mediático permanente – en el grafo de candidatos al senado su identidad es más o menos evidente (¡cuánto elitismo se siente al explorar el grafo!)) y a los políticos profesionales con cara de tortuga entronados en sus curules (y sus regiones) desde hace milenios. No sorprende que el voto en blanco resulte atractivo para tantos.

2

Laia en nieve

Inicialmente quería mirar si se podían detectar, dentro de la nube de políticos tuiteros colombianos, los cúmulos de clientes de empresas de compra de seguidores robot. Con paciencia me bajé el jueves las listas de seguidores de los ciento cuarenta y nueve candidatos al senado con cuenta en Twitter de acuerdo a la base de datos de La Silla Vacía. La idea ingenua era hacer un análisis de componentes principales con la matriz resultante pero las dimensiones de la matriz (149 x 700.000) eran demasiado grandes para poder hacerlo en un tiempo razonable con un computador casero. Por un rato me resigné a hacer sólo la representación del grafo de seguidos y seguidores, pero después recordé que hay reductores de dimensionalidad no-lineales que parten de calcular las distancias entre los puntos (una matriz pequeñita). Una vez procesados los puntos y apropiadamente bidimensionalizados en R armé el gráfico de puntos con D3 (estoy enamorado de D3) y le agregué los vértices del grafo al hacer clic sobre un candidato. El resultado es esto.

Sospecho que lo que el gráfico muestra más que nada (y muy superficialmente) las diferencias en estrategia de comunicaciones digital de los diferentes partidos y candidatos. Los que le meten plata a ser presencia en línea y los que no. Los que quieren ser atendidos y los que atienden. Los conservadores mucho más aglomerados que los liberales. Los verdes totalmente disgregados. El sancocho de “centro democrático”. Benedetti y José Obdulio Gaviria apareados por (conjetura) contratos con la misma empresa de seguidores robot. Igual Serpa y Galán. Tres bloques más o menos bien diferenciados de cuentas: arriba a la izquierda los “líderes de opinión”, abajo los políticos en ascenso y arriba a la derecha los que no le paran muchas bolas a internet pero alguien les dijo que había que estar ahí por si las moscas.

Es un juguete medio inútil pero me gusta cómo se ve. De pronto después intento más serio en esta misma línea. Sigo con ganas de hacer algo a fondo sobre seguidores robots en política colombiana. A ver cuándo puedo.

25

Me gusta la idea detrás de Congreso Visible. Siempre me ha gustado. Es un proyecto importante con buenísimas intenciones y que merecería mucha más atención. Problema: la interfaz no es muy práctica y no parece ser muy útil para hacer revisiones panorámicas. En particular, es muy difícil saber cúanta información realmente tienen.

Ayer por curiosidad estuve viendo qué datos tenían sobre los candidatos al congreso para las elecciones de este año y descubrí con agrado que contaban con un API para hablar directamente con su base de datos. Después de cacharrear un rato en R para desenredar el JSON que devuelve el API armé una tabla que condensa la mayoría de los datos que me interesaban (lo único que no incluí fueron las notas biográficas y los conteos de proyectos propuestos por los candidatos que ya han sido congresistas (un indicador pésimo de desempeño)). Tienen mucha menos información de la que pensaba: datos biográficos básicos no están disponibles y también hay problemas elementales, como la ausencia de un campo para el departamento en los candidatos para la cámara.

Lo que más me impresionó, sin embargo, fue lo escasa que es la información de votaciones a proyectos de ley de los candidatos que ya han sido congresistas. Apenas registran cinco proyectos de ley recientes (estatuto de la ciudadanía juvenil (?), justicia penal militar (fuero militar), reforma a la justicia del ejecutivo, implementación del TLC con Estados Unidos (Ley Lleras 2.0), ley estatutaria de reforma a la salud) y por lo general no cuentan con las votaciones para cada uno de ellos por parte de cada candidato-congresista. Dado que es Congreso Visible asumo que si no tienen registro de esas votaciones no es por desinterés.

La tabla me deja con la sensación de que realmente ejercer algún nivel de vigilancia ciudadana sobre los congresistas colombianos es una tarea imposible: ni siquiera se puede saber con claridad cómo votan por los proyectos de ley que discuten. Según entiendo esta es información pública (si no lo es, debería serlo) y sin embargo no hay un mecanismo sencillo para acceder a ella. ¿Si no la tiene Congreso Visible (que lleva años en esas) qué esperanza puede tener un ciudadano común de saber cómo vota su congresista?

23

He seguido jugando con los datos de homicidios. Entre ayer y hoy armé esta página para mirar las tablas de los cincuenta municipios con mayor número de homicidios y los cincuenta municipios con la mayor tasa de homicidios (por cada 100.000 habitantes) entre 1990 y 2013 (de paso resalto los que están en ambas listas al tiempo — los nombres de esos pocos capturan bien los focos de violencia más dura cada año). Son tablas muy sencillas de calcular pero no parecen estar disponibles en un formato amigable en ningún lado. El Observatorio de Derechos Humanos de la Presidencia (más amigable Mordor que ese sitio) tiene unos PDFs viejos que cubren por ahí desde 1998 hasta 2011 pero no encontré buenas listas (mapas sí tienen — son horribles). La semana pasada las generé a la carrera una noche usando R y quedé con ganas de hacer los mismos cálculos usando únicamente javascript. Esta vez fui más metódico y el código es más claro, organizado y hasta reutilizable que el adefesio del mapa (uno aprende montones haciendo esos ejercicios de carpintería). Escribí unas funciones muy básicas para cargar tablas en formato CSV e imprimirlas, seguro no muy óptimas pero funcionales al menos. Tal vez lo use de nuevo más adelante para soltar más tablas. Todavía no sé cómo se puede volver “responsive” el gráfico que encabeza la página. Seguiré investigando. También me parece que es un poco pesada. Tal vez es demasiado pedir que el navegador cargue y procese la tabla entera. El iPad se iba colgando.

Por cierto, el mapa de homicidios ahora contiene los datos desde 1990 hasta 2013.

20

Hoy armé una tabla bien organizada con el número y tasa de homicidios a nivel municipal entre 1990 y 2013. Aquí la dejo en CSV y RDA para descarga y uso libre. Durante el fin de semana incluiré en el mapa de homicidios los datos del 2011 a 2013.

Tres cálculos:

En promedio, entre 1990 y 2013, los cincuenta municipios con mayor tasa de homicidios (homicidios por cien mil habitantes) acumulan el 14.7% de los homicidios de cada año.

En promedio, entre 1990 y 2013, los cincuenta municipios con mayor número de homicidios acumulan el 61.7% de los homicidios de cada año.

En promedio, entre 1990 y 2013, las ciudades de Barranquilla, Bogotá, Cali y Medellín acumulan el 30.46% de los homicidios de cada año.

Pronto más.

Photo 2-20-2014, 9 37 53

19

Por culpa del mapa de homicidios, ayer me crucé con varias personas que se rehusan a aceptar datos (si es que los leen) cuando estos ponen en duda (o incluso cuando no demuestran contundentemente) la mitología política asumida. Frente a una tendencia clara de reducción de homicidios en un cierto período responden con teorías de conspiración de bolsillo y se sostienen (so pena de sonar enajenados o agüevados) en sus narrativas populares de los baños de sangre apocalípticos y la violencia desatada (¡la más alta de la historia!). Una mujer proponía ayer que la reducción de la tasa de homicidios entre 2002 y 2010 se debió (en las narrativas fáciles todo siempre se explica de un escobazo con un solo factor, en lugar de reconocer que detrás hay siempre una red compleja de condiciones no siempre controlables y altamente aleatorias) a manipulaciones perversas de la “tasa demográfica” (?) en la registraduría, para poner un ejemplo. Otros no pueden aceptar los datos porque consideran que la práctica de los “falsos positivos” (un eufemismo periodístico horrible y ya extendidísimo para referirse al asesinato metódico de muchachos por parte de miembros de las Fuerzas Militares para hacerlos pasar por guerrilleros caídos en combate, acreditar éxitos operativos y ganar permisos, recompensas y condecoraciones) debería amplificar contundentemente las estadísticas de homicidios en general (aunque en la práctica correspondan a menos del 3% de los homicidios cometidos en un año). Y es verdad que estos crímenes son una atrocidad inaceptable, una vergüenza. Y son todavía peores cuando se reconfirma todavía hoy que dentro de las Fuerzas Militares son percibidos como errores casi exculpables de la guerra. Pero yo no me atrevería a decir que el resto de homicidios (en la escala de decenas de miles cada año — las tasas de homicidio, incluso ahora que están en caída, siguen siendo preocupantes) son menos serios. Los conteos son burdos e inexactos (a veces incluso tendenciosos) pero ayudan a poner las historias que nos contamos en perspectiva, a contrastarlas, a cuestionarlas. Aprender a leer números y tomarlos en cuenta no limita ni pervierte. No nos debilita. No deforma el mundo (ese está afuera, no en las tablas, y hay que volver a él siempre). Tampoco nos convierte en cínicos. Es una habilidad valiosa (una de tantas) para no perderse en las exageraciones y vaguedades comunes en discursos políticos. Las gráficas y las tablas no son generadores automáticos de conclusiones incontrovertibles sino plataformas para discutir y tomar distancia ocasional. No podemos sobrevalorarlas pero tampoco desestimarlas.

14

Homicidios 2012 y 2013
Clic para agrandar. Datos de la policía colombiana. También hay unos de medicina legal que se supone que son distintos pero esos no los tengo. Como siempre, todo lo que se necesita para generarlo está acá.

13

Embajadores
Presencia diplomática de Colombia en el mundo a febrero de 2014. Países coloreados según el tipo de embajador presente. Haga clic en el mapa para verlo más grande. Datos compilados en colaboración por Alejandro Peláez y Sandra Borda. En este repositorio están los datos y el código para generar el mapa.

12

Los más educados es un pequeño documento interactivo en desarrollo, una herramienta, si se quiere, para pensar los resultados de las pruebas Saber 11 a nivel regional. Todavía no está terminado pero ya hay suficiente para jugar.

El viernes Jorge me escribió con la idea, era realmente sencilla: aparentemente no hay un documento oficial donde el Icfes discuta los resultados de los exámenes a nivel municipal. Y menos centrándose en los colegios públicos. Son dos restricciones fáciles de implementar. Después bastaba hacer algo de estadística descriptiva elemental para mirar los datos e intentar sacar preguntas de ahí. El propósito es que sea algo fácil de leer y usar. Más para la gente que para académicos. Ojalá que promueva una discusión pública del estado de la educación estatal que supere la fase de los “cien mejores colegios” y haga que los gobernantes y funcionarios regionales sean responsabilizados de los resultados de los colegios en su jurisdicción.

A veces pareciera que los colegios públicos no le importan a nadie. Como son públicos entonces pocos los consideran propios. La gente que decide cosas en Colombia por lo general estudió en colegios privados (para ilustrar, aquí hay una gráfica del número de estudiantes de último grado en colegios públicos y privados por “estrato” en 2011). En los círculos sociales de mis amigos nadie tiene hijos estudiando en colegios públicos. Es considerado medio impensable. Es crucial encontrar estrategias que superen las buenas intenciones para revalorar los colegios públicos y que recuperen el prestigio que alguna vez tuvieron (aquí hay una iniciativa seria y bien argumentada en esa dirección). El descuido social y gubernamental en el que se encuentra el sistema de colegios públicos lo ha convertido en un generador de exclusión social financiado con impuestos en lugar de ser el promotor de movilidad social que le corresponde. Un primer paso para devolverles su importancia es seguir atentamente su desempeño.

Es obvio que los resultados de los exámenes de estado no son un indicador contundente de lo que quiera que sea la “calidad de la educación”, pero pueden ser usados como un primer criterio a la mano para medir el impacto de políticas públicas. Lo ideal sería repetir este ejercicio regularmente y difundirlo tanto como se pueda.

El código en R para calcular los gráficos y tablas está disponible en este repositorio. Está desordenadísimo pero supongo que puede ayudar a alguien que quiera hacer gráficas similares. Si tengo tiempo intentaré pulirlo durante las próximas semanas, a medida que añado más información al documento.