Rango Finito

fotoscódigoobservatorioshermanocerdo temas plots

distancias

Instagram

Si es cierto que, como dice Sergio, a nadie le interesan las fotos de los demás, probablemente también es cierto que a nadie le interesan las ideas de los demás. O las palabras. O los demás en general. Muchas personas viven en un mundo (triste) cuyo axioma central es ese. Mi sospecha, sin embargo, es que los demás si le interesan a los demás mucho más de lo que no les interesan o se permitirían reconocer. Y eso incluye en ocasiones las fotos de los demás y hasta las palabras. En especial cuando cada vez estamos todos más lejos y hay poquísimas oportunidades (cuando no ninguna) para compartir un lugar. Todos estos intercambios son formas de conversar.

Geografía de un bombardeo

Un artículo de lectura obligada escrito por Tim Maly diseccionando un ataque con “drones” en Paquistán:

Many commentators have compared the command stations to videogame platforms and have worried that this disconnects the pilots from combat and dehumanizes their targets. Many drone operators say it’s the opposite. Because they often surveil a target for days or weeks during operations, they develop a strange intimate relationship with those they kill. They watch targets eat with their families, sleep with their partners, and go about their daily lives. Then they watch them die.

Sin título [1977]

En alguna parte de esta novela alguien habla un cuadro que tiene un hueco en el centro. La mención parece casual pero tal vez no lo sea. Sin título [1977] se refiere al nombre de un cuadro imposible de pintar. Su sustancia, como un fantasma, atormenta a los miembros de una familia aristocrática bogotana consecuentemente disfuncional. Capa a capa, Posada revela en tres monólogos intercalados los ingredientes que componen el cuadro. El primer monólogo es el de un viejo atrapado en su demencia nostálgica. El segundo es el de su hija, la pintora del cuadro, quien en medio de una crisis matrimonial que parece definitiva asimila las razones reprimidas que la llevaron a distanciarse de su papá. Y el tercero, probablemente el mejor de los tres, el de un niño pequeño, el hijo mayor de la familia, que desde el pasado destapa los secretos escabrosos que prefiguran el momento perdido. El niño, devenido en detective sociosexual, carga el peso emocional de la trama. Los tres monólogos conforman en conjunto un triángulo de incomunicaciones donde cada personaje está hundido en su drama personal y están incapacitados, por sus circunstancias, por el pasado que comparten, añoran o viven, para expresar lo que sienten. Esta incapacidad insalvable determina sus vidas.

|∆t|=∆t

Hoy en el bus al hospital pensaba que el tiempo distancia a las personas mucho más que el espacio. Es imposible volver intacto de un para siempre. La rigidez del tiempo defiende a los nostálgicos (o sea a todos) de la decepción del regreso a lo que ya no es.

Distancias

La abuela pediatra y Laia.

I went through a sudden period where I couldn’t read

Llevo meses postergando este ejercicio. Hace un par de semanas le dediqué una tarde, pero con la muerte del computador perdí el trabajo (entre muchas otras cosas), así que ayer por la noche lo volví a hacer. El resultado final es más oscuro que iluminador pero qué más da. Su génesis se encuentra en el largo monólogo de Chris Fogle que ocupa el capítulo §22 de The Pale King, la (pseudo)novela póstuma de David Wallace:

[I]nstead of reading something I’d count the words in it, as though reading was the same as just counting the words. [En lugar de leer algo contaba sus palabras, como si leer fuera lo mismo que sólo contar palabras.]

The Pale King (en español El rey pálido, traducción de Javier Calvo) es el esqueleto escueto de una novela que, estimo, rondaría las 1500 páginas (i.e., apenas un tercio de la novela fue concluída). Está estructurada (al menos en su primera edición) en 50 capítulos que, tras la muerte de Wallace, fueron dispuestos en orden lineal por su editor (Wallace no dejó mayores directivas al respecto). Mi pregunta inicial, intencionalmente ingenua, era cómo automatizar ese trabajo o al menos facilitarlo mediante un procesamiento automático del texto que involucrara, cómo no, conteos de palabras.

Gráfico del logaritmo de la extensión en carácteres de cada uno de los capítulos de The Pale King

Con el tiempo, sin embargo, me decanté por un ejercicio alternativo más a mi alcance: (1) Calcular una distancia léxica entre los capítulos, y (2) Disponerlos como puntos en un plano de manera que respetaran (dentro de lo posible) la distancia propuesta. Mi teoría era que un gráfico de ese estilo sería una herramienta útil (un criterio más) para facilitar la organización del texto. Ya no estoy tan seguro.

*

El primer componente del ejercicio es la distancia. La aproximación más intuitiva al cálculo de distancias entre documentos (este artículo de Anna Huang ofrece un sobrevuelo por varios métodos) se basa en recolectar una lista de palabras presentes en los documentos (más detalles adelante) y utilizarlas como base de un espacio vectorial. Bajo este esquema, a cada documento le corresponde una combinación lineal de la base con escalares elegidos de acuerdo al número de apariciones (frecuencia) de la palabra en el documento. Así, si la lista de palabras es $\{v_i\colon 1 \leq i \leq M\}$, entonces un documento $d$ es representado por el vector $M$-dimensional $$\sum_{i=1}^M f_i(d) v_i,$$ donde $f_i(d)$ es igual al número de apariciones de la palabra $v_i$ en el documento $d$. Una vez representados de esta manera, calcular distancias entre documentos se reduce a aplicar el teorema de Pitágoras.

Una versión sólo un poco más sofisticada de lo anterior se basa en la siguiente observación: si una palabra $v_i$ es muy frecuente en un documento $d$ pero también está presente en la mayoría de los documentos disponibles (supongamos que tenemos $N$ documentos) entonces probablemente no sea tan representativa del documento $d$ como cabría esperar inicialmente. Para tomar en cuenta esto, reescribimos la representación vectorial del documento $d$ como $$\sum_{i=1}^M f_i(d) \log\left (\frac{N}{P_i}\right ) v_i,$$ donde $P_i$ es igual al número de documentos que contienen la palabra $v_i$. De esta manera, la frecuencia de la palabra $v_i$ en cada documento es penalizada multiplicándola por un número ($\log(\frac{N}{P_i})$) que se acerca a cero entre más documentos la mencionen.

Así, al final el problema del cálculo de distancias se reduce a decidir cuál debe ser la lista de palabras que se utilicen como base del espacio vectorial de documentos. Siguiendo (a mano alzada) el artículo de Huang, tras una serie de filtros sencillos que removieran diferencias innecesarias y contenido irrelevante busqué (usando NLTK, la navaja suiza del análisis automatizado de texto) todas las palabras que aparecieran más de siete veces en todo el libro. 2060 palabras (aproximadamente un décimo de las que contiene el libro) cumplían con esta condición. Esto en particular implica que los capítulos del libro son representados por puntos en un espacio de dos mil y tantas dimensiones. Calcular distancias entre ellos, ya lo dije, es sencillo. Verlos en un plano es otra historia.

*

Había sobrestimado seriamente la incomprensibilidad del texto. Un conteo burdo de nombres propios en páginas 12-21 ofrece 38, 28, 17, 28, 40, 32, 31, 31, 18, 22. Número medio por página, 28,2, desviación estándar de 6,9, 70% de los datos a s de la media. Número promedio de palabras por página basado en una muestra de 2, 302. O sea 9% de comprensibilidad. Alto.

*

No sé por qué pensaba que el problema de aplanar dimensiones debía estar completa y contundentemente resuelto desde hace décadas. Fue difícil dar por mi cuenta con soluciones convincentes. Finalmente, Juan Manuel me sugirió revisar los métodos de manifold learning implementados en scikit-learn. Para mi sorpresa, varios de los algoritmos disponibles son bastante recientes y provienen de laboratorios de ciencias cognitivas interesados en visión. El que elegí para mi ejercicio, Isomap, fue desarrollado por Josh Tenenbaum (y amigos) cuando trabajaba en Stanford.

La conexión entre visión y reducción de dimensiones se basa en el hecho, permítome ser burdo, de que el ojo cuenta con (muchísimos) sensores que registran el estímulo (imaginen cada sensor como un vector independiente) y luego el cerebro toma esas (combinaciones lineales de) señales y compone una imagen bidimensional (o tal vez un par). ¿Cómo lo hace? Ni idea. Los métodos de manifold analysis intentan simularlo. La idea es asumir que un conjunto de puntos en un espacio de dimensión alta yacen sobre una superficie (de ahí el término manifold) y luego aplanarla preservando en lo posible distancias locales. En el caso particular de Isomap primero se construye un grafo que captura, mediante la imposición de vértices, el sabor local de la colección de puntos, luego se define una distancia optimizada sobre el grafo y finalmente se soluciona un problema de optimización para encontrar los puntos de baja dimensión correspondientes (para el interesado en por qué y cómo funciona, aquí hay detalles y aquí todavía más detalles). Como es de esperarse, entre más puntos, mejor el resultado.

*

Tal vez cincuenta puntos no sean suficientes. (Aquí más grande.)

Este de arriba es el resultado de aplicar Isomap a una versión normalizada (para evitar desequilibrios por diferencias de extensión) de los 50 puntos 2060-dimensionales que representan, de acuerdo a la lista de palabras elegidas, los 50 capítulos de The Pale King. Así se ve. Con Javier discutimos una noche los posibles significados de varios gráficos similares a este pero no logramos decidir si se conectaban de alguna manera con la sustancia del libro, lo que quiera que eso signifique. La verdad, prefiero que sea así. El anticlímax tiene naturaleza de Buda.

*

Anoche, antes de acostarme, se me ocurrió un posible orden lineal que se desprendería de estos cálculos: organizar los capítulos de acuerdo a la distancia al centro de masa (Isomap lo clava en $(0,0)$). El orden sería: §20, §6, §9, §22, §2, §14, §13, §7, §15, §16, §35, §32, §21, §46, §31, §17, §43, §26, §29, §45, §4, §8, §42, §19, §39, §10, §38, §33, §24, §50, §36, §27, §44, §47, §49, §12, §34, §23, §5, §1, §18, §11, §28, §30, §41, §48, §37, §3, §40 y §25. Ya puestos, calculé directamente sobre los puntos originales (en el espacio de dimensión 2060) y en ese caso (cambia, obviamente) el orden es: §22, §24, §2, §27, §42, §30, §7, §19, §33, §9, §5, §14, §47, §6, §49, §16, §8, §46, §43, §15, §13, §23, §36, §32, §26, §45, §39, §3, §12, §18, §29, §20, §17, §48, §38, §37, §50, §21, §31, §4, §35, §44, §1, §11, §41, §40, §28, §34, §10 y §25. En ambos, el recorrido se cierra en ese capítulo neurótico a dos columnas (Devils are actually angels) que describe la tediosa cotidianidad diaria de la oficina de impuestos (casi todos los personajes son mencionados), y se inicia (o casi) con el soliloquio de Chris Fogle (§22) sobre, entre otras cosas, su tendencia a contar palabras en lugar de leer. También podrían organizarse en sentido inverso, como en una espiral hacia el origen. Tal vez eso tenga más sentido.

Nápoles

Pensé en escribir un cuento largo sobre el viaje con mis papás y mi hermana al Zoológico-Hacienda Nápoles, de propiedad de Pablo Escobar, por allá en mil novecientos ochenta y algo (¿dos?). Creo que fue el último viaje que hicimos juntos. Probablemente hubo más encuentros pero en mi memoria fue la última vez que fuimos dos papás con dos hijos que hacen cosas, como en las familias de las películas. Mi siguiente recuerdo de un encuentro cordial fue en dos mil uno, cuando mi hermana se graduó de la universidad y fuimos a almorzar. Ahora todos vivimos en dimensiones distintas. Dudo que volvamos a reunirnos otra vez.

*

Toda narración de memorias infantiles es tendenciosa. El niño narrativo de seis años es impostura e idealización porque su sistema interpretativo está apenas en desarrollo. Todo tiene sentido, pero la noción de sentido es todavía vaporosa. Las conexiones semánticas son mucho más laxas. En la memoria subsisten apenas las interpretaciones fragmentadas de la vivencia. No hay narración ni moralejas. De cierta manera no hay realidad. Su reinterpretación a treinta años altera (pervierte) el registro original hasta convertir al niño narrativo en médium voluntarioso de su adulto ulterior, ya entrenado para entender de acuerdo a sentidos y significados establecidos, atrapado para siempre en el paso normatizado del tiempo.

*

En lugar de un cuento largo, colección breve de recuerdos y anotaciones dispersas (lo único que me puedo permitir últimamente): en Puerto Triunfo, el día que compramos (¿se compraban?) las boletas para entrar al zoológico, cae nieve sobre el carro mientras esperamos nuestro turno. Parece un pueblo de juguete, de casa blancas, desértico, y cae nieve (aunque también hace sol). Hay un murciélago agonizante sobre la cama de mis papás. El ventilador lo desmembró. Sangre por todos lados. Las ventanas del Fiat no se abren. Un elefante mete la trompa por una hendidura en la ventana y toca a mi hermana. Mis papás no existen, no realmente. Están ahí pero apenas como apoyo decorativo y logístico. Su viaje era distinto al mío. Es un viaje que imagino triste y final. Tenían treinta años. Llevaban cuatro separados. Mi viaje era feliz. El murciélago en la sábana ensangrentada amarrada como una bolsa. Los avestruces asaltan el Fiat. Mi hermana llora. Un león a lo lejos, al final del recorrido. Aviones viejos emplazados a la orilla de la carretera. El hostal donde dormimos se llama Los Colores. Casas de techo colorido encajadas en una colina. Hay algunas fotos. A veces sueño que vuelvo a ese hostal y sigue ahí pero está abandonado.

He Got Game

Lo que importa no es el juego sino lo que está detrás del juego. Lo que el juego resuelve. Todos quieren un pedazo de la carne de Jesus, de su salvación. Jesus es un artículo que se compra y se vende. Nadie pone en discusión que ese es su destino. El dilema de Jesus no es si venderse sino a quién. Aún así, en su indecisión hay carácter. Jesus quiere que el juego signifique algo más que el juego detrás del juego: fuck the game if it ain’t sayin nuttin. El juego debe ser una herramienta para ascender y escapar de la vida predefinida de los negros, de sus futuros muertos. Jake quería eso para Jesus. Esa era su herencia. Algún día Jesus lo entendería. Jake tiene siete días para ganar su libertad, pero no quiere ser libre. Su condena es justa. No merece el perdón. Jake quisiera regresar en el tiempo y reestablecer lo perdido, pero sabe que eso es imposible. Sólo quedan las enseñanzas del juego y lo que está detrás del juego: la tristeza, el arrepentimiento, los errores, las heridas y el rencor. El hijo perdido en una cancha que crece y se aleja.

There’s something happening here. What it is ain’t exactly clear.