Rango Finito

fotoscódigoobservatorioshermanocerdo temas plots

data mining

La voz de la colmena

En la columna de hoy hablo de la tendencia reciente a creer que hay conocimiento en el ruido que generamos en redes sociales. Sin duda hay algo de cierto ahí (Twitter es un focus groups casi idílico) pero tal vez no es tanto como queremos creer. Y, más importante, la información disponible en esas bases de datos depende seriamente de las dinámicas de uso de las diferentes redes sociales, que son determinadas por sus modelos de negocio y las jerarquías que establecen. Las redes sociales, en esto hay que insistir muchísimo, no son herramientas neutras.

Para complementar la columna, como siempre, algunos enlaces:

Los colores del mundo

El orden de aparición de términos para los colores (de acuerdo a observaciones de Brent Berlin y Paul Kay en 1969 que casi corroboraban, sin saberlo, observaciones previas de Lazarus Geiger en 1867 (!)) es generalmente blanco y negro → rojo → verde ↔ amarillo → azul. Para 1800 todos estos términos estaban desde hace mucho tiempo disponibles en el idioma inglés, pero aún así las frecuencia de uso de los términos se sostenían en ese orden primigenio natural. Aquí un zoom de la gráfica en inglés desde 1800 hasta 1820, justo antes del inicio del misterioso ascenso del azul:

Mónica me hizo caer en cuenta de lo extraño que es que para ese momento el orden de frecuencia todavía corresponda con el orden original. Si mi interpretación del libro de Deutscher es correcta, el orden original está relacionado con la utilidad práctica de tener términos para cada color y esta utilidad práctica a su vez estaría relacionada con la distribución de colores en la vida cotidiana de las personas (el cielo, por cierto, no hace parte de la vida cotidiana, es sólo un telón). Parecería entonces que hasta bien entrados en el siglo diecinueve (¿la revolución industrial, quizás?) la paleta de colores prácticos (lo que quiera decir) de la vida cotidiana no cambió significativamente y de hecho el gráfico podría ser una buena manera de argumentar por qué surgieron en ese orden (según Deutscher eso todavía no está claro): precisamente porque ese era el orden en el que eran necesarios para colorear el mundo hasta 1820.

Mejor dicho: no es que el conteo de frecuencias refleje el orden sino que el orden es explicado burdamente por el conteo de frecuencias.

Autorretrato de Anders Zorn de 1896. Aquí mi amigo Sonat Süer muestra cómo autopintarlo utilizando la paleta de colores que Zorn lleva en el cuadro.

Dado lo anterior, reformulemos la pregunta que hacía al final de la entrada pasada: ¿qué pasó en el mundo hacia 1800 para que la paleta de colores útiles de repente requiriera mayor uso del azul?

Ejercicio computacional semisencillo: recopilar un archivo de cuadros figurativos digitalizados en buen formato que cubra con suficiente detalle la producción desde, por decir algo, 1500 hasta la actualidad (esto, creo, es lo complicado) y calcular, como con n-gramas (esto debería ser mucho más fácil), el porcentaje de uso de una lista de colores básicos (normalizando tonos, claro está). ¿Cuál será el gráfico correspondiente? ¿Se relacionará con el orden primigenio? ¿Será detectable el ascenso (lingüístico) del azul? ¿El orden de predominancia cambiará sustancialmente con el tiempo? ¿Qué tan distintas serán las distribuciones de colores de la pintura producida en Europa y la producida en China?