Rango Finito

fotoscódigoobservatorioshermanocerdo temas plots

juegos

192

Ayer en la piscina Laia me dijo que jugáramos un juego. El juego consistía en que yo me hundía y nunca jamás volvía a salir: me quedaba debajo del agua para siempre.

12

Este cómic (visto acá) me dejó pensando:


Digamos que tenemos a los seis doctores del estudio y que el que tiene la pistola (el cuarto) aprieta el gatillo y se vuela los sesos. El cómic mismo sugiere que tal vez los primeros tres doctores puedan acreditar (momentáneamente) que la ruleta rusa es segura, pero el quinto y el sexto, habiendo presenciado la muerte de su colega, de seguro no estén de acuerdo con esta afirmación. Para constatar esto basta ver sus caras de horror en el momento en el que el cuarto doctor se pone la pistola en la sien — imaginen que esa cabeza explotara. Así, un cálculo más justo del experimento sería el siguiente: dado un juego de ruleta rusa con seis doctores numerados, si la bala le corresponde al doctor N, entonces apenas N-1 pueden acreditar que la ruleta rusa es segura. De resto no. Sea X la variable aleatoria que dice cuántos doctores pueden asegurar que la ruleta rusa es segura. Si el primer doctor se pega el tiro, X es igual a cero. Si el último doctor se pega el tiro, X es igual a cinco. Asumiendo que la probabilidad de recibir el balazo es uniforme entonces el valor esperado para X es: $$ \frac{0+1+2+3+4+5}{6} = \frac{15}{6} = 2.5. $$ O sea que si se hiciera lo que plantea el cómic lo más probable es que apenas 2.5 de cada seis (en promedio) aseguraran que la ruleta rusa es segura, un estimado más cercano a la realidad psicológica del juego.

7

pollock paleta

4

Una pregunta: ¿dados los resultados de las pruebas Saber 11 por colegios cuál es el área evaluada cuyo resultado mejor prediría si el colegio es oficial o privado?

Una forma (tal vez muy ingenua, no estoy seguro) de abordar esta pregunta es a través de árboles de clasificación. Un árbol de clasificación intenta encontrar la variable de entrada que mejor parte los datos de acuerdo a la variable a predecir. Este procedimiento se itera en cada nuevo nivel de partición y de ahí se obtiene el árbol. Si generamos un árbol de clasificación, la variable contemplada en el primer nodo del árbol es, de cierta forma técnica muy precisa, la que tiene la mayor capacidad para clasificar la variable objetivo.

¿Y qué pasa cuando se generan árboles de clasificación con los resultados por áreas de las pruebas Saber 11 como variables de entrada y la naturaleza (oficial o no) del colegio como variable objetivo?

Pasa que de 2011 a 2013 la variable principal es siempre la misma: inglés. Esto no sorprende. En la lista de razones para inscribir a los niños en colegios privados usualmente figura el inglés que supuestamente recibirán. Más difícil, sin embargo, es intentar adivinar cuál sería la segunda área. Detengan la lectura unos segundos e intenten hipotetizar cuál sería (de haber alguna) y por qué.

Para intentar responder esta subpregunta usemos el mismo procedimiento pero esta vez tomando como variables de entrada los resultados de todas las áreas exceptuando inglés.

Una vez más, los tres árboles tienen la misma variable principal. En este caso, lenguaje.

¿Adivinaron?

Por curiosidad repetí el ejercicio para ver si la tercera variable (de acuerdo a este orden tal vez no muy confiable) también era la misma y no: en 2011 es sociales y en 2012 y 2013 es biología.

Aquí los árboles para los tres años:

arboles
Click para verlo más grande. Cada nodo dice cuál es la proporción de privados y públicos, cuál es mayoría y cuál es el porcentaje de datos total en ese punto. Los árboles fueron generados con rpart y pintados con el comando fancyRpartPlot del paquete rattle de R. Aparecen podados en versiones “óptimas” de acuerdo a un criterio técnico que no viene al caso.

Dudas: ¿Es coincidencia que las primeras dos sean inglés y lenguaje o sería más o menos uniforme si se pudieran considerar otros años? Si no es coincidencia, ¿qué explicaría que lenguaje sea el diferenciador de colegios públicos y privados más eficiente después de inglés?

Otra duda: ¿Alguna forma más rigurosa de abordar la pregunta?

*

Increíblemente, no hay ningún buen graficador limpio y nativo de los árboles de clasificación que produce scikit-learn. Depender de graphviz me parece burdo. Lo ideal sería que matplotlib permitiera graficar árboles fácilmente, supongo. De pronto sería una buena forma de entender matplotlib a fondo. ¿Tarea para 2014?

Por lo pronto, R sigue siendo muchísimo más cómodo para estas vainas.

*

Hoy dejamos ir a Laia en la piscina agarrada sólo de su fideo de espuma. Pateó su camino hasta la mamá mientras yo la seguía de cerca por si acaso el sistema de flotación (todavía bastante endeble) fallaba. La primera vez estuvo sola unos veinte segundos. La segunda vez creo que alcanzó el minuto y se veía cansada. No avanzó sino un par de metros cada vez. Creo que tendremos a Laia chapoteando libre y sin ayuda antes de que cumpla los dos años.

Nieve

Azulejo de visita en el balcón en busca de comida.

Ayer empezó a caer nieve y hoy amaneció nevando con todavía más fuerza. Los tres últimos años la nieve había llegado tarde, bien entrado enero. Este año llegó de la mano del invierno, como corresponde.

Nunca he logrado acostumbrarme a la visión de la nieve como algo normal que hace parte de un ciclo natural propio de estas latitudes. Siempre que la vuelvo a ver después de varios meses de ausencia siento la misma extrañeza. Su imponencia me abruma: el paisaje cambia, surgen nuevos ruidos, los colores se saturan, los silencios nocturnos son más intensos. Racionalmente lo entiendo pero el acceso a ese sector del disco se desactiva, como ante monumentos majestuosos.

Hoy Laia vio la nieve por primera vez. Seguro la había visto antes, este ya es su segundo invierno, pero es la primera vez que tiene suficiente consciencia como para apreciar lo que pasa. Cuando despertó de la siesta de la mañana la paré en una silla junto a la ventana a ver los copos caer. Eran grandes. El cielo había amanecido azul pero hacia el mediodía estaba gris otra vez y la nevada arreciaba. Laia sonreía y señalaba los copos. Todavía no hay suficiente nieve acumulada para salir a jugar, pero pronto la habrá. Entonces saldremos y jugaremos. Su relación con la nieve será probablemente distinta de la mía. La nieve hará parte de su vida desde siempre. No habrá estupor admirado sino, tal vez, un cariño feliz asociado a recuerdos tempranos de juegos afuera en su infancia. Mi deidad será para Laia una buena amiga más.

Mi papá nos envió hoy este poema de Nicanor Parra.

Sobrevuelo

Durante el último mes vi Pacific Rim y Upstream Color. También leí Red Handed y me zampé de un golpe Shadowrun Returns. Los recomiendo con cautela.

Pasos

¿Qué tan segura será la gente con respecto a las medidas que toma usando pasos? ¿Qué tan precisa? En los libros de piratas entierran el tesoro usando pasos, ¿alguien habrá estudiado el nivel de precisión de esa técnica de medición individual y transversalmente?

***

Conjetura: La gente que hace yoga debe ser buena reproduciendo medidas tomadas en pasos.

***

Juego: un jugador es llevado a un escenario donde le presentan una distancia sobre la tierra y otra vertical. El jugador no puede usar ninguna herramienta para medir estas distancias diferente de lo que le permita su propio cuerpo (pies, palmas, pasos, codos, etc). Tiene un número determinado de minutos para estudiarlas. Luego, en otro escenario, el jugador debe reproducir estas mismas medidas. De nuevo tiene un límite de tiempo. Gana el jugador que logre el menor promedio de errores.

Sondeos

Pensaba en cómo usar sondeos en línea para medir popularidad sincera. Con popularidad sincera me refiero a la existencia de un grupo suficientemente amplio de personas que están dispuestas a respaldar su elección sin trampas ni abusos del sistema de votación. Otorgar la victoria al mayor número de votos por lo general conduce a aberraciones como lo que pasó en el Gran Colombiano. Lo correcto, sin entrar en detalles técnicos (que se me escapan totalmente), sería declarar ganador a aquel que reciba la tercera mejor votación, digamos. O incluso la votación media. Sería un tipo de victoria muchísimo más difícil de manipular y, por ejemplo con la media, hablaría del sentir del centro (lo que quiera decir) y por tanto sería probablemente más tolerable como resultado para todos los interesados en el sondeo. ¿Cuál será la mejor forma de medir popularidad sincera (definición vaga, claro) en un sondeo en línea?

***

Otro juego con sondeos en el que estuve pensando: un concurso donde los lectores de una serie de libros infantiles deben decidir el nombre, hasta ahora oculto, de la protagonista. Se ofrecen cinco nombres. Se invita a votar pero se incluye la siguiente cláusula: entre los que voten por el nombre menos popular se rifará un premio serio relacionado con la historia de los libros (un viaje, tal vez). ¿Cómo afectaría la rifa el resultado de la votación? (¿Cómo simular algo así?)

Abismo

La columna de hoy va sobre Abismo andino, un juego de estrategia diseñado por Volko Ruhnke sobre la guerra colombiana en los noventa y principios de los dos mil que salió el año pasado con algún éxito entre la comunidad de jugadores de juegos de estrategia. Hace un par de semanas Óscar lo presentó en twitter y yo me compré una copia para probarlo. El juego tiene varias gracias que creo que contribuyen a hacerlo a la vez interesante y entretenido: una es que el juego no se concentra en la batalla militar sino en el interés de los bandos por ganar el apoyo popular (lo que se conoce como operaciones de contra insurgencia en jerga militar) y otra es que cada bando es esencialmente distinto de los demás en cuanto a metas, uso de recursos y capacidad operativa. Esta asimetría logra reflejar (de una forma muy simplificada, obviamente) las interrelaciones complejas entre los actores armados en conflicto. Para Ruhnke el país pasó durante esa década y media de estar al borde del colapso a tener una insurgencia (o dos (o tres)), si no derrotada(s), al menos reducidas a un nivel donde dejaron de constituir una amenaza para el estado. Esto es discutible de muchas formas distintas, pero no me parece que pervierta el sentido del juego particularmente. Jorge sugirió en Twitter que este juego podría ser una forma de iniciar conversaciones sobre la guerra en los colegios. Sería buenísimo. Ojalá que alguna editorial (¿independiente?) colombiana se animara conseguir la licencia del juego y sacar una versión de bajo costo para el país.

A continuación algunos enlaces relacionados para enriquecer la columna:

  • En el sitio de GMT (desde donde se puede comprar) están disponibles las reglas y el playbook. El playbook contiene dos ejemplos de partidas (para ayudar a entender las reglas y la dinámica del juego) y también un texto de Ruhnke donde explica las ideas detrás del diseño del juego, el contexto histórico de las cartas que describen el estado del juego en cada momento y las referencias en las que se basó.
  • Aquí hay una entrevista larga a Ruhnke sobre el juego y sus motivaciones para interesarse en juegos de contra insurgencia. Abismo andino es el primero de una serie de juegos usando el mismo sistema de reglas. También hay uno sobre Cuba y otro sobre Afganistán.
  • Otro sitio obligado de referencia sobre este y cualquier otro juego es Board Game Geek. Aquí por ejemplo una reseña del juego en español. Y aquí hay una lista de documentos relacionados para descargar.
  • Aunque no lo he intentado, el juego se puede jugar con computadores usando el motor genérico de juegos de mesa Vassal (gratuito y de código abierto). Aquí está el módulo de Vassal para jugar Abismo andino. Si alguien más quiere animarse podemos armar un grupo con Luis para probar.

De paso, olvidé enlazar en el blog mis dos columnas anteriores: Carreras perdidas trata sobre la forma (equivocada, en mi opinión) como los medios de comunicación establecidos han decidido competir con las redes sociales. Picos gemelos habla de dos avances recientes muy importantes en teoría aditiva de números.

Capicúas

Esta tarde escribí un cuaderno de iPython para jugar con números capicúas. La motivación fue este problema propuesto por Cédric Villani en su sección recién inaugurada de juegos matemáticos de Le Monde. (Loable el esfuerzo de Villani por promover personalmente la matemática entre la gente del común, por cierto. Y adorable su uso (francesísimo) de tablero y tiza para presentar y resolver los problemas. Cada vez me cae mejor.)

Robótica

Autorretrato

No cualquiera puede ser darks.

Saber y perder

La columna de hoy (o de ayer, no la veo en portada hoy domingo, pero se supone que salió hoy) se desprende de una revisión sencilla de los resultados por colegios de las pruebas Saber 11 de este año y el pasado jugando con herramientas elementales de estadística descriptiva disponibles en cualquier hoja de cálculo.

Como complemento, la observación que desencadenó la columna: en la página de la revista Dinero donde los resultados de este año están disponibles para descarga se lee:

Siglas: Dado que la mayor parte de los colegios son privados (no oficiales) solo se indica cuando son públicos (oficiales) mediante la sigla “(Of)”.

Como la anotación me intrigó, filtré los datos para mirar cuántos colegios tenían “(Of)” al final del nombre. El resultado, 8168 de 12615. Es decir, un 64%. de los colegios son oficiales; no precisamente una minoría. Al contar estudiantes (en lugar de colegios) se descubre que un 71.77% de las personas que presentan las pruebas Saber 11 estudia en un colegio oficial. Quedé con la duda de si los periodistas de Dinero se equivocaron o si de verdad piensan que la mayor parte de los colegios colombianos son privados y no se molestaron en contar. Como sea, la anotación ilustra bien la profundidad con la que los muchachos de Dinero estudiaron sus datos.

De paso: un análisis (pdf) de las ventajas de los colegios privados de acuerdo a las pruebas Pisa.

Sesgo en públicos 2012: 0.526599249105; Sesgo en privados 2012: 1.02662898427; Promedio en públicos 2012: 42.8033300686; Promedio en privados 2012: 46.0227293165; Mediana en públicos 2012: 42.7; Mediana en privados 2012: 44.65. Sesgo en públicos 2011: 0.207080369486; Sesgo en privados 2011: 0.673856432328; Promedio en públicos 2011: 42.2170533907; Promedio en privados 2011: 45.6859889984; Mediana en públicos 2011: 42.26; Mediana en privados 2011: 44.65 (Qué sencillo y agradable utilizar los cuadernos de iPython y la librería Pandas de análisis de datos para hacer estos cálculos, por cierto.)

Indecisión

La paradoja de Monty Hall es un ejemplo clásico de contraintuitividad de la noción de probabilidad. En un programa de concurso presentado por Monty Hall, el concursante debe elegir una de tres puertas posibles. Detrás de una de las tres puertas se oculta un premio. Las otras dos puertas conducen al vacío. El concursante elige una de las tres puertas de acuerdo a su intuición extrasensorial pero luego, antes de revelar el premio, Monty Hall abre una de las otras dos puertas restantes y detrás de ella no hay nada (sea lo que sea que haya elegido el jugador, siempre puede hacer esto). Una vez ahí, para amplificar el drama, Hall le pregunta al jugador si quiere cambiar de puerta. Sorprendentemente, aceptar la propuesta de Hall es la mejor estrategia.

¿La razón? Una manera sencilla de verlo es imaginar dos jugadores. Ambos inicialmente eligen la misma puerta pero mientras el primero se sostiene en su decisión el segundo no. El primero gana si la primera puerta elegida oculta el premio, es decir, tiene una probabilidad en tres. Note, además, que ese es precisamente el único caso (de tres) en el que el segundo pierde. O sea, el segundo gana con una probabilidad de dos tercios. La liberación de información aparentemente vacía beneficia al segundo jugador.

La pseudomoraleja para la vida de la paradoja de Monty Hall es intrigante: si usted enfrenta más de dos alternativas dudosas y una vez la decisión ha sido tomada pero antes de ejecutarla alguien o algo le ofrece una demostración concluyente de que otra opción (una que ya había descartado con duda) debía ser sin duda descartada, conviene desechar (o al menos reconsiderar) la decisión tomada.

Por eso yo nunca decido nada. Prefiero esperar a que todo se descarte por su propio peso.

Lecciones de Marketing Editorial

Un libro de introducción al ajedrez en la sección de juegos y pasatiempos de Chapters. Título: Beyond Sudoku.