Ayer terminé mis deberes para el curso de análisis de datos de Coursera. Me dejó insatisfecho. Sirvió, eso sí, como una introducción rápida a R. El contenido fue mal elegido, la improvisación reinó y el nivel de la exposición no era el mejor. Creo que el profesor no logró adecuar su estilo de enseñanza al formato. Pese a advertir varias veces sobre el riesgo de desconocer la matemática subyacente (en un diagrama llamó a esa aproximación “la zona peligrosa”), el curso se limitó a ofrecer recetas escuetas de algunas de las técnicas elementales disponibles sin mayor justificación matemática. Además, como los dos proyectos del curso debían ser evaluados por otros estudiantes, el énfasis del formulario de evaluación fue la forma de los reportes en lugar de la sustancia (lo que reforzaba la idea de que no se esperaba más que aplicar funciones mecánicamente). No lo más recomendable para un curso tan técnico. Tal vez el sistema de evaluación del curso de machine learning, basado en verificación automática del código que requerían los ejercicios, habría sido más adecuado al contenido (pretendido) de este curso. Me quedan dudas serias sobre la capacidad de esos cursos masivos en línea para ofrecer más que sobrevuelos superficiales cuando el material supera cierto nivel no muy alto de complejidad.

Este libro de Cosma Shalizi (pdf) parece una introducción mucho más apropiada al tema, o al menos más cercana al tipo de curso que me hubiera gustado tomar.