El mejor libro para ciencia de datos por el Wickham, creador de todo un nuevo lenguaje que permite remodelar, visualizar y resumir datos para extraer de ellos información.
He tomado varios cursos de Grolemund y destaca que va de lo simple a lo complejo. Por ejemplo, el curso de HarvardX comienza con...FUNCIONES. Hay algunos que ocupamos R para procesar cantidades pequeñas de datos, como en estudios epidemiológicos o clínicos, en comparación a quienes procesan datos de Facebook o Google, que son TB de información. En este libro las funciones vienen en la parte 15. O sea, este libro va enseñando realmente de menos a más, comenzando con lo fácil y simple para llegar a lo difícil y complejo, pero usualmente más útil.
Por ejemplo, en R Base ordenar sería algo como
df[order(df$recuento,decreasing=TRUE), ]
mientras que con dplyr sería arrange(df, desc(recuento))
lo que un humano puede leer: ordenar (la base de datos, en forma descendente mediante la variable Count. El hecho que ahora pueda prescindir de los [] permite agilizar mucho cualquier escritura de código.
La calidad del libro es perfecta, con varios colores que resaltan distintas partes de los códigos para indicar como funcionan.
Es un libro indispensable para cualquiera que tenga que analizar datos.