¿Podremos prescindir de los Científicos de Datos?


Uno de los temas más interesantes de discusión actuales en Big Data y Data Science es hasta donde podrá llegar la automatización de los procesos y si en breve se podrá prescindir de los Data Scientists.

La pregunta tiene mucho sentido, en tanto en cuanto un desarrollo de Machine Learning se realiza en lenguajes de programación, (Python, R, Octave), que permiten incorporar al código prácticamente cualquier trabajo a realizar con los datos y con los resultados de las operaciones, permitiendo realizar diferentes acciones en función de éstos, es decir, replicando por ejemplo un proceso del mejor científico de datos del mundo, (y a ver quien supera eso 😉).

Otro argumento muy potente a favor de esta posibilidad de enviarnos todos al paro, (incluso casi antes de haber empezado),  es el trabajo de Banko & Brill (2001), que demuestra que aumentar el número de datos mejora la calidad del algoritmo, sea cual sea el tipo de éste. 
Esto significa que, al ser más importante la cantidad de datos que la actuación humana en la elaboración del algoritmo, está última se vuelve prescindible. 

De hecho existen algunas plataformas en internet que prácticamente te hacen ellas solitas un proceso completo de Machine Learning solo con proporcionarles los datos, como Big ML, que conozco bien porque he probado bastante en mi escasa todavía experiencia. 

Todos los que nos interesan estos temas sabemos que la tendencia a la automatización en todas las áreas es un proceso imparable. Sin embargo, no creo que la automatización vaya a eliminar la necesidad de Data Scientists, sino que para ser útiles éstos, (como individuos o como equipo), tengan que estar altamente formados en las disciplinas clave: matemáticas, programación y experiencia en los sectores a que se aplique, lo que les permita adaptar los modelos y revisar la validez de las conclusiones.

Por lo que estoy comprobando personalmente en mi proyecto actual y en un sector que conozco bien, un proceso de ML aplicado automáticamente sin supervisión experta tiene más peligro que un mono con dos pistolas

Comentarios