Data Science, la carrera del futuro

on 11 Julio, 2017 in Analítica

Motivación

Conversaba con unos colegas sobre lo que viene en el futuro cercano -sino inmediato- para el Perú. Tiempo atrás había caído en la cuenta que estamos un país con más de 10 años de crecimiento económico continuo, a pesar de las crisis internacionales y temas políticos propios del país. Este crecimiento no es gratuito, es fruto de la responsabilidad fiscal y monetaria con la que venimos trabajando, puede no haber erradicado la pobreza, pero la ha disminuido sentando las bases para un crecimiento aún mayor.

Soñar en la realidad del mañana

Justo de ese punto partió mi conversación. Como científico de datos tengo un sueño, este es replicar lo que sucede en otras latitudes y ayudar con ello a erradicar la pobreza de nuestro amado Perú. ¿A qué me refiero específicamente?. Quisiera que tengamos una “pequeña India”, un centro global de técnicos y profesionales en el manejo de datos y programación. Como decía la persona con quien conversaba ya se acabó la era de la “carpintería, albañilería o zapatería para salir de la pobreza”; son trabajos muy dignos, pero apuntan a la subsistencia.

Los Doctores en Semiología Juan Biondi y Eduardo Zapata tienen una teoría, expuesta desde hace mucho, puesta nuevamente en tinta en su reciente publicación “Nómades electronáles”. Sostienen que una persona proveniente de una cultura oral (como la Quechua, es decir la peruana) puede migrar mucho más fácilmente a la cultura electronal (como la de los Millenials) en comparación a lo que podría un individuo nativo escribal (como la de las lenguas latinas, acostumbradas a la escritura), pues los códigos entre orales y electronales son mucho más similares. Esto significa que si bien muchos países nos llevan la delantera en temas de datos y programación, podemos alcanzarlos y hasta pasarlos.

Con estos argumentos por delante, crecimiento económico y capacidad para adaptarse al mundo electronal, se dan las condiciones necesarias pero no suficientes para convertir al Perú en un centro global en la ciencia de datos, como son actualmente India, Singapur o Estados Unidos. Cuando un negocio pequeño nace el dueño hace las cuentas, cuando crece se necesita un contador y cuando crece más se necesita todo un departamento de contadores.

Cuando el país crece la cantidad de información que dicho crecimiento genera es exponencial, antes se necesitaba toda una biblioteca para tener unos cuantos cientos de libros, hoy puedes llevar miles de ellos en tu bolsillo. El volumen de información es tal que se han tenido que crear nuevas palabras para nombrar las medidas del peso, byte, kilobyte, megabyte, gigabyte, terabyte, petabyte, exabyte, zetabyte (es decir 1,000,000,000,000,000,000,000 bytes) y más. ¿De dónde proviene tanta información?.

Gráfico 1: ¿Qué pasa en un minuto en Internet?

14612334888834

Fuente: http://estaticos.expansion.com/assets/multimedia/imagenes/2016/04/21/14612334888834.jpg

Pensemos sólo en las redes sociales y el movimiento de información de algunas aplicaciones populares, durante tan solo 60 segundos, lo que sucede en un minuto, 2.4 millones de búsquedas en Google, 2.78 millones de videos vistos en YouTube, 20.8 millones de mensajes de whatsapp, 350 mil tuits, 203 mil dólares en ventas por Amazon.

Ahora bien, estas son sólo redes sociales, en pocos años, por no decir desde ya, no habrá forma de gobernar un país o una ciudad sin información. Esta tendrá que ser almacenada en grandes bases de datos provenientes de múltiples plataformas del sector real y financiero, las mismas que podrán servir para la gestión de tráfico vehicular en tiempo real,  pagos en línea desde tu teléfono, créditos masivos al instante, identificación de personas sin trámites, capacidad de visualizar cada centavo gastado por cada unidad de gobierno (¿quieres que se acabe la corrupción? en el manejo de datos está la respuesta),  conocer todas y cada una de las causas de un accidente vehicular; pues no sólo estarán los datos del lugar y hora del accidente, el automóvil  reportará a una base de datos central del gobierno su posicionamiento global exacto, la velocidad a la que iba el conductor, los distintos niveles de fluidos, las condiciones de llantas y frenos y lo mismo para cualquier otro vehiculo implicado, quitando la subjetividad en la investigación del accidente y dando capacidad certera a las fuerzas del orden para saber cómo ocurrieron las cosas.

Data Science ¿Por qué la carrera del futuro?

El mundo crece, el Perú crece, la data crece y esta última a pasos realmente gigantes, los expertos sugieren que la tasa de crecimiento anual en la generación de data será de 4,300% hacia el 2020 (IDC/EMC 2011 Digital Universe Study), tal como se muestra en la infografía 1, principalmente debido a los cambios tecnológicos y la producción de datos personales y empresariales. Para dicho año tendremos la astronómica cifra de 73.5 Zetabytes de información, lo que significa que si asumimos que un libro en formato digital pesa en promedio 5mb, tendremos un total de 14,700,000,000,000,000,000 libros o 14.7 quintillones de libros ¿se imaginan cómo gestionar eso?.

Infografía 1: Crecimiento de la data global


Fuente: Reproducido parcialmente y traducido por el autor de http://assets1.dxc.technology/insights/downloads/CSC_Infographic_Big_Data.pdf

El Perú no es ajeno a este crecimiento, empresas nacionales de prestigio como bancos, consultoras, laboratorios farmacéuticos y el propio gobierno, ya empiezan a solicitar científicos de datos, tal como se puede ver en Linkedin con una simple búsqueda (por ejemplo buscar Data Scientist), aun cuando la carrera profesional como tal no existe en el país. Uno se especializa partiendo de ciertas carreras con fuerte perfil cuantitativo, economistas, matemáticos, físicos, estadísticos, informáticos y en mucha menor medida desde otras carreras como el marketing o la publicidad.

La revista FORBES ubicó a la Ciencia de datos en el primer lugar de entre las 50 mejores carreras pagadas en Estados Unidos, con una mediana anual base (es decir lo que pagarían al profesional al iniciar la carrera) de USD 110,000 y un nivel de satisfacción de 4.5/5 con las tareas realizadas. Bien pagado haciendo lo que te gusta ¿qué mejor que eso?. (Para mayor detalle ver aquí).

En nuestro amado país, esta carrera empieza a ser tan bien cotizada que un profesional recién egresado de alguna de las carreras antes mencionadas y con el perfil cuantitativo requerido puede ganar hasta S/100 mil nuevos soles anuales. No está nada mal, ¿no?. Seguramente pronto las universidades empezarán a ofrecer la carrera como tal.

¿Cómo ser un científico de datos en el Perú?

Para mayor detalle hemos creado una infografía con lo necesario para ser un científico de datos, lo ideal sería empezar desde la economía, la estadística o las matemáticas con el fin de saber cómo manejar los datos, sacar información valiosa de estos; luego se debe poder escribir todas la matemática y estadística aprendida en las carreras en lenguaje de computadora, es decir se debe aprender a programar en distintos “idiomas computacionales” como R o Python, con la característica especial de poder -además- trabajar con programas especiales para lidiar con grandes volúmenes de información, desde MySQL hasta Hadooop; el tercer paso es conocer al revés y al derecho el negocio en el que uno se desempeña; y finalmente pero no menos importante, se debe aprender a presentar la información de manera que lo técnico -fórmulas, gráficos, cálculos, términos y más- se traduzcan a un lenguaje amigable al entorno de un negocio específico.

 

Infografía 2: Perfil de un científico de datos

Comparte este Post
Comments
  • Luis sanabria
    21 Julio, 2017

    Buena informacion

Deja un comentario