Lo prometido es deuda… y como dije en uno de los hilos de las entrevistas, me he animado a crear un hilo para describir un poco como es el mundillo en el que me muevo y que, quizá, puede servirle a alguien como inspiración para ello.
Introducción
¿Trabajar en “Data”?, ¿Qué es eso?
Desde hace unos pocos años, a raíz de muchos hechos recientes en el mundo (pandemia, precariedad laboral, necesidad de mejorar procesos, optimización, reorganizaciones, crecimiento empresarial) y el boom de la digitalización (internet, moviles, apps, smart TV, SaaS, etc…), se ha generado un volumen de datos de tamaño quasi incuantificable. En la TV te lo anuncian como “Big Data”, “Cloud”, etc… como si fuese tecnología alienígena.
La realidad es mucho más simple.
Todas estas aplicaciones, navegación, servicios, generan un tráfico de datos de los usuarios o clientes, que hasta no demasiado, eran simplemente espacio ocupado en bases de datos. Cada vez esas bases de datos tenían un tamaño mayor, y mayor, y… puedo seguir. Si, cada vez más mastodóntico.
Dada la situación de muchas empresas y los volúmenes de datos, los mecanismos tradicionales para consultar esos datos y posteriormente generar información, se antojaban complicados. Y ya no solo el hacer esos pasos, sino el propio almacenaje, y posterior tratamiento para limpiar esos datos era cada vez más costoso.
Con ese escenario, se dieron las variables perfectas para el nacimiento de unas de las profesiones que a día de hoy, son de las mejores remuneradas, más demandadas, y en esencia, lo que hoy en día te venden como unicornios.
¿Quieres trabajar desde casa? ¿Quieres ganar 50.000€ en menos de 3 años? ¿Estar a la última en el mercado laboral?... “Ven a este bootcamp de Data Engineering/Analysis/Science/Architect/etc…”
Sí, es un unicornio, pero no todo tiene tanto brilli brilli.
¡Vamos a desgranar un poco qué es este mundillo!
¿Qué es un Data Analyst/Scientist/Engineer/Architect?
Como podéis ver, definir en una palabra o una sola frase cualquiera de estas profesiones, se antoja harto complicado… Pero si tuviese que resumir un poco el espectro general de esas profesiones…
“Es un profesional que utiliza conocimientos en matemáticas, estadísticas, programación y habilidades de captación, procesamiento, almacenamiento y análisis de datos para extraer información valiosa de grandes conjuntos de datos. Dichos conjuntos de datos deberán estar apropiadamente distribuídos y limpios, de modo que su posterior análisis e interpretación, se pueda usar para tomar decisiones informadas y resolver problemas complejos en diversas áreas.”
Vale, pero… ¿donde puedo trabajar con estos estudios?
Virtualmente hablando… puedes trabajar donde quieras.
“Sí. Lo sé. Suena jodidamente ideal, a la par que ambiguo. Si puedo trabajar en cualquier sitio… porque no encuentro trabajo?”
Un Data X (en adelante, para referirme a cualquier profesión derivada de Data) puede trabajar en cualquier sector laboral, desde funcionario, hasta CTO. Desde el tratamiento de una planta de residuos, hasta hacer un sistema de predicción para operar ETFs. Desde gestionar sistemas de optimización de pedidos en un supermercado, hasta calcular en qué momento deberías ganar una tirada en tragaperras físicas o online.
Pero… Y ¿en gaming?
Un Data X en el sector de los videojuegos se encarga de procesar, limpiar, y/o analizar grandes volúmenes de datos generados por los usuarios para mejorar la experiencia de juego, optimizar el diseño de juegos y maximizar los ingresos, entre otras muchas labores (esto, dependiendo de qué profesión dentro de Data).
En el caso de Data Architech y Data Engineer, se trata de roles muy centrados en la extracción, almacenamiento de datos (ya sean telemetría técnica de los juegos, sea del comportamiento de los jugadores, sea de las pasarelas de compra, etc…), y el posterior tratamiento para dar una estructura organizada en toda esta información en modelos de almacenamiento que sean “fácilmente” escalables, eficientes en cuanto al acceso a la información, y que contengan la información relevante para que el siguiente equipo de datos pueda hacer bien su faena.
En el caso del Data Science y Data Analysis, se trata de un rol muy centrado en los datos, pero que tiende a estar en todos y cada uno de los puntos del desarrollo tanto de un producto (juego), como cualquier mejora en el mismo (UI/UX, arte, nuevas funcionalidades, balance de la economía, organización de los tutoriales, cuando mostrar cada funcionalidad, mejora, arma, skill, etc…)
En los casos de Analysis y Science, ambos son roles que están codo con codo con el equipo de Producción, el equipo de Producto (no confundirlos, son dos equipos independientes), y en esencia, es una especie de “Piedra roseta” o “Piedra angular” donde todo pasa por ese rol.
- Porqué "Piedra rosetta" > Se espera de dicho rol, el descubrir el conocimiento oculto (en los datos) para poder entender muchas incógnitas (comportamiento, tendencias, expectativas, ...) y poder crecer con dicho conocimiento.
- Porqué "Piedra angular" > Porque es una de las bases de crecimiento de una estructura grande. Todo equipo, producto, empresa, requiere de diferentes roles, especialidades para que funcione todo bien. Desarrolladores, márketing, producto, Q&A, support, CM's, ejecutiva... pero para poder conectar todas las partes y tomar buenas decisiones, se requiere de un rol que este en medio de todo el meollo, sintetice los datos y los transforme en conocimientos, recomendaciones, acciones, experimentación, y en definitiva, dirección al éxito.
Como podréis ver en este post, intentaré abarcar un poco de todo, sin poder profundizar mucho en detalle, pero dando la visión más global posible.
Por otro lado, escribir todo esto en forma de post me da un poco de urticaria, ya que mi rol y mi especialidad (en el trabajo) es poder decir todo esto en menos de 10 slides, pero como no todo el mundo puede absorber tanta densidad de contenido sintetizado en esas slides, lo haré así
¿Qué necesito estudiar y/o aprender para trabajar en ello?
Formación deseada
Formación relacionada con las matemáticas, la estadística, y la programación son tres de los grandes pilares que son necesarios, no todos ellos siendo PhD, pero si que a lo largo de la carrera laboral o formación, se debería adquirir dicho conocimiento.
Reglado (de menor a mayor importancia - más formación suele acarrear mejores resultados, pero eso es una vez dentro de la industria, no como entry point)
- Bootcamps relacionados con Data
- Cursos y formación certificada tipo Udemy, Coursera, etc...
- Grado en Ciencias de la Computación, Ingeniería Informática, Matemáticas, Estadística o campos relacionados.
- Máster o Doctorado en Ciencia de Datos, Inteligencia Artificial, o áreas afines es altamente valorado.
Cabe remarcar que son los puntos clave, pero ello no implica conseguir un curro de esto, y viceversa; Sin tener esta formación reglada pero superando pruebas técnicas, poder alcanzarlo.
Lo que está más claro que el agua, es que para estas profesiones debes soñar en SQL, R, Python, y tener estadística y matemáticas en las venas fluyendo. Para arrancar no es critico, pero para crecer es un must ineludible.
Tecnologías usadas habitualmente (las más usadas/extendidas, pero hay más)
- Programación (Muy necesarias, como el respirar)
- Python, R
- Bases de datos (Muy necesarias, como el respirar)
- SQL: AWS, BigQuery, Snowflake
- NoSQL: MongoDB, Redis, Neo4j
- Herramientas de Big Data
- Hadoop
- Spark
- Análisis y visualización de datos
- Herramientas de 3ºs: Looker, Tableau, PowerBI, D3.js
- Python: Matplotlib, Seaborn, Altair-Vega
- R: GGplot2 (la que conozco, soy Python user), ggplot2, Knitr y Rmarkdown, Quarto (para hacer notebooks y publicar), Shiny
- Modelado estadístico y algoritmos de machine learning: Scikit-learn, TensorFlow, Keras, PyTorch
- Bibliotecas: TensorFlow, Keras, PyTorch
- Plataformas: Azure ML, Google AI Platform
Como podéis observar, el abanico de tecnología es absurdamente amplio, y posiblemente en unos años, la mitad de las cosas que cito aquí o bien tengan reemplazo, esten outdated, o haya salido tecnología nueva y formatos nuevos de visualizar información que requieran algo diametralmente diferente a lo mencionado.
Añadir, como “novedad” y el citado elefante en la sala…
- AI Supporters, como Copilot, ChatGPT, LLM’s especializados en áreas específicas, GenAI models para resumir emails, presentaciones, etc…
Al final, es una herramienta más que si la sabéis utilizar, os hará la vida infinitamente más fácil, si se le da el uso en el caso de uso específico para el que es útil.
Habilidades necesarias
- Pensamiento analítico y crítico
- Saber sintetizar la información, saber qué buscar, que descartar, que es ruido, y que es relevante.
- Comunicación efectiva
- Habilidad para saber presentar información extremadamente especializada, en un formato coloquial, adaptar el mensaje y el contenido a la audiencia, y saber cómo desgranar la información de los datos.
- Ser capaz de responder bien a la tensión de presentar, generalmente, a personas que van a creerse ciegamente y casi dogmáticamente lo que les vayas a decir. Para esas personas eres un mesías que guía el camino, y dichas personas las que lideran la marcha en la dirección que les has mandado.
- Trabajo en equipo y colaboración
- Capacidad para resolver problemas complejos
¿Qué se espera de estos roles?
Como he dicho anteriormente, en el caso de los juegos se generan una burrada de datos inimaginables, aunque se puede extrapolar a muchos otros campos. Y pese a ello, hay juegos que generan un volumen de información que no tienen nada que envidiar, o incluso competir de igual a igual con por ejemplo, Amazon.
Dicha cantidad de datos puede arrojar una información que puede valer perfectamente su peso en oro, mucho oro.
- Cómo los jugadores interaccionan con los menus, el juego, otros jugadores, preferencias de uso de elementos del juego, posicionamiento, estrategias, etc…
- Sabiendo la información previa, generar simulaciones de comportamiento, tendencias de actividad, gustos, patrones de comportamiento en grandes/pequeños grupos
- Saber cuando vas a dejar de jugar, cuando vas a enfadarte con algo, cuando algo es muy dificil para ti, cuando te estas aburriendo, etc…
- Quienes son tus referentes, contra que tipo de rivales tienes más probabilidades de estar mas tiempo
- Saber cuando vas a comprar un producto en el juego, a que precio, con que frecuencia repetirás compra, y si vas a incrementar el gasto por compra o no
- Con esa información, poder realizar mejoras y cambios experimentales y saber con exactitud si serán buenos o malos cambios.
Todos estos puntos, son algunos de los elementos más relevantes que permiten saber, operar, y actuar como tal para mejorar los productos.
Desde luego, esto es un ejemplo de muchas de las cosas que se pueden hacer, y ello conlleva tiempo y esfuerzo. Entiendo que muchos vais a tener preguntas, querer saber más, y quizá informaros un poco de esto.
Resta decir, que esta información de datos procesados, es extrapolable 1:1 a cualquier ámbito.
- Donde pone juego, poned Netflix
- Donde pone Netflix, poned Productos en Liquidación de Mercadona.
- Donde pone Productos en Liquidación de Mercadona, poned “Ticket de compra online en Amazon”.
- Donde pone eso, poned evaluación de manos ganadoras en el casino del Barrio gestionado por Inverama (por poner un ejemplo).
Esto es el “Puedes trabajar donde quieras”.
En resumen...
Si estáis haciendo BBDD, o matemáticas, o estadística, o programación para cloud, sabed que hay MUCHO trabajo disponible de esto, y encima... en el mundillo de los videojuegos.
A veces, es mejor separar el ocio del trabajo... pero el día que tu trabajo se convierte en ocio y te pagan por ello... ese día dejas de "trabajar" (obviamente, hay responsabilidades).
Quién ha trabajado de aquello que le gusta... conoce la sensación.
En los próximos días abriré otro hilo para los afines a la misma escuela, y los que quieran aprender más sobre esto... y espero que el hilo os haya parecido interesante. Veremos si podemos hacer comunidad con esto!
Stay tuned!
@Jastro lo he puesto con la etiqueta "Código", pero no se cual de las que hay aplica mejor. Quizá crear más subcategorías en Desarrollo y diseño sería buena idea. "Comunidad", "Formación", etc... Ahí te dejo unas ideas!
Por otro lado, si crees que este contenido encaja más en "Estudios y Trabajo", muevelo ahí sin problemas!
@eXtreM3 @Sphere @Maaarc @refresco que recuerdo que estábais interesados en ello (por lo que recuerdo en otros hilos) - Si no es así, avisad y os quito la cita!
En no mucho, haré un par de hilos con ejemplos de cosas relevantes, usando o bien fake data, o como evaluar casos prácticos.