¿Que tal mi background para Big Data?

richmonde

#54 Tras leerme el hilo, te voy a dar unos consejos a modo personal y profesional, que puede irte muy bien si lo sigues, o muy mal si no lo haces, especialmente en la salida profesional en el mundo de los datos.

  • Humildad: Si no te gusta lo que la gente te dice a la que le pides consejo u opinión, lo aceptas y no te rebotas con contraargumentos, intentando convencer a los demás. Quizá el problema no son sus argumentos, si no la falta de contexto que das.
  • Autocrítica: Ligado a lo anterior, plantéate que no siempre tienes razón y que no eres el mejor del mundo.

Sobre lo que has mencionado a posterior, no es cierto.

Porque un recien graduado de la carrera que quieras que tenga muchos números no suele entrar directamente a ser ML Engineer o Data Scientist. El Data Analyst es el primer escalón por así decirlo normalmente, luego te expandes en Data Analyst o subes a Data Scientist.

Busca puestos de Data Scientist sin experiencia, CERO (y mira que me di garbeos por linkedin, glassdoor... para saber como va el mercado), puede que en algíun lado haya pero es raro que lo haya, yo no he visto ninguno en cientos de ofertas que he ojeado.
Los puestos en el mundo Big Data de inicios suelen ser Data Analyst o Data Engineer (con experiencia previa en trabajos de BBDD y demás).

Hay puestos con cero experiencia de Data Science en el mercado, son los conocidos "Data Science Intern" en el cual la empresa te forma. Sin embargo, están cotizadísimos porque se ha hecho un marketing bestial de la profesión, prometiendo a ingenuos que "Es la profesión del futuro" en la que con un curso formativo de 6 meses, empiezas a trabajar de ello. Respuesta simple, rotunda, y clara. No. Data Science no es programar solo. Y viniendo de una carrera de Ingeniería informática, no estás preparado para hacer Data Science, ni un FP, ni un curso de formación.

Viniendo de Física, Matemáticas o Estadística, eso ya es otra historia. Especialmente de matemáticas y estadística.

Big Data es la gilipollez más grande que ninguna persona haya podido acuñar en una sola palabra... La principal y única diferencia entre una BBDD relacional local, y una BBDD "Big Data", es simplemente el volumen, y donde se encuentran los datos. Todo lo demás? Marketing puro y duro.

El growth path desde 0, generalmente, suele ser:

  1. Carrera Cuantitativa/Cualitativa técnica (Matemáticas, Estadística, Ingeniería o Empresariales)
  2. Business Intelligence Analyst: Aprendes las nociones básicas de una estructura de datos empresarial, lo que es un Data Warehouse, KPIs, y utilizar las herramientas para generar la estructura de datos y procesarlos (ETL), analizas los datos procesados (Analysis), y creas los reports o dashboards (Reporting) para presentar las KPI's
  3. Cuando ya tienes conocimiento de lo anterior, entras en la linea del análisis estricto de los datos (Data Analyst), en la cual generalmente, planteas soluciones a problemas, o situaciones que se dan en la empresa. Ya sea performance, feature design, optimización, balances, etc... y aquí... puedes llegar a ser un crack y mejor pagado que un Data Scientist, ya que son dos cosas MUY diferentes.
  4. Si sigues en la línea de la especialización, entonces, puedes plantearte el salto al Data Science (Data Scientist). Aquí, es cuando empiezas a ver el mundo de dolor. Todo lo anteriormente citado, no tienes que dominarlo, pero si conocerlo a la perfección, puesto que el Data Science combina lo mas jodido de ambos mundos. Necesitas saber programar, y muy bien, ya que según que procesos y que variables elijas para según que datos, un proceso de ML puede tardarte 3 segundos, como puede estarse varias vidas humanas. No necesitas saber estadística... tienes que soñar con ella, y todo lo que ves en la calle, te resultará fácilmente transformable en una regresión lineal, logística, o si no sabes que valor darle a algo, siempre pensaras en K Nearest Neighbours.

Dicho esto, puedo decirte que me alegro un montón que hayas conseguido entrar en la rueda, aunque sea como Junior Data Analyst Intern. Ahora bien, humildad y aceptar el feedback que te den, aunque no te guste. De aquí a que toques y hagas cosas de Data Science puro, te quedan muchos inviernos, por muy motivado que estés.

Y te lo digo con conocimiento de causa. Trabajo en el mundo de los datos desde hace más de 10 años... como BI Consultant, Digital Marketing Data Analyst, Product Analyst, y ahora recientemente Senior Data Scientist. vengo de una carrera de ingeniería superior en informática, postgrado en estadística, y Máster en Data Science (finalizándolo).

Le dices a alguien que hace un curso de 6 meses de Data Science qué es Shapiro-Wilk test, o una regresión multivariada, o para que sirven las redes neuronales, y le explota la cabeza... y spoiler... eso lo enseñan en Matemáticas!

En resumen... congrats por el curro, pero no eres el centro del mundo.

2 2 respuestas
HeXaN

#61 Lo que citas en tu penúltimo párrafo lo he dado yo en la grado de informática. Es más, es muy básico xD

Recordemos que los grados tienen especialización en ciencia de datos y sales con lo básico machacado.

1 1 respuesta
richmonde

#62 Quizás el plan de estudios ha cambiado un poco, pero cuando hice la carrera en su día, en estadística no enseñaban eso. Pero te lo compro xD

1 respuesta
HeXaN

#63 Si la hiciste hace más de diez años es muy probable que no se viese, la verdad.

1 respuesta
varuk

De todos estos campos lo que siempre me ha llamado más la atención es la Visualización de datos. Así, como reflexión.

2 respuestas
richmonde

#64 Dios... me has hecho entrar a mi LinkedIn para ver cuando empecé la carrera, ya que la asignatura la hice en 2o de carrera... y eso nos remonta a 2005... 15 putos años han pasado... Oh dear....

#65 Anda que no he rechazado a candidat@s en las pruebas técnicas para entrar a la empresa porque la presentación que han hecho, convierten la restauración del ecce homo en una obra maestra... xDDD

1 respuesta
B

¿Qué es background?

1 respuesta
varuk

#66 ¿Dónde trabajas y qué hacéis?

1 respuesta
HeXaN

#65 Es la forma que tienen de engañar muchos de BI a los de negocio/gente que pone la pasta. Para mí es la parte menos interesante de la ciencia de datos.

#64 Hace quince años se estaba descubriendo la regresión lineal jajaja.

2 respuestas
CrIpI

Este pavo pidiendo ayuda y no tiene ni puta idea. Vaya ego xD

varuk

#69 Es bonita. Tampoco he profundizado mucho en todo esto.

https://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization?language=es

Fyn4r

#69 a mi la parte de visualización me gusta, es como jugar a un Tetris de colorines, líneas, degradados, etiquetas, etc que además luego lo puedes ver y decir "qué bonito!"

1 respuesta
Narop

#67 antecedentes, de donde vienes... no se traducirlo la verdad xD

1 respuesta
B

#73 Puede ser historial, de toda la vida, currículo o si quieres la versión latina curriculum vitae. Que viene a ser el conjunto de logros, méritos, estudios, etc. que se han obtenido hasta un determinado momento en la vida académica o laboral.

No sé si es una convención escribirlo en inglés o es que tiene algún matiz que no recojan las múltiples opciones en castellano.

1 respuesta
Narop

#74 literalmente significa fondo, pero en un sentido academico es experiencia. Decir cual es tu background es decir de donde vienes academicamente o bien en cuanto a experience

Supongo que historial, o curriculo cuadra también... yo llevo muchos años fuera y con muchos idiomas, me explico con el culo en Español así que no sé xD

EDIT. En mi caso, lo que te he dicho, mi primera lengua es el inglés y en cuanto a lenguaje de trabajo no tengo todo en español... hoy en día hay muchos anglicismos de todas maneras

richmonde

#68 Trabajo en una empresa de juegos de móvil, dedicado al 100% al análisis del juego, ya sea bien en seguir la evolución temporal de las KPI's principales del juego, realizar estudios sobre todo lo que influye en ellas, para saber encontrar que manivelas, y que configuraciones cambiar, para que la experiencia de juego no se vea afectada, pero haga que la gente que está dispuesta a pagar por avanzar y progresar más rápido, pague más. Lo que se conoce como ARPDAC y LTV.

Ello implica analizar bases de datos en la nube (trabajamos con Amazon Redshift), realizar análisis, dashboards con diferentes herramientas en función de quién las vaya a usar, y para qué, con Chartio, Tableau, y Looker.

A su vez, queremos saber como cambian las tendencias, y no queremos sustos, por lo que para ello hacemos modelos de predicción y clasificación. Clasificación, para entender que tipo de usuarios tenemos, encontrar patrones comunes de comportamiento (sesiones, gasto, tipo de jugadores, si son o no hackers o bots), y predicciones, para saber que podemos esperar de nuestros jugadores y como reaccionar proactivamente antes que se marchen. Para ello, depende también quién lo haga. En mi caso tengo más conocimiento en R, mientras que otros compañeros de equipo son más defensores de Python. Ambos son igual de potentes.

Reportamos directamente a los Heads of Product / VP of Product y en algunos casos, a los C-Level de la empresa.

El lenguaje no hace el resultado, lo hace el conocimiento y la experiencia.

1
HeXaN

#72 No, si está claro que es lo que entra por los ojos. No es lo mismo que decirles que tienes un MAE de 0,01 xD

iviallstar

#61 Gracias por tu elaborada respuesta, se agradece, de verdad.

Una preguntilla, viendo tu background... como ves hacer un máster de estadística en vez de uno de Big Data? Mi profe de estadística me dijo que para hacerme un perfil más cuantitativo un máster de estadística es una buena idea.

Un máster como este--> https://www.upc.edu/ca/masters/estadistica-i-investigacio-operativa

Crees que con un máster así compensaría mi CV? O es demasiado teorico todo y quizás mejor un máster en Big Data y ya está?
Un saludo.

#59 Muchas gracias! Y joder, dejame saborear un poco el ownear a los que me decian que ni de coña entraria con mis estudios, solo un poco :stuck_out_tongue_winking_eye:

16 días después
WBIndieGame

Vamos que eres becario

1 respuesta
3 meses después
iviallstar

#79 Y quien no comienza siendo becario en un sector? Soy un híbrido entre Data Analyst y Business Intelligence Analyst.

Utilizo Power BI para hacer dahsboards y reportings, utilizo Talend para hacer la transformación de los datos que se generan cada día automáticamente en Excels, manejo nuestros Data Warehouses en MySQL y tambien ya que sé programar en Python estoy haciendo junto a un compañero de IT, una API en Python para enseñar los datos que yo mismo transformo en una app para clientes, pero yo solo me encargo de la API estrictamente, lo demás lo hacen los developers. Estoy aprendiendo bastante la verdad.

Por otro lado he decidido que hare un Máster de Estadística (si me cogen claro, espero que sí, sobre todo por mi experiencia profesional), veo que me gusta. Y luego pues ya ire viendo, intentare hacer un semestre en el extranjero.

1