Diario de RSN road to analista de datos

Sust0

#22 Ah vale, básicamente interpretáis los datos de los jugadores y las consecuencias de las decisiones del desarrollador supongo que por ejemplo si la gente se deja el juego, cuántas horas juega cada player, etc...

1 respuesta
richmonde

#31 Eso es lo básico y fácil, pero si, en esa dirección.

RSN

#25 #11

Entiendo lo que me queréis decir pero voy a ver si estoy equivocado.

Al final todo parte de tener un origen de datos, que pueden ser de varios tipos esos orígenes.

Después, tenemos que manipular los datos que refiriendoos a Python sería la librería pandas por ejemplo.

Para visualizar los datos tendríamos otras librerías como matplotlib o ggplot2.

No se puede conseguir lo mismo con power BI tirando de PowerQuery y DAX?

Cuando termine con SQL y lo básico de Excel ya será el momento de elegir qué herramientas de visualización utilizar, pero me gustaría tenerlo claro desde el inicio para no dar pasos incorrectos.

3 respuestas
richmonde

#33 Lo mismo que puedes conseguir en PowerBI, lo puedes conseguir en Python con Matplotlib, Seaborn, Vega-Altair, y más opciones

PowerQuery y DAX estan bien a modo entry level, pero a poco que quieras hacer cosas eficientes, potentes, y que no dependan de aplicaciones, R y Python son la mejor baza. Al final, las herramientas que citas, son capas de abstracción que te alejan del código, y por ponerte un ejemplo:

Cada run de SQL que hago, me recupera unos 120-200MB de datos, pero se ha pateado...

Aquí la query esta hecha teniendo en cuenta índices, que información para filtrar es ideal, y que forma de agregar la informacion, hacer las joins, window functions, etc... son ideales para que luego, tras la ejecución, realmente solo ha "mirado"

Esto, es gracias a que el equipo que ha hecho la ETL, la creacion de las tablas, indices, particiones es bueno, y que la query explota esos puntos fuertes.

Una herramienta como PowerQuery, usa un modelo de datos diferente que en muchos casos, trabaja sobre tablas finales. Pero a poco que quieras rascar detalle, granularidad, o hacer movidas locas para cosas que no están pensadas esas tablas, el rendimiento se va al suelo.

En cuanto a la visualización más de lo mismo. Looker, Tableau, PowerBI tienen casos de uso muy claros:

  • Reporting automation en base a un dashboard.
  • Monitoring de KPIs para stakeholders.
  • Data Exploration para quien quiere ver información en base a una query/dataset, y moviendo "ágilmente" campos, puedes encontrar cosas interesantes. Pero en este punto, cabe remarcar que es exploración.

A poco que quieras ver "más" tendrás que volver a la query, y añadir granularidad en aquellos puntos que quieres esclarecer. Y... si recuperas 10.000 filas agregadas... pero al añadir granularidad con 2 dimensiones, una tiene 10 valores, y la otra 1400... pues pasas de 10.000 rows, a 140.000.000... y esa herramienta no está diseñada para tratar con esa abrumadora cantidad de informacion.


RPV: Esas herramientas está bien conocerlas, aprender a usarlas, y son útiles de cara a encontrar trabajos donde se usen, pero la fuerza y el potencial de un DS/DA, reside en la habilidad multidisciplinar en SQL, R/Python, Estadística, Visualización (buena!), y Softskills. El reporting es un medio, no una finalidad.

5
Cna

#33 Te va a hacer falta más adelante si aspiras a algo más que ser junior data analist. Me juego el flequillo y no lo pierdo que en tu primer trabajo en el sector puede que no te pidas que integres nada, automatices ningún servicio o crees un script y con SQL y DAX vayas bien, pero al poco que empieces a tener algo de recorrido van a esperar de ti resultados más eficientes, potentes y concisos. Para eso python es superior. Y ya si te metes a NOSQL ni te cuento.

Además está bastante claro en el roadmap que has pasado, no creo que sea buena idea saltárselo.

1
Dieter

mucha suerte!

1
I

#28 como el no lo quiere decir , ya lo digo yo que tampoco es algo que oculte.Trabaja en ABK bueno ahora en Xbox game studios

PhDfailer

#33 tienes que aprender a programar, si no te quieres convertir en un mueve excel cobrando el SMI y con mas estres que Xavi

Aprende a programar y luego ya decides un roadmap, que puede ser data perfectamente. Vamos meterte en IT para ser consultor mueve excel no se lo recomiendo ni a mi peor enemigo.

1 1 respuesta
RSN

Esta noche cuando me conecte en el PC (de momento solo he tenido tiempo de responder desde el mvl) os enseño los roadmaps que hay marcados en dataquest.io y miramos cuál me conviene más. Ya que lo tengo pagado hasta final de año vamos a aprovecharlo.

Para los interesados el precio real son unos 400€ al año. Yo pedí una beca y me lo rebajaron a 150.

1 respuesta
richmonde

#38 Ojo, tambien depende mucho desde donde venga. Si viene de la obra y pasa a trabajar con AC, una silla, sin inclemencias temporales (por poner un ejemplo), su calidad de vida mejorará infinito, aunque no sea optima. Una vez en la rueda, subir es mas facil.

Pero opino igual, no es el mejor punto de partida.

#39RSN:

Para los interesados el precio real son unos 400€ al año. Yo pedí una beca y me lo rebajaron a 150

Al final, te gastas mas pasta en basuras y cosas innecesarias cada mes con el "ritmo de vida" que tenemos, y ese dinero es mejor invertirlo en formacion que te de un mejor futuro. Incluso si solo te sirve para organizarte en donde y qué estudiar.

2
charlesmarri

Os cuento un poco mi caso, que puede venir al hilo.

Hace un par de años entré como administrativo en una telco, pero a lo largo de este tiempo he trabajado "bastante" con PowerBi, Excel, bases de datos propias bastante tochas y cosas del estilo. Siempre me ha llamado la atención el mundillo TI. Supongo que está muy anticuado pero en su momento hice mis pinitos en Java. Pero la pregunta es: ¿con formación 0 se puede? Para que os hagáis una idea estudié Inglés y he acabado aquí por idas y venidas de la vida. Y me he acostumbrado al teletrabajo y creo que es el séctor donde más se puede crecer en este aspecto.

Si es algo asumible y a modo carrera de fondo, me gustaría ir aprendiendo poco a poco en forma de certificados y auto didacta. ¿Lo veis posible o sin carrera rollo de Matemáticas, Informática, etcétera mejor ni intentarlo? Me refiero a todo lo que estáis comentando de Python y tal.

1
RSN

Quiero que sepáis que aunque sea un formato de diario no me molesta todo lo que se comente. Creo que no había un hilo más centrado como tal en análisis de datos y a todos nos va a venir bien, sobre todo a mí, que estoy verde no, verdísimo. Es decir, "ahorraros" los comentarios de "no quiero desvirtuar el hilo".

Todos los posts referentes a mi progresión desde 0 los voy a ir poniendo en #1 para que no se pierda el hilo cronológico de mis avances y así cumpliremos con todos los objetivos del hilo. Aprovecho para daros las gracias a todos por los aportes y a incluso los que se han molestado en mandarme algún MP acordándose de mis aportes en /fitness.

Por iros dando más información creo que sepáis que tengo 31 años, es decir, no soy un chaval ya y sé que al menos, debo meter la cabeza en el mundo IT lo antes posible, no sé cómo de bien o mal se verá un junior de 31 años. Obviamente, yo tengo muchísimas softskills que alguien de 18-20 años no va a tener, porque llevo 13 años trabajando cara al público y al final esas habilidades te sirven en cualquier ámbito.

Más tarde os comparto los roadmaps que hay organizados en dataquest.io y miramos a ver qué me conviene más.

3 2 respuestas
RSN

Uno de los vídeos con los que me voy dando soporte para algunas cosas es este:

En la descripción del vídeo está desglosado todo.

1
Cna
#42RSN:

no sé cómo de bien o mal se verá un junior de 31 años

Lo ves todos los días y no te voy a mentir, a veces es una faena.

  • Lo primero que piensas es que puede ser alguien rebotado que cree que en IT se va a pegar la buena vida. En un porcentaje alto de los casos en menos de 2 años ha abandonado el sector. He visto a mucha gente pasar de ese estilo.
  • Está el tema de que en España hay varias ayudas fiscales para la contratación de gente joven y con 31 años las empresas tienen menos "ventajas" al contratarte por lo que si pueden elegir entre un perfil como el tuyo a nivel de experiencia/formación con menos de 25 años o a ti, seguramente escojan al menor de 25. Esto te obliga a ofrecer algo distinto y saber venderte bien aun siendo Junior algo que es casi contradictorio porque no conoces mucho del sector.
  • Como tu dices, tienes la baza de las softskills pero esto, igual que antes, es algo que tienes que saber vender bien siendo Junior. Igual que una empresa puede pensar que tu edad es un indicativo de madurez y seriedad, pueden pensar que una persona de 31 años que todavía está definiendo su futuro laboral es alguien desubicado o con ideas fugaces. Esto último se lo escuché decir a un recruiter de mi curro hace no mucho.

En general puedes encontrar defectos y virtudes de empezar con cierta edad pero lo importante, como todo, es que sepas demostrar valía y tengas -quizás- un poco más de paciencia que alguien más lechón.

A mi me gusta tu perfil. Solo por el hecho de que te hayas molestado en informarte, buscar roadmaps, consultarlo con gente del sector, interesarte por una progresión... para mi ya destacas por encima de mucha gente con poca o nula experiencia.

No soy especialista en data pero llevo tiempo en IT y te puedo decir que vas por buen camino. Un punto crítico en tu roadmap será cuando llegues a tu primera empresa y descubras que igual no están muy por la labor de favorecer tu formación continua. Nunca sabes qué te puedes encontrar y ahí será cuando te falten horas del día para estudiar y trabajar si no quieres estancarte.

1 respuesta
refresco

#42 con 30 entre yo. Eso sí me costó 9 meses de rechazos en entrevistas y un odio a recursos humanos que aún no he superado

1 respuesta
Mrolex

#45 el odio a RRHH no lo supera nadie XD

2
RSN

#44

Ahora mismo ya tengo trabajo (trabajo 6 días a la semana) y vivo solo con todo lo que conlleva por lo que realmente, dispongo de poco tiempo para formarme (unas 3-4 horas al día pudiéndome extender a 5-6 horas los fines de semana). Con esto lo único que te quiero decir es que realmente, hasta que no esté en el punto que quiero estar, no pararé de estudiar en mi tiempo libre (mis días van a ser exactamente igual que ahora en ese momento).

Os cuento por dónde va a ir la jugada ya desde mañana. El roadmap que voy a seguir consta de lo siguiente:

1.- Algunas personas me han dicho que Excel está sobrevalorado pero, en todos los roadmaps lo suelo ver al inicio, tanto en dataquest como en roadmap.sh así que voy a tirar por ahí, sin complicarme mucho ni pararme a ser perfecto en ello.
Voy a aprender simplemente funciones básicas + charting y pivot tables.
https://www.youtube.com/watch?v=PSNXoAs2FtQ En el 04:28:41 empieza la parte de Excel. Voy a hacer la parte que corresponde en dataquest + seguir el vídeo para consolidar conocimientos.
Para realmente confirmar que has aprendido algo creo que lo ideal es hacer algún proyecto, aunque sea pequeño, pero no sé si creéis que es necesario un proyecto en Excel para el portfolio.

2.- SQL. Sobre todo la parte que me interesa, claro. En el 00:15:08 del vídeo empieza. Y lo mismo, dataquest + soporte del vídeo + proyecto final.

3.- Aquí tengo dos opciones: irme a Python y aprender lo específico que necesito para análisis de datos o irme a aprender una herramienta de visualización como Tableau o Power BI primero. No es que tenga miedo de Python pero de programar literalmente tengo 0 idea y no sé qué tan fuerte sea la curva de aprendizaje, me tocará descubrirlo. Llegado a este punto, entre todos decidimos. PREGUNTA: ¿me recomendáis que empiece a dedicar cierto tiempo al día a herramientas como Codewars o realmente no lo véis necesario para análisis de datos?

4.- Por lo que me decía #44 yo creo que necesito hacer las cosas mejor que la media por lo que mi idea es tener un portfolio web y un buen perfil de github, ahí, seguro que voy a necesitar ayuda pero la idea es poner todos los proyectos que iré haciendo (no sé si el tener un perfil de github montado como toca elimina la parte de necesitar un portfolio web).

5.- Un buen perfil de LinkedIn.

3 respuestas
Sphere

#47 Sé que se dice mucho de tener un portfolio y GitHub, pero sinceramente creo que su utilidad para conseguir un primer empleo está sobredimensionada. Más importante sería que te sacaras certs de Power BI, Tableau o Looker, que al final implican que has aprobado un examen oficial y algo de idea tienes, frente a un proyecto de portfolio que puede haber sido un copypaste de otro o un GitHub que casi nadie va a revisar porque entonces los employers se tirarían todavía más tiempo cribando CVs, y candidatos apuntados a ofertas junior y entry precisamente hay a montones ahora mismo.

1 2 respuestas
RSN

#48 Perfecto! Se me olvidó decir que tengo siempre en mente la certificación PL-300 de Power BI y la de Azure Fundamentals (aunque hasta donde sé también hay bastantes cursos que te dan muy mascadito el aprobado, que no dejaría de ser casi lo mismo que lo que hemos comentado, quizá estoy equivocado).

En cualquier caso, tiraré por ambas, certs y portfolio.

https://learn.microsoft.com/es-es/credentials/certifications/resources/study-guides/pl-300
https://learn.microsoft.com/es-es/credentials/certifications/resources/study-guides/az-900

1 respuesta
richmonde

#48 Coincido en lo de Github, pero al final lo importante de Github, es que aprenda a usar la herramienta tanto a modo de repositorio, como a modo de control de versiones, y aprenda los comandos básicos.

Luego, tener un sitio propio donde poner sus proyectos o puesta en práctica, no solo sirve de portfolio, sino que le permitirá ver también su evolución desde el primer ejercicio que haga, al último, y quieras que no ver la progresión genera una dopamina bien chula.

Si lo hace, que sea mas para uso personal, que no como carta de presentación. Y si lo usa como lo último, que este pensado en DataViz. Cosas vistosas pero bien hechas, llaman mucho a recruiters que indaguen un poco mas.

PD: Los candidatos que me llegan, si tienen Github, yo personalmente si entro, y veo como estructuran sus códigos.

2 1 respuesta
Sphere

#50 Completamente de acuerdo en eso, aprender herramientas de control de versiones es un must y utilizarlo para los proyectillos engancha. A lo que me refiero es que obsesionarse con tener un GitHub lleno de proyectos no es tan fructífero como a veces se vende, hasta el punto de que parece que si no tienes el típico notebook de Jupyter con análisis del dataset de Titanic lo estás haciendo mal, cuando ya está trilladiísimo y no aporta nada nuevo al que entra a curiosear.

#49 AZ-900 te lo sacas con unos días de estudio, ¡ánimo! Cada X tiempo Microsoft da vouchers gratuitos para las entry certs.

1 1 respuesta
richmonde

#51 Mitico Titanic.

@RSN sobretodo, no cojas Titanic ni Iris como datasets de muestra en Github, ves a casos menos típicos haha

Cuando llegues a ese punto, ya te pasaré sets menos conocidos y que sean mas interactivos. Esos dos que cito, estan trilladisimos.

2
PhDfailer

#47

RSN, escucha,

Empieza directamente por Python, tienes que aprender las bases de programación te dediques a lo que te dediques. Aquí te daras cuenta si este sector es lo tuyo o no. Y programar no se aprende en 2 días, son meses de pico y pala. Por supuesto, si quieres en paralelo puedes ir viendo otras cosas, pero empieza a programar ya, es lo más dificil de aprender.

Es mejor que lo hagas así directamente a que te pongas a aprender cosas como PowerBi, tableau, Azure... que son una inversión de tiempo para UNA herramienta específica. Y luego llegues a Python y resulta que odias programar y mejor te dedicas a otra cosa.

En datos hay que saber programar si o si, y si estas en un puesto que no se programa vas a cobrar 2 duros y deberias estar desando salir de ahi.

https://www.udemy.com/course/100-days-of-code/

Bases de ingenieria de software (programacion, bases de datos, control de versiones, linux, docker) -> Especialización en datos

7
GranTorino

En mi empresa (industria alimentaria) usan PowerBI y Excel para medición de datos de producción, paradas de máquinas, etc. (datos que toman a boli y papel los operarios xD, muy rudimentario todo), sabiendo de perfiles como el tuyo, igual te sigo y me pongo a estudiar.

refresco

Además que power bi y tableau se aprenden en 2 tardes como quien dice. Lo único complicao que puede tener es precisamente DAX que es peogramacion

Cna
#47RSN:

No es que tenga miedo de Python pero de programar literalmente tengo 0 idea y no sé qué tan fuerte sea la curva de aprendizaje,

Cuanto antes descubras si lo toleras mejor. La carrera IT tiene una empleabilidad alta pero también debe ser uno de los sectores con mayor tasa de abandono en periodo de formación (si no el que más). Esto no es casualidad, el muro se llama programación y no está hecha para todo el mundo.

1
HashAfgano

Yo estoy en las mismas y me he pillado un bootcamp de data science en Udemy. 35 años. Ya me han tirado atrás por sobrecualificado, pero es que lo contrario es aún peor: que pasen los meses sin trabajar ni formarte, y luego vas y se lo explicas al recruiter.

Al margen de si estudiar data o no, creo que lo principal es no dejar de estudiar; que te pillen aprendiendo.

Por otro lado, para no desesperarme (quizá te sirva), pienso en la cantidad de gente que tiene trabajo y no sabe hacer la O con un canuto. Es verdad que hay mucha competitividad, pero creo que lo que marca la diferencia entre trabajar o no, ahora mismo, más que los títulos, es tener el contacto y/o la capacidad de convencer a quien te contacta. No me rallaría por si hay empleabilidad o no. Empleo hay, seguro, otra cosa es que le caigas bien al recruiter.

Repitiendo lo anterior: que te pillen estudiando. Asegúrate de que conforme aprendes vas construyendo un portfolio, que tarde o temprano te posicionará en algún punto del mercado laboral.

RSN

Hoy primer contacto con Python. Como el roadmap se puede seguir en el orden que sea, vistos los consejos he empezado por ahí.

No hay mucho que comentar. Estoy haciendo cosas muy muy básicas.

1 1 respuesta
PhDfailer

#58 Dale caña, mi consejo es que cuando pases las "bases" intentes construir cosillas, una calculadora, un juego de la serpiente (snake) y todo lo que se te ocurra, así es como realmente se aprende. Cualquier cosa, dispara.

Por cierto, a mi me sirvió mucho tomarlo como una rutina diaria obligatoria. Me explico, es mucho mejor, 1h al día todos los días de la semana sin falta, que 3h un martes y 4h un domingo. Al final, el cerebro se tiene que adaptar a esa forma de pensar y esto ayuda.

2 1 respuesta
richmonde

#59 Si y no, para lo que el quiere encarrilar, no necesita hacer un Snake. Tiene que dominar Pandas, librerías de visualización, y con tratar datos, desde su extracción (csv, api, bbdd y scrap), transformación y presentación. Hacer un codigo de minijuego, le va a torturar innecesariamente porque nada de lo que haga le servirá.

Ha de aprender Python, no hacerte una App en ello.

Diferente que quiera hacer desarrollo. Pero para DA/DS no necesita nada de eso. Aprender las buenas formas de programar, y saber encontrar las soluciones a los problemas.

En cuanto a la rutina 300% agree. Aunque para el dudo que este punto sea un problema. RSN es el puto follet tortuga de MV, el futuro DA mas fuerte del mundo. La disciplina corre por sus venas.

3 1 respuesta

Usuarios habituales

  • RSN
  • Dakka
  • refresco
  • Sphere
  • richmonde
  • Cna
  • PhDfailer