#42808 Depende.
Si no quieres usar una BBDD propietaria puedes usar mongo, también puedes usar otras como DynamoDB(AWS). Almacenaria en una tabla con key-value las sesiones con key-sesion value-json
Por otro lado, los stats no los almacenaria ahí, si no que usaría una BBDD de tipo time-series, como InfluxDB y luego visualizaria los datos con Grafana
#42812 Parece que pilotas, que opinas de druid? Porque todo el mundo la usa ahora?
El otro dia estaba leyendo el paper de Dynamo y Tao. Nunca he tocado cosas de arquitectura y no entiendo nada como funcionan.
#42814 No la he usado en mi vida hulio.
Así que no te puedo ayudar. Tengo entendido que es una herramienta que puede consumir objetos directamente de datalakes como S3 y procesarlos. Pero ni trabajo con esos datalakes, ni me encaja en la solución que usamos, pero intentaré echarle un ojo.
#42815 En mi equipo la usan. Escribes en real time / batch y las queries te permiten hacer agregados/upsample/downsample. Flipé cuando vi en github que estaba hecho en java xd.
El otro día estuve discutiendo sobre si puedes escribir en flujo por qué no pudes leer en flujo? No tiene sentido poder hacer una query y que te vaya llegando información mientras se escribe? Por ejemplo aplicado a IOT.
Nosotros hacemos por encima una capa para tener los flujos de lectura, pero si entran datos no te enteras y no puedes usar todo el potencial de query.
Por eso me puse a leer papers de db, porqué no entiendo las limitaciones que tienen. Quizás hace 5 años cuando se hicieron no estaba de moda lo reactivo y no se diseñó teniendolo en cuenta. Quizás es un límite fisico/técnico que es imposible (por temas de replicación p.e).
#42803 las caches sirven para tener un acceso rápido a los datos. Da igual que sean pequeños o grandes.
El por qué no se cachea todo es porque mantener caches es complejo y costoso, si tienes BBDD de varios teras pues como mínimo necesitarías varios teras de RAM para almacenar todo en cache. A parte de que generalmente son clave-valor para tener acceso "instantáneo" así que olvidate de queries y lidiar con caches llega un momento en el que puede ser complejo porque las BBDD relacionales está muy bonito si están normalizadas, ahora en cache invalida o actualiza datos relacionados y acabas teniendo una cache inservible.
Lo suyo es ir cacheando poco a poco, cosas sencillas con muchos accesos y que tienen impacto en el rendimiento.
#42814 Lo de que todo el mundo lo usa es mentira pero bueno.
Si quieres saber algo más sobre BBDD orientadas a columnas y las que más se usan
Yo sólo conocía Clickhouse pero bueno, si quieres conocer algo más dile a javi santana que te de una masterclass
Hay elecciones al rectorado la semana que viene en mi universidad, y el sindicato pide el voto abiertamente para uno de los candidatos.
En una escala del 1 a M.Rajoy, como de turbio es eso?
#42829 Pues como la líen tan parda como la última vez... https://about.gitlab.com/blog/2017/02/10/postmortem-of-database-outage-of-january-31/
tl;dr: nunca testearon sus métodos de recovery de backups hasta que les petó producción, momento en que se dieron cuenta de que ninguno funcionaba.
#42827 Yo votaría a Duck F. Tambien conocido como D. Fyn4r.
#42830 Prod es el mejor enviroment para darte cuenta de esas cosas. Me recuerda al episodio de south park de los enanos robacalzoncillos explicando su modelo de negocio:
- Paso 1: robar calzoncillos (picar código cual mandril).
- Paso 2: ??? (testear)
- Paso 3: beneficios (deploy en prod y rezar para que te toque la quiniela antes de que explote)
#42816 Para flujos tienes streams, en aws tienen unos (Kinesis). Te sorprenderías la de dbs que están hechas en java. Java no es lento, lo que pasa es que la gente no sabe donde echar los balones ya...
#42833 No es flujos el problema. Si yo pudiese leer directamente los datos de kafka lo haría y los podría consumir antes de guardarlos en una db ts (druid). Que imagino que es lo que dices.
El problema es que los datos estan en una db "externa".
No sé si me he explicado.
Si yo quisiera tener real time de esa db, no consultaria de la db, sino que tendría que consumir del flujo que escribe en esa db. Entiendo.
Me voy a mirar lo de kinesis, stack de aws, parece interesante y nunca lo he tocado. Siempre usamos open source y reimplementamos la rueda xd.
Realmente se puede ganar dinero con gamedev o estáis condenados a vivir con vuestros padres hasta la eternidad? xD
#42838 En el foro hay una gamedev que ahora es puta.
Creo que eso responde a tu pregunta xD