#1 errata chorra:
Total de mensajes rastrados -> rastreados
Muy top tu trabajo, me hace gracia que mi nube de palabras es "Hay" y ya está xDDD
Por cierto, como catalogas los estados, ¿en que te basas para poner toxico a uno, confortable a otro y amoroso a otro?
El estado puede ser: Tóxico, Maleducado/a, Confortable, Armonía, Amoroso/a, Triste, Suicida o Indefinido
En qué te basas para calcular un adjetivo u otro?
Ok... aclaro como va el tema y estoy abierto a mejoras xD
Por motivos de como se está levantando la aplicación parece ser que no termina de trabajar correctamente con multi-tarea y de vez en cuando arroja un 500. Tengo que mirar mejores alternativas... por lo que leo una buena es mirar de usar Gunicorn.
El análisis se hace en base al "conocimiento" actual del que dispone el bot (que no es mucho xD):
Es un poco injusto el sistema actual... pues no tiene en cuenta la "palabrería". Un mensaje sin "palabras clave" no cuenta como "diluyente". Entonces si en un mensaje te has puesto muy farruco te perseguirá en la valoración final más que 30 mensajes de "nada".
Trataré de documentarme un poco y poder hacer rankings más certeros... esto está todo aún en proceso de refinado... lo primero que quiero es dejar el servidor estable y que no arroje 500. Pero como siempre... hasta el finde que viene no se toca/actualizará nada.
#39 Debe de ser por un 500 que comento... actualizando la página debería de cargarte correctamente todos los recursos
#42 Gracias por el reporte, estará corregido para la próxima actualización.
#46 yo me vengo arriba y propondría un poco de NLP (que es lo que estás haciendo, pero a manivela). Creado el modelo (una vez, antes de desplegar la solución web), solo hay que meterle el texto de cada post de cada user, no debería ser muy demandante el proceso, en principio. Entonces a cada mensaje podrías darle un valor entre -1 y +1, y sumar los mensajes de un user para qué sé yo, el último mes. En función del resultado estratificar la conducta:
x <= -10: tóxico extremo
-10 < x < -8: tóxico
...
8 < x < 10: agradable
10 <= x: adalid de la comunidad
Por ejemplo. Eso sería en una sola dimensión, pero si quisieses se podría llevar más allá, jugando no solo con un eje de "rudeness", sino con otro de "happiness" o los que sean. Luego, teniendo todas las dimensiones se podría determinar un calificativo.
My two cents.
Esto lo hemos hablado alguna vez @beavis y yo, dejándolo en el aire.
PD: ahora que me releo, creo que lo ideal es normalizar el valor de la dimensión entre el número de días [con posts], así sería más fácil sacar un histórico de conductas a 60 días, 40 días, 10 días, etc. Modelos más avanzados podrían tener las métricas pasadas en cuenta para calcular el estado actual.
#47 Cierto! ya no recordaba y eso que está a pocos mensajes xD... he visto un poco por encima y tiene buena pinta. Es un campo que no conozco y términos como "Word lemmatizing" que tengo que asimilar... pero parece que es lo que necesito si quiero avanzar en la dirección correcta. Gracias de nuevo.
#48 Para evitar floodear, el bot solo recoge mensajes de las últimas páginas de los hilos o en páginas donde se encuentre un mensaje referenciado por un usuario. Igual sería interesante que mientras el foro está "dormido" y tiene más tiempo de no hacer nada lo dedique a revisar hilos completos en la lista de rastreados primero y luego ir descubriendo nuevos hilos...
Vamos que esa fecha es la del mensaje más antiguo que tiene el sistema sobre el usuario.
Currazo!, Muy chulo te quedo!. Felicitaciones
https://buzaco.es/search?term=GeGe XD "Maleducado" razón no le falta
#49 a mí la parte de NLP me mola mucho, antes de perder los 5.5 Tb estaba jugueteando con hugging face. El Slack es muy activo. Lo suyo sería encontrar un modelo entrenado para clasificador de "hate, offensive" en español e implementarlo en el análisis de los comentarios. Echando un vistazo por encima no he encontrado demasiado, también te digo que estoy haciendo ML ahora mismo y el PC me va a pedos xDDDD
Como alternativa te propongo que si no encuentras un modelo de "odio, ofensivo" en HF uses el que te enlazo ahí arriba en inglés, y tires de traducción de los comentarios de español a inglés pasando luego el modelo odio ofensivo sobre el resultado. Es burdo, pero podría funcionar xD
Me mola mucho la parte de NLP del proyecto, podríamos juguetear si subes el proyecto a GH o algo así. No sería mal portfolio para nada.
#51 De momento no quiero liberar para todo el mundo, pero puedo darte permisos para hacer pull y MR en el repo privado que tengo ahora...
#53 Antes de ponerme a mejorar el sistema actual haré un pequeño añadido para mostrar el 'desglose' de porque se tiene la puntuación que se tiene.
#56 Gracias En el segundo punto de #46 doy una idea de como funciona...
Pero básicamente se lee el mensaje, se limpia de contenido de HTML guarro, se hace un análisis de las palabras según un diccionario que tengo definido (usando expresiones regulares) y luego se hace una consulta para sacar el resultado. Todo gira entorno a ese diccionario...
No sé si soy al único que le pasa, pero desde el teléfono no me funciona el menú.
Por lo demás, muy muy chulo
#58 Gracias! ¿que navegador estás usando? Yo con Android + firefox/chrome/bromite funciona correctamente menos el menú de selección de zona horaria que no termina de mostrarse en chrome/bromite :/