[Python] Give Me the Garbage (GMG)

hda

#30 ¡Qué chulada, tío!

psst: mete que se puedan buscar tres letras, que el mínimo está en cuatro xDDD
lo siento @AG

1 2 respuestas
Lecherito

@Soy_ZdRaVo eres un toxico macho

2 respuestas
B

#32

NSFW
Soy_ZdRaVo

#32 me cuadra

AG

#31 ¬¬U

1
Kaledros

Pero en serio, impresionante trabajo. Me encanta.

2
B

#30 En móvil no funcionan los enlaces, no sé si es cosa mía o tuya.

1 respuesta
B

#31 Bajado a 2 o más ;)

#37 Gracias, ya debería de funcionar y verse bien en móviles.

Como jsmin no es compatible con ES6 (menos con ESNext) al final he terminado usando rollup junto con terser, la verdad que una maravilla...

1 1 respuesta
B

#38 Sigue sin funcionar, es más, ahora no se abre el tile de los ajustes.

1 respuesta
Kaledros

¿Pues no que me dice que soy tóxico? Esto está mal.

uvelongboard

No aparezco :(

Jastro

#1 errata chorra:

Total de mensajes rastrados -> rastreados

Muy top tu trabajo, me hace gracia que mi nube de palabras es "Hay" y ya está xDDD

Por cierto, como catalogas los estados, ¿en que te basas para poner toxico a uno, confortable a otro y amoroso a otro?

1 respuesta
AikonCWD

El estado puede ser: Tóxico, Maleducado/a, Confortable, Armonía, Amoroso/a, Triste, Suicida o Indefinido

En qué te basas para calcular un adjetivo u otro?

1 1 respuesta
JohnVoiden

#43 te noto maleducado con esa frase eh, te bajas un tonito que bajas a toxico.

2
Kalgator

Soy confortable <3

B

Ok... aclaro como va el tema y estoy abierto a mejoras xD

  • Por motivos de como se está levantando la aplicación parece ser que no termina de trabajar correctamente con multi-tarea y de vez en cuando arroja un 500. Tengo que mirar mejores alternativas... por lo que leo una buena es mirar de usar Gunicorn.

  • El análisis se hace en base al "conocimiento" actual del que dispone el bot (que no es mucho xD):
    Es un poco injusto el sistema actual... pues no tiene en cuenta la "palabrería". Un mensaje sin "palabras clave" no cuenta como "diluyente". Entonces si en un mensaje te has puesto muy farruco te perseguirá en la valoración final más que 30 mensajes de "nada".
    Trataré de documentarme un poco y poder hacer rankings más certeros... esto está todo aún en proceso de refinado... lo primero que quiero es dejar el servidor estable y que no arroje 500. Pero como siempre... hasta el finde que viene no se toca/actualizará nada.

#39 Debe de ser por un 500 que comento... actualizando la página debería de cargarte correctamente todos los recursos
#42 Gracias por el reporte, estará corregido para la próxima actualización.

1 1 respuesta
hda

#46 yo me vengo arriba y propondría un poco de NLP (que es lo que estás haciendo, pero a manivela). Creado el modelo (una vez, antes de desplegar la solución web), solo hay que meterle el texto de cada post de cada user, no debería ser muy demandante el proceso, en principio. Entonces a cada mensaje podrías darle un valor entre -1 y +1, y sumar los mensajes de un user para qué sé yo, el último mes. En función del resultado estratificar la conducta:

x <= -10: tóxico extremo
-10 < x < -8: tóxico
...
8 < x < 10: agradable
10 <= x: adalid de la comunidad

Por ejemplo. Eso sería en una sola dimensión, pero si quisieses se podría llevar más allá, jugando no solo con un eje de "rudeness", sino con otro de "happiness" o los que sean. Luego, teniendo todas las dimensiones se podría determinar un calificativo.

My two cents.

Esto lo hemos hablado alguna vez @beavis y yo, dejándolo en el aire.

PD: ahora que me releo, creo que lo ideal es normalizar el valor de la dimensión entre el número de días [con posts], así sería más fácil sacar un histórico de conductas a 60 días, 40 días, 10 días, etc. Modelos más avanzados podrían tener las métricas pasadas en cuenta para calcular el estado actual.

2 1 respuesta
B

¿Por qué la primera vez que se me ha visto es de junio del año pasado?

1 respuesta
B

#47 Cierto! ya no recordaba y eso que está a pocos mensajes xD... he visto un poco por encima y tiene buena pinta. Es un campo que no conozco y términos como "Word lemmatizing" que tengo que asimilar... pero parece que es lo que necesito si quiero avanzar en la dirección correcta. Gracias de nuevo.

#48 Para evitar floodear, el bot solo recoge mensajes de las últimas páginas de los hilos o en páginas donde se encuentre un mensaje referenciado por un usuario. Igual sería interesante que mientras el foro está "dormido" y tiene más tiempo de no hacer nada lo dedique a revisar hilos completos en la lista de rastreados primero y luego ir descubriendo nuevos hilos...
Vamos que esa fecha es la del mensaje más antiguo que tiene el sistema sobre el usuario.

1 respuesta
GeGe

Currazo!, Muy chulo te quedo!. Felicitaciones

https://buzaco.es/search?term=GeGe XD "Maleducado" razón no le falta :P

1
hda

#49 a mí la parte de NLP me mola mucho, antes de perder los 5.5 Tb estaba jugueteando con hugging face. El Slack es muy activo. Lo suyo sería encontrar un modelo entrenado para clasificador de "hate, offensive" en español e implementarlo en el análisis de los comentarios. Echando un vistazo por encima no he encontrado demasiado, también te digo que estoy haciendo ML ahora mismo y el PC me va a pedos xDDDD

Como alternativa te propongo que si no encuentras un modelo de "odio, ofensivo" en HF uses el que te enlazo ahí arriba en inglés, y tires de traducción de los comentarios de español a inglés pasando luego el modelo odio ofensivo sobre el resultado. Es burdo, pero podría funcionar xD

Me mola mucho la parte de NLP del proyecto, podríamos juguetear si subes el proyecto a GH o algo así. No sería mal portfolio para nada.

1 respuesta
B

#51 De momento no quiero liberar para todo el mundo, pero puedo darte permisos para hacer pull y MR en el repo privado que tengo ahora...

1 respuesta
nerkaid

¿Por qué salgo Tóxico? Si soy un amor :(

1 respuesta
hda

#52 Te agradezco la oferta, pero no me gustaría comprometerme todavía. Cuando termine de montar el server, configurarlo y de jugar un poco con él, hasta se podría pensar en montar algún backend al que le lanzas una string y te devuelve una puntuación. Estaría chachi xD

1
B

#53 Antes de ponerme a mejorar el sistema actual haré un pequeño añadido para mostrar el 'desglose' de porque se tiene la puntuación que se tiene.

newfag

Qué pasada tío!

Duda, cómo define el algoritmo el comportamiento(tóxico, maleducado, etc)?

1 respuesta
B

#56 Gracias ;) En el segundo punto de #46 doy una idea de como funciona...

Pero básicamente se lee el mensaje, se limpia de contenido de HTML guarro, se hace un análisis de las palabras según un diccionario que tengo definido (usando expresiones regulares) y luego se hace una consulta para sacar el resultado. Todo gira entorno a ese diccionario...

wdaoajw

No sé si soy al único que le pasa, pero desde el teléfono no me funciona el menú.

Por lo demás, muy muy chulo

1 1 respuesta
B

#58 Gracias! ¿que navegador estás usando? Yo con Android + firefox/chrome/bromite funciona correctamente menos el menú de selección de zona horaria que no termina de mostrarse en chrome/bromite :/

1 respuesta
wdaoajw

#59 android + chrome, le doy y no se expande