#45 Si yo pensaba que habías cogido 3 video random de internet y los habías puesto. No sabía ni que eran tuyos. Y si te soy sincero, he escuchado muchas síntesis de voz en internet, intentando imitar la voz de ibai o el xokas, pero no son mejores que #1. No lo tomes tanto una crítica a tu trabajo, sino a la tecnología actual.
¿Os acordáis de los videos de Loquendo metiéndose con el niñato del metro de valencia y otros memes de principios de los 2000?
Pues suena igual, pero cambiando la voz por la de Constantino Romero, imaginaos si llegan a tener esto en la época.
Pues me parece una falta de respeto a un gran artista y una pena que estos sean los derroteros a los que nos va a llevar la IA.
Los modelos mejoran con el tiempo, además que todo eso está escrito en texto seguramente, por eso parece un poco loquendo en determinados momentos, lo suyo es que alguien lo recite con su propia voz, con una entonación y una articulación más real y natural, más humana, y que luego la voz de constantino se sintetice por encima del recital
En unos años si creo que será posible hacerlo más natural de texto a voz, pero por el momento para obtener los mejores resultados lo mejor es usar una voz real y sintetizar por encima mediante IA la voz que quieras, cuanto más se parezca la voz a la del orador el resultado aún será más óptimo, tampoco tiene que ser una burrada de parecerse, simplemente con que haya cierta similitud en el espectro frecuencial, pues si hay mucha diferencia se desvirtúa un poco.
El modelo de la voz también variará en calidad dependiendo de la IA empleada y del tiempo de entrenamiento, así como de los datos usados para su entrenamiento.
Hace nada, creo que fue microsoft, que dijo que consiguió una IA que es capaz de clonar una voz casi idéntica con solo tres segundos de muestreo, aunque bueno, ahí yo ya discrepo un poco, no creo que sea un retrato muy fiel la verdad, milagros a lourdes.
Se nota robotica pero esta muy conseguida. Cuando este tipo de tecnologias esten mas pulidas sera una locura.
#56 Pues poco me complaceria mas que saber que he sido tan bueno en algo, que incluso despues de la muerte, mucha gente me sigue recordando con cariño e incluso intentan mantenerme vivo y recrearme. Eso es la inmortalidad
mucha IA y mucha mierda pero aun no hay un robot trader que multiplique tu capital por 20 invirtiendo
#65 Exactamente, esto es text-to-speech. El ejemplo de Pedro Sánchez hablando como Xokas se nota que es speech-to-speech y la entonación mejora muchísimo, pero no tengo ni idea de cómo se hace.