OpenAI, una de las empresas líderes en inteligencia artificial, ha lanzado Voice Engine, una innovadora IA capaz de clonar tu voz con solo escucharla una vez, en un breve lapso de 15 segundos.
Aunque actualmente se encuentra en fase de prueba, la tecnología de Voice Engine promete grandes avances. Esta IA utiliza texto de entrada y una única muestra de audio de 15 segundos para generar habla con un sonido natural que se asemeja al hablante original. La clave está en esa breve muestra de 15 segundos, que según OpenAI, permite crear voces emotivas y realistas.
Voice Engine fue desarrollado por OpenAI a finales de 2022 y ha sido utilizado para mejorar las voces predefinidas disponibles en la API de conversión de texto a voz, así como en aplicaciones como ChatGPT Voice y Read Aloud. Sin embargo, es ahora cuando se están revelando los primeros datos prometedores sobre las capacidades de esta tecnología.
Esta tecnología tiene un amplio abanico de posibles usos, aunque por el momento OpenAI está probándola de forma limitada. La compañía señala que Voice Engine podría revolucionar la traducción de contenido, como vídeos y podcasts, permitiendo que creadores y empresas lleguen a audiencias globales de manera fluida y utilizando sus propias voces.
Según OpenAI, al utilizar Voice Engine para la traducción, se conserva el acento nativo del hablante original. Por ejemplo, generar habla en inglés a partir de una muestra de audio de un hablante francés resultaría en habla con acento francés.
Sin embargo, el acceso a Voice Engine está altamente restringido por razones de seguridad y ética. OpenAI reconoce los riesgos asociados con la generación de voces que se asemejan a las de personas reales, especialmente en situaciones como un año electoral en Estados Unidos.
El reducido grupo que está probando y utilizando comercialmente Voice Engine ha aceptado medidas estrictas para evitar problemas derivados de esta tecnología. OpenAI prohíbe explícitamente la suplantación de identidades sin consentimiento legal y requiere el consentimiento explícito e informado del hablante original para su uso. Además, no permite a los desarrolladores crear herramientas para que usuarios individuales creen sus propias voces.
A día de hoy, Voice Engine representa un avance significativo en la tecnología de generación de voz, aunque su acceso sigue siendo limitado y su uso está sujeto a estrictas políticas de ética y seguridad por parte de OpenAI.