OpenAI ha anunciado una emocionante actualización para su chatbot de inteligencia artificial, ChatGPT. Esta evolución llevará a la plataforma a otro nivel, ya que ahora los usuarios podrán interactuar con ChatGPT en voz alta, brindando una experiencia más inmersiva.
Soporte para audio en aplicaciones móviles
El soporte para audio estará disponible en las aplicaciones móviles de ChatGPT para iOS y Android. Los usuarios que accedan a esta nueva versión tendrán la posibilidad de dialogar directamente con el chatbot de IA, eligiendo entre cinco voces diferentes para personalizar su experiencia.
OpenAI ha implementado un nuevo modelo de conversión de texto a voz que permite generar respuestas habladas a partir de una breve muestra de audio. En colaboración con actores de voz profesionales, esto hará que las interacciones con la inteligencia artificial se sientan sorprendentemente humanas.
Reconocimiento de voz y configuración
La nueva versión de ChatGPT utiliza el sistema de reconocimiento de voz Whisper para convertir las preguntas de los usuarios en audio a texto. Los usuarios que deseen utilizar esta función deben habilitarla manualmente en la sección "Ajustes" de la aplicación, bajo "Nuevas Características". Una vez habilitada, podrán seleccionar la voz que desean asignar al chatbot.
Implementación gradual
Es importante tener en cuenta que la adición de estas características de voz se realizará de manera gradual. No todos los usuarios de las aplicaciones móviles de ChatGPT podrán utilizarlas desde el primer día. OpenAI planea activar esta nueva función primero para los suscriptores de ChatGPT Plus y Enterprise en las próximas dos semanas.
OpenAI ha tomado medidas para limitar el uso de esta tecnología a las conversaciones dentro de la aplicación para prevenir posibles usos malintencionados. Esto se debe a que la tecnología, capaz de crear voces sintéticas realistas, presenta nuevos riesgos, como la posibilidad de suplantación de identidad o fraude.
ChatGPT ahora puede ver y responder a imágenes
Además de la capacidad de hablar y escuchar, ChatGPT también ha adquirido la capacidad de ver y responder a imágenes. Los usuarios de las aplicaciones para iOS y Android pueden interactuar con el chatbot utilizando fotografías y, incluso, "dibujar" sobre secciones específicas para que la inteligencia artificial se enfoque en ellas.
Esta característica se basa en una plataforma multimodal que combina GPT-3.5 y GPT-4, y tiene como objetivo ayudar a los usuarios en su vida diaria. Sin embargo, se aplicarán restricciones para proteger la privacidad de las personas, y no funcionará con fotos de individuos.
"La visión consiste en ayudarte con tu vida diaria. Lo hace mejor cuando puede ver lo que tú ves", explican los desarrolladores de OpenAI.