DESPERTANEWS

OpenAI Lança Assistente de Voz do ChatGPT Após Atraso para Aumentar Segurança

A OpenAI, empresa líder em inteligência artificial, acaba de anunciar o lançamento de um recurso de voz muito aguardado para o ChatGPT. Este novo assistente de voz será inicialmente disponibilizado para um grupo seleto de assinantes pagos do ChatGPT Plus, com a expectativa de um lançamento mais amplo para todos os usuários no segundo semestre deste ano.

Modelo de IA que “Clona” Voz Humana

A OpenAI está introduzindo um modelo de IA capaz de clonar a voz humana, oferecendo uma experiência de interação ainda mais natural. Entretanto, para garantir a segurança dos usuários, o sistema foi projetado para não imitar vozes de outras pessoas sem autorização. Além disso, a empresa implementou filtros rigorosos para evitar a criação de música ou outros tipos de áudio protegidos por direitos autorais.

Recursos do Assistente de Voz

  • Quatro vozes predefinidas: O assistente de voz contará com quatro vozes distintas, nomeadas Juniper, Breeze, Cove e Ember. Estas vozes foram desenvolvidas em parceria com atores profissionais para garantir uma qualidade excepcional.
  • Reconhecimento de imagem: A nova versão do modelo GPT-4o integra capacidades avançadas de reconhecimento de imagem, tornando o ChatGPT um parceiro de conversa ainda mais versátil e dinâmico.
  • Filtros de conteúdo: Para aumentar a segurança, o software agora pode identificar e recusar certos tipos de solicitações, garantindo que conteúdo inadequado ou protegido por direitos autorais não seja gerado.

Estratégia e Impacto

Motivos do Atraso

Inicialmente, a OpenAI planejava lançar este recurso no final de junho. No entanto, a empresa optou por adiar o lançamento para resolver possíveis questões de segurança e melhorar a qualidade do produto. Este atraso permitiu que a OpenAI implementasse medidas adicionais de segurança e garantisse que o software estivesse preparado para lidar com um grande número de usuários.

Recursos Futuramente Disponíveis

  • Capacidades de vídeo e compartilhamento de tela: Apresentadas durante o evento de maio, essas funcionalidades ainda não têm uma data de lançamento definida, mas prometem transformar ainda mais a interação com o ChatGPT.
  • Feedback em tempo real: O novo modo avançado de conversa permitirá interações mais fluidas e naturais, ajustando as respostas do chatbot com base nas emoções detectadas na voz do usuário, como felicidade ou tristeza.

Testes e Segurança

Desde maio, o modo avançado de conversa do ChatGPT foi testado em 45 idiomas por mais de 100 usuários externos. Adicionalmente, especialistas em segurança cibernética avaliaram o modelo para garantir que ele pudesse detectar e bloquear conteúdos indesejados, reforçando ainda mais a segurança do sistema.

Disponibilidade

A versão alfa do Advanced Voice Mode será lançada inicialmente para um pequeno grupo de assinantes do ChatGPT Plus. A OpenAI planeja expandir gradualmente a disponibilidade deste recurso para todos os assinantes até o final do terceiro trimestre deste ano.

Comentários da OpenAI

Em um comunicado oficial, a OpenAI reiterou seu compromisso com a segurança e a melhoria contínua do modelo. A empresa mencionou que um relatório detalhando as capacidades, limitações e avaliações de segurança da versão 4o da IA será divulgado em agosto. Este relatório incluirá insights valiosos obtidos durante a fase alfa do modo de voz avançado, contribuindo para uma experiência de usuário mais segura e positiva.


Este lançamento marca um avanço significativo na interação homem-máquina, proporcionando uma experiência de conversa mais natural e segura para os usuários do ChatGPT. A combinação de vozes realistas, capacidades avançadas de reconhecimento de imagem e filtros de segurança robustos posiciona o ChatGPT como uma ferramenta poderosa e inovadora no campo da inteligência artificial.

Compartilhar

Relacionadas

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *