"OpenAI dévoile un modèle de discours ultra-performant : détection de signes non-verbaux et multilinguisme, un score de 82,8% sur les benchmarks de raisonnement audio!"
Share
OpenAI a lancé le modèle de conversion parole à parole gpt-realtime avec de MCPs distants et le support d'images. Il a des capacités nuancées comme la détection des signaux non-verbaux et le changement de langues tout en gardant une conversation naturelle. Il a obtenu un score de 82,8% sur les benchmarks de raisonnement audio.