Accueil » Communication et marketing digital » ChatGPT : Nouvelles capacités vocales et visuelles

ChatGPT : Nouvelles capacités vocales et visuelles

Mise à jour Chat Gpt chat vocal

OpenAI, la société de renom dans le domaine de l’intelligence artificielle, a récemment annoncé une mise à jour significative pour ChatGPT, révélée le 25 septembre 2023. Cette mise à jour majeure qui introduit des capacités vocales et visuelles, permet des interactions plus naturelles et intuitives avec l’IA. L’intégration de DALL-E, capable de générer des images à partir de descriptions textuelles, est aussi prévue pour le mois d’octobre.

ChatGPT, connu jusqu’ici pour ses interactions textuelles, franchit une étape importante en intégrant des fonctionnalités vocales. Les utilisateurs peuvent désormais dialoguer oralement avec le chatbot, de façon similaire à l’interaction avec Alexa ou Google Assistant. De plus, la reconnaissance d’images permet à ChatGPT d’analyser, d’identifier et de commenter des images présentées par les utilisateurs. Ces fonctionnalités seront déployées progressivement au cours des deux prochaines semaines, initialement pour les abonnés ChatGPT Plus et Enterprise.

Comment utiliser la fonctionnalité vocale

Pour initier une conversation vocale avec ChatGPT, il faudra :

  • Utiliser l’application sur iOS ou Android et se rendre dans le menu en cliquant sur l’icône sous forme de trois points. 
  • Appuyer sur “Settings”, sélectionner “New Features” et cocher l’option “Voice Conversations”.
  • Après avoir activé cette option, il suffit de cliquer sur l’icône en forme de casque pour commencer à parler avec ChatGPT, en choisissant parmi l’une des cinq voix proposées. 

Comment utiliser la fonctionnalité visuelle

Pour utiliser la reconnaissance d’images, il suffit de prendre une photo ou la sélectionner dans votre bibliothèque d’images et cliquer sur “Confirmer” pour l’intégrer à la conversation. Il sera possible également d’ajouter des requêtes additionnelles pour affiner la précision de la réponse ou entourer un élément spécifique de l’image grâce à l’outil “Dessin”.

Technologie de pointe:

OpenAI utilise son modèle Whisper pour la conversion de la parole en texte et introduit un nouveau modèle de  text-to-speech capable de générer un audio réaliste à partir de texte et de quelques secondes d’échantillons vocaux. OpenAI collabore également avec Spotify pour traduire des podcasts dans d’autres langues tout en conservant la voix originale du podcasteur.

Préoccupations éthiques et de sécurité:

Bien que ces avancées soient prometteuses, elles soulèvent également des questions éthiques et de sécurité. OpenAI est conscient des risques potentiels, tels que l’usurpation de voix, et limite l’accès à ces technologies pour prévenir les utilisations malveillantes. De plus, la société a délibérément restreint la capacité de ChatGPT à répondre à des questions telles que “Qui est la personne sur cette photo ?” pour des raisons évidentes de confidentialité. 

Conclusion

La mise à jour de ChatGPT par OpenAI marque un tournant dans le domaine de l’intelligence artificielle conversationnelle. Les nouvelles capacités vocales et visuelles enrichissent l’interaction utilisateur et élargissent les horizons de ce que l’IA peut accomplir. Toutefois, l’équilibre entre innovation et éthique reste un sujet de discussion crucial pour assurer un développement responsable et sécurisé de ces technologies.

Sources : Blog du Modérateur, The Verge

Clef2web est une agence de marketing digital spécialisée dans la mise en place de stratégie SEO. Vous avez besoin d’optimiser votre visibilité en ligne ? 

 

Nos Certifications

 

Nos Clients