[UP208] C'est plus clair

Publié le 24 mars 2025 — 10 min lu

Résumé

Visualisez clairement vos idées grâce à l'IA | Essayez le générateur audio d'OpenAI | Meta AI débarque en Europe.

▹ News : Meta AI débarque en Europe.
▹ Zoom : Essayez le générateur audio d'OpenAI.
▹ Deep Dive : Visualisez clairement vos idées grâce à l'IA.

Salut à tous,

Vous l'aurez remarqué, la pub a fait son apparition sur Upmynt, la semaine dernière, avec Notion comme premier partenaire.

J'ai en effet lancé formellement l'offre de publicité pour Upmynt. La newsletter compte près de 5000 abonnés et c'est un seuil qui rend la commercialisation d'une offre pub crédible et solide pour un annonceur.

En savoir plus sur les offres de pub

Si vous opérez un produit ou un service (éventuellement basé sur l'AI mais pas forcément) qui pourrait intéresser le lectorat Upmynt (plus d'infos en suivant le lien ci-dessus), n'hésitez pas à consider cette newsletter dans votre plan de communication. Les offres sont compétitives, entre 50 et 300€ seulement.

Pour le reste, bonne lecture à tous !

Sane de Upmynt 💜

👁 Mets ta capuche. Meta AI débarque "enfin" en Europe, mais sans la génération d'image. L'assistant sera progressivement proposé sur Facebook, Instagram, Messenger et WhatsApp.

Sans l'Europe, l'assistant compterait d'après Meta déjà près de 700M d'utilisateurs actifs. L'entreprise souhaite atteindre le milliard d'utilisateurs, rien de moins.

⏰ Mieux vaut tard… Claude peut enfin surfer sur le web. Il est un peu à la bourre sur ce front, puisque la recherche sur ChatGPT date de octobre 2024… (et chatGPT pouvait déjà naviguer sur le web avant ça).

Gros bémol : la fonctionnalité est uniquement dispo aux US pour les utilisateurs payants. Anthropic promet un déploiement aux utilisateurs gratuits et dans plus de pays prochainement.

🌐 Navigateur IA. Perplexity a annoncé le déploiement de son nouveau navigateur agentique Comet auprès d'un petit groupe de testeurs cette semaine, avec une sortie complète prévue dans quelques semaines.

📱 Smartphone IA. Huawei a dévoilé le Pura X, un smartphone avec DeepSeek intégré.

🍏 AI-washing. La série noire continue pour Apple dans son approche de l'IA.

Après l'annonce d'un retard du nouveau Siri jusqu'à 2026 voire 2027, l'entreprise fait face à une plainte (mass action) déposée par des associations de consommateurs accusant Apple de publicité mensongère en communiquant sur des fonctionnalités IA finalement non disponibles.

▹ Résultats du Sondage

La semaine dernière, je vous demandais : S'il était meilleur que ChatGPT, seriez-vous prêt à utiliser un assistant IA proposé par une entreprise chinoise ?

Sondage Upmynt du 17 mars 2025 - 175 répondants

Vous avez été partagé, mais le "Non" l'emporte tout de même visiblement, avec 57% de votants.

Cela étant, en ces temps obscures, en particulier de l'autre côté de l'Atlantique, utiliser un assistant américain est-il tellement plus rassurant ?…

Cet espace "Communauté" est le vôtre. Répondez à cet email avec votre besoin : Recrutement, ressource à partager, demande d'aide, question…

Essayez le générateur audio d'OpenAI

Whipser, le modèle de reconnaissance vocal (speech-to-text) de OpenAI était déjà l'un des meilleurs. L'entreprise enfonce le clou avec une nouvelle flopée de modèles audio, basés sur l'architecture GPT-4o.

Et ils fonctionnent "dans les deux sens" : speech-to-text (reconnaissance vocale) et text-to-speech (génération audio).

Ils sont accessibles aux développeurs via l'API, et pourront notamment permettre des chatbots et agents IA dotés de la voix.

Pour que les agents soient vraiment utiles, les gens doivent pouvoir avoir des interactions plus profondes et plus intuitives avec les agents au-delà du simple texte, en utilisant le langage parlé naturel pour communiquer efficacement. - OpenAI

Coté reconnaissance vocale

Pour son modèle de reconnaissance vocale, GPT-4o-transcribe, OpenAI promet une précision et une fiabilité supérieures à la concurrence « notamment dans des situations complexes impliquant des accents, du bruit de fond ou des vitesses d’élocution variables. »

Le taux d’erreur de mots reflète apparemment cette supériorité des modèles.

Pour le langage français (4e en partant de la gauche), c'est bien GPT-4o-transcribe qui affiche le plus faible taux d'erreur, et donc la meilleure perf'.

Coté génération audio

OpenAI a aussi lancé son propre modèle text-to-speech : GPT-4o-mini-tts.

Les développeurs peuvent commander le modèle non seulement sur ce qu'il doit dire, mais aussi sur la manière de le dire, permettant ainsi des expériences plus personnalisées pour des cas d'utilisation allant du service client à la narration créative.

OpenAI propose un générateur en ligne (au design très sympa) pour tester son modèle audio : OpenAI.fm.

Vous sélectionnez une voix parmi la douzaine proposée et une vibe. Attention, vous pouvez vous même décrire la vibe, les 5 proposées (calme, dramatique, sincère…) ne sont que des suggestions.

Ainsi, j'ai défini une vibe "ASMR" avec la description ci-dessous.

⌨️

Voice: Whispery, intimate, and gentle, designed to soothe and relax.
Punctuation: Minimal punctuation with smooth transitions to maintain fluidity.
Delivery: Extremely slow and hushed, often barely above a whisper.
Phrasing: Simple and sensory-rich, focused on comfort and calm.
Tone: Delicate, relaxing, and personal, fostering a feeling of closeness.

🇫🇷 Sachez aussi qu'il est tout à fait possible d'entrer un script français, et qu'il sera alors lu dans un français le plus souvent impeccable.

Une seule déception : de ne pas pouvoir générer une voix mais de devoir nécessairement choisir l'une des 11 proposées. OpenAI a cependant promis que la génération de nouvelles voix personnalisées serait bientôt proposée.

Visualisez clairement vos idées grâce à l'IA

Lorsqu'il s'agit de créer des visuels explicatifs, vous pouvez choisir de vous battre sur Powerpoint avec des carrés et des flèches… Sinon, l'IA peut vous aider. Voici quelques outils phares en la matière.

▹ Générez une carte mentale grâce à NotebookLM : un jeu d'enfant

C'est une toute nouvelle fonctionnalité de NotebookLM, l'ovni IA proposé par Google sur lequel il est possible de charger des tonnes de sources (fichiers, URL, vidéos YouTube) pour ensuite pouvoir en converser avec un assistant mais aussi générer des documents de synthèse, texte et audio.

Dans un projet donné, NotebookLM propose désormais de générer une carte mentale avec un bouton activable dans la fenêtre centrale (Discussion)

La carte générée est entièrement interactive et il est ainsi possible de développer chaque élément dans de nouveaux sous-éléments.

Voici par exemple la carte mentale proposée dans un espace de travail sur le luxe et l'IA (dans lequel j'avais chargé de nombreuses sources texte et vidéo sur le sujet).

Cliquez sur un élément spécifique peut aussi déclencher une discussion à son sujet avec l'assistant IA de la plateforme.

Facile et puissant. (et gratuit…)

This post is for subscribers only

Subscribe now and have access to all our stories, enjoy exclusive content and stay up to date with constant updates.

Vous avez déjà un compte ? Se connecter

Résumé

Essayez le générateur audio d'OpenAI

Visualisez clairement vos idées grâce à l'IA

This post is for subscribers only

Sane

Continuer à lire

[UP211] Dynamique

[UP210] Du jamais vu

Passez à la vitesse IA