Premium

[UP187] Bouche bée !

Par Sane,

Publié le 8 janv. 2025   —   10 min lu

Résumé

Clonez une voix grâce à l'IA (Eleven Labs et Speechify) | Générez vos résolutions 2025 | L'agent IA de H se dévoile un peu plus.

News : L'agent IA de H se dévoile un peu plus.
Quick hack : Clonez une voix grâce à l'IA (Eleven Labs et Speechify)
Outils : Une poignée d'outils IA en or.
Prompts : Générez vos résolutions 2025.


Salut à tous,

Nouvelle édition, nouvelle contribution. Le sujet central de cette édition a été rédigé par Martin, un nouveau contributeur ! Et il a commencé très fort en clonant ma voix 🙊 (je suis toutefois une victime consentante).

Que ma voix – cet élément si personnel – puisse être capturée et exploitée par une IA me pousse à réfléchir : une fois intégrée dans un outil, est-elle encore mienne ou devient-elle une vulgaire donnée malléable et exploitable à merci ?

👉 Une intonation, des tics de langage, tout cela peut être modélisé, démultiplié, voire déformé. L'échantillon audio servira d’ailleurs certainement à entraîner de futurs modèles audio de ElevenLabs.

Cela illustre bien notre époque : chaque empreinte que nous laissons peut être recyclée, réinventée, parfois appropriée. Et ce, le plus souvent souvent sans contrepartie…

Sane de Upmynt 💜


🤖 IA agentique. La startup française H en dévoile un peu plus sur son prometteur système d'agent IA baptisé Runner H.

Dans cette démo vidéo diffusée sur X, sur la base d'un simple prompt pour lancer un side business, Runner H prend les choses en main et réalise une petite étude de marché puis lance le site web correspondant.

Extrait vidéo démo de Runner H

On y découvre que tout autonome qu'il soit, l'agent demande bien confirmation à l'utilisateur avant de procéder à un paiement (nom de domaine).

Envie d'essayer ? Rejoignez la liste d'attente.


🤖 IA agentique (bis). OpenAI viserait pour sa part une sortie de son agent IA autonome « ​​Operator » ce mois-ci. Il aurait connu un retard de lancement en raison de problèmes de sécurité (prompt injection). Hâte de tester ça !


📺 TV IA. Google a présenté un nouveau modèle de télévision boosté à l'IA, exploitant Gemini pour créer des résumés d'actualités automatisés à partir de sources en ligne et de YouTube.


🦾 Hubspot x Frame AI. HubSpot a annoncé le rachat de Frame AI, une startup qui analyse des échanges comme les emails, appels et réunions pour en tirer des informations utiles.

L’idée : combiner ces données avec celles déjà présentes dans HubSpot pour aider les entreprises à mieux comprendre leurs clients, anticiper leurs besoins et agir plus rapidement. Smart !


🤲 Bien être. Panasonic dévoile Umi, un assistant bien-être conçu avec Anthropic, utilisant l’IA Claude.

Cette application aide les familles à organiser leurs routines, fixer des objectifs et gérer les soins au quotidien.

Disponible mi-2025 aux États-Unis, Umi sera intégré à des services populaires comme Calm, Blue Apron et Precision Nutrition.

Umi illustre une tendance forte : l’IA personnalisée au service du quotidien. C’est un exemple concret d’IA créant de la valeur en améliorant l’expérience utilisateur et en s’intégrant dans des écosystèmes existants.

Crédit visuel : Panasonic

Ce "Quick Hack" est proposé par Martin Vincendeau. C'est sa première contribution à Upmynt. Un grand merci à lui ! 💜 


Clonez une voix grâce à l'IA

À l’heure où les modèles vidéo impressionnent autant qu’ils ne déçoivent (une pensée émue pour toutes les gymnastes générées sur Sora), l’audio est quant à lui un format beaucoup plus mature. Dans ce Quick Hack, je vous montre comment cloner une voix en quelques étapes !

Pour cela, nous utiliserons ElevenLabs. Malheureusement, la plateforme ne propose pas le clonage de voix gratuitement. Il vous faudra prendre l’abonnement à 6$/mois.

Son concurrent, Speechify, permet de cloner gratuitement une voix et vous offre 1000 caractères de génération (entre 150 et 180 mots d’après mes calculs ChatGPT). Mais quid de la qualité ? Réponse plus bas.

L’audio d'origine : le nerf de la guerre

C’est un peu contre-intuitif, mais pour capturer l’essence d’une voix, il n’est pas nécessaire que l’enregistrement dure plusieurs heures… Seules quelques secondes suffisent.

Par contre, il est impératif que l’enregistrement soit de bonne qualité. Voici quelques conseils : 

    • Maintenir un ton constant tout au long de l’enregistrement, en évitant les variations importantes de vitesse et d’intonation.
    • Pas de bruits de fond gênants (évitez donc de vous enregistrer à proximité d’une fanfare).
    • Minimiser les bruits de respiration et de bouche.
    • Utiliser une voix dans la langue et l’accent souhaités pour le clonage.

⏱️ En terme de durée, ElevenLabs recommande un enregistrement de 1 à 2 minutes, car au-delà de 3 minutes, la qualité du clonage tend à diminuer.

👉 D’expérience, on peut déjà obtenir de très bons résultats avec un audio de 20 secondes. Tout dépend vraiment de l’audio d’origine.

L'IA va copier au mieux tout ce qu’elle capte de l'enregistrement (y compris les bruits parasites). Au moment de la création de la voix, ElevenLabs propose l’option « Supprimer le bruit de fond des échantillons audio » qui est plutôt efficace. Activez-la.

Clonons ensemble la voix de Sane

Pour notre exemple, j’ai pris (avec son aimable autorisation) 40 secondes de la voix de Sane extraites de ce super épisode du podcast Comptoir IA.

Le clonage ne prend que quelques secondes et une fois votre voix clonée, il vous suffit d’aller sur text-to-speech et de taper votre texte :

Il n’est pas nécessaire de beaucoup jouer sur les réglages à droite. En un ou deux tests, on obtient le résultat optimal. Généralement, je mets entre 60 % et 90 % sur chacun des curseurs.

Et voici le résultat :

audio-thumbnail
Sane ElevenLabs OK
0:00
/15.960813

Convaincant, non ?

Speechify (version gratuite) permet-il le même niveau de performance ? Voyons cela.

🔐 La suite de ce sujet est réservée aux membres Upmynt Pro.

ElevenLabs vs Speechify (version gratuite)

En passant par la version gratuite Speechify, le résultat s'avère un peu moins qualitatif :

audio-thumbnail
Sane Speechify OK
0:00
/16.92

L’IA butte notamment sur des mots ou passages simples, comme “c’est”. (En remplaçant dans le script par “c”, on évite ce problème.)

il s’agit ici de la version gratuite. Pour sa part, la version payante permet certainement un résultat équivalent à ElevenLabs. Mais elle est (beaucoup) plus chère : 29$/mois. 

💡
L'astuce en plus
Ça ne sera pas nécessaire avec la version payante d’Eleven Labs, mais il existe des solutions gratuites (sous réserve de créer un compte) comme Adobe Podcast Voice Enhancement pour améliorer la qualité d’un enregistrement audio. 

Attention, le clonage de voix représente une avancée majeure pour la création de contenu mais elle n’est pas sans risques. À une époque où les arnaques avec de l’IA se multiplient, le FBI recommande même de vous trouver un mot de passe pour vos communications avec votre famille. Vous voilà prévenus…


Merci encore à Martin pour cette première contribution à Upmynt ! D'autres suivront bientôt…


Une sélection d'outils IA à découvrir, selon vos besoins actuels :

Instant 3D AI : Transformez instantanément des images 2D en modèles 3D prêts à l'emploi pour Blender ou Unity. Essai gratuit (3 générations possibles).

Put Logo Anywhere : Sur le papier, ce générateur vous permet de charger votre logo, puis de demander la génération de n'importe quel visuel le featurant.

À l'usage, ça ne fonctionne pas à tous les coups. Mais c'est gratuit, alors itérez jusqu'à avoir de la chance !

Réalisé avec le prompt "A man wearing a T-shirt with a logo at the center" tel que suggéré par défaut - ça ne marche pas à tous les coups ;)

🔐 La suite de cette liste (5 autres outils) est réservée aux membres Upmynt Pro.

Attention, les outils n'apparaissent que dans la version mail de la newsletter (pas celle consultable en ligne).

Crédit image : Katalist

Prompt 1 - Générez vos résolutions 2025

Vous n'avez pas encore déterminé vos résolutions 2025 ? ChatGPT peut vous y aider. OpenAI a partagé ce petit prompt sur son Instagram, et le voici retranscrit ici (et traduit).

Bien sûr, pour que cela fonctionne, cela suppose que vous ayez suffisamment utilisé ChatGPT afin qu'il vous connaisse un minimum.

En ta basant sur tout ce que tu sais déjà de moi, quelles devraient être mes résolutions pour la nouvelle année ? Sois brutalement honnête.

Inspirez-vous de la réponse, mais ne laissez cependant pas ChatGPT décider pour vous. Ce n'est pas à l'IA de vous dire comment conduire votre vie… 🙃


Prompt 2 - Générez une enquête de satisfaction client engageante

Voici un prompt efficace pour créer des enquêtes de satisfaction client sur mesure avec ChatGPT.

Il guide l’IA pour structurer des questionnaires engageants, clairs et pertinents, en s’adaptant à une audience cible précise et à un produit ou service spécifique.

Avec des consignes simples mais détaillées, ce prompt garantit des retours exploitables tout en maintenant une enquête concise et agréable à remplir. Idéal pour maximiser la qualité des insights clients et améliorer vos offres rapidement.

Place au prompt :

🔐 Cette ressource est réservée aux membres Upmynt Pro.

This post is for subscribers only

Subscribe now and have access to all our stories, enjoy exclusive content and stay up to date with constant updates.

S'abonner

Vous avez déjà un compte ? Se connecter

Partager sur Facebook Partager sur Linkedin Partager sur Twitter Envoyer par email

Passez à la vitesse IA

Abonnez-vous à la newsletter Upmynt et boostez vos activités professionnelles grâce à l'IA : dernières opportunités, meilleurs outils et conseils pratiques.

S'abonner