- News : OpenAI casse la baraque avec $1Md de CA potentiel.
- Quick hack : Les "Custom Instructions" enfin disponibles sur GPT.
- Deep dive : Plongée dans les prémices de la vidéo IA - 3 outils à l'avant-garde.
Salut à tous,
Sommes-nous au début du nouvelle ère, dite ère de l'IA ? Si tel est le cas, alors on peut se réjouir d'assister à l'aube d'une nouvelle époque.
Au cours de notre vie, nous aurons vu les révolutions de l'internet, du téléphone portable et maintenant de l'IA. Quelle autre génération a vécu autant de révolutions technologiques que la nôtre en si peu de temps ?
L'ère de l'IA a commencé avec les prouesses de ChatGPT et les créations criantes de réalisme de Midjourney. La prochaine étape se trouvera vraisemblablement du côté de la vidéo.
Dans cette édition, je vous propose de m'accompagner dans mon exploration des premiers outils d'IA générative côté vidéo. Installez-vous bien confortablement, et bonne projection !
Sane de Upmynt 💙
Les news chaudes 🔥
💸 Des dollars pas artificiels. OpenAI génère apparemment $80M par mois grâce à l'abo GPT Plus. Soit un rythme annuel proche du milliard de dollars.
De quoi rentabiliser le développement de GPT 3 et 4, qui auraient coûté la bagatelle de $540M. Un bon ROI en définitive.
👻 Prêt à rêver ? C'est la question posée par Snapchat, qui lance Dreams. La fonctionnalité IA permet de transposer vos selfies dans un autre univers, avec des décors et skins fantastiques.
8 générations IA par utilisateur. Après ça, il faut payer.
🧐 Microsoft pas clean ? Mozilla a mandaté des experts pour vérifier qu'avec son nouveau Service Agreement, Microsoft n'exploitait pas nos données personnelles (issues de Office, Teams, Xbox) pour entrainer ses modèles d'IA.
Les 9 experts en privacy n'ont pas pu en avoir le cœur net. Alors Mozilla veut faire parler Microsoft, avec cette pétition en ligne.
📱 Envie d'émerveillement ? Apple annoncera son nouvel iPhone 15 le 12 septembre lors d'un événement mystérieusement intitulé « Wonderlust ».
J'espère que ce sera aussi l'occasion d'en savoir plus sur le Vision Pro…
🧚♀️ La grosse hype de Roblox. Le métaverse des ados annonce une croissance de 25% de sa base d'utilisateurs quotidiens, à 65,5M.
Ca n'a pas échappé aux marques. Walmart et Claire's viennent ainsi d'y ouvrir des zones dédiées. (Source)
Communauté 🦊
Cet espace est le vôtre. Recrutement, ressource à partager, demande d'aide, question. Répondez à cet email pour y apparaître.
- Transparence
On sent que c'est la rentrée, avec un taux d'ouverture qui se rétablit à ses précédents niveaux, autour de 60%. Content de vous revoir :)
La croissance du nombre d'abonnés fut aussi ralentie en juillet et août. Heureusement, Hubspot France m'a un peu sauvé de cette torpeur estivale en featurant Upmynt dans un top des meilleures newsletters marketing, paru mi-août. Merci à eux !
Bienvenue à tous les nouveaux abonnés qui ont rejoint Upmynt à cette occasion. 💙
Quick hack ⚡️Les "Custom Instructions" enfin disponibles sur GPT
Les instructions personnalisées pour ChatGPT sont enfin disponibles en Europe.
Pour les paramétrer, dans l'interface de chat, cliquez simplement sur votre login en bas à gauche, et sélectionnez "custom instructions".
⚠️ Cette option est réservée aux abonnés GPT Plus.
Voici quelques conseils pour tirer pleinement parti de cette nouvelle fonctionnalité.
Dans le premier encadré (À propos de vous)
- Indiquez votre prénom, votre âge, votre genre, votre activité professionnelle, et toute autre précision qui aiderait le bot à vous fournir des réponses adaptées.
Par exemple, si vous utilisez ChatGPT pour générer des recettes, vous pouvez indiquer ici si vous avez une quelconque allergie. Cela évitera que GPT vous suggère des recettes à base de cacahuètes ;)
- Indiquez votre business : nom, taille, secteur, CA, etc.
Dans le second encadré (les réponses attendues de ChatGPT)
Quelles sont vos attentes en matière de réponses ? Indiquez-le ici pour ne pas avoir à le répéter à chaque nouveau chat avec le bot :
- Entrez toute requête modifiant le fonctionnement de GPT.
Vous pouvez lui demander de faire par défaut des réponses courtes (moins de 100 mots). GPT a tendance à être trop bavard.
Par exemple, dans Upmynt #50 je vous livrais un prompt pour empêcher GPT de s'excuser (il le fait sans arrêt). Vous pouvez désormais inclure cette directive les "Custom instructions" pour qu'elle soit prise en compte systématiquement.
- Inclure un raccourci que vous pourrez utiliser à tout moment.
Par exemple : « Lorsque je tape 3q dans un prompt, suggère 3 questions suite à ta réponse pour creuser davantage le sujet. »
Ou bien : « Lorsque je tape BP à la fin d'un prompt, réponds toujours sous la forme de bullet points. »
- Inclure des directives attendues s'appliquant à une question que vous formulez souvent.
Par exemple, si vous demandez régulièrement à ChatGPT de vous fournir des titres pour vos vidéos YouTube, formulez ici les attentes de votre part qui s'appliquent toujours (longueur, ton, audience de la vidéo), cela vous évitera de les répéter à chaque fois.
Deep dive 🔍 Plongée dans les prémices de la vidéo IA - 3 outils à l'avant-garde
Il faut voir ce trailer de "Barbenheimer", un mix entre les deux blockbusteers hollywoodiens de l'été, entièrement IA-généré.
Ce genre de production a demandé des heures de travail, plan par plan, en combinant génération d'image et de vidéo, et outils de montage.
En réalité, la génération de vidéo par IA en est à ses balbutiements.
Même les créations les plus abouties sont instantanément identifiables comme synthétiques : les formes sont grossières, l'animation chaotique, le réalisme encore largement absent.
Alors, un gadget ? C'est oublié qu'il y a un an, Midjourney ne faisait guère mieux côté image. En quelques mois, le modèle est pourtant parvenu à atteindre le photo-réalisme.
La vidéo IA suivra la même voie.
L'aube d'une révolution animée
Si les vidéos créées avec les tout premiers modèles étaient chaotiques, les v2 ont vu un saut qualitatif qui commence à les rendre dignes de notre intérêt.
Quels modèles ? Les véritables modèles d'IA générative se comptent sur les doigts de la main. J'en ai identifié trois principaux.
Cela inclut bien sûr Runway, considéré comme le Midjourney de la vidéo IA. La plupart des vidéos IA devenues virales sur la toile ont été générées avec cet outil. Voir par exemple ce trailer de Mais est-il vraiment le meilleur ?
Quelques précieux conseils avant de se lancer
- Baissez vos attentes. La meilleure qualité que vous puissiez atteindre restera très moyenne.
- Armez-vous de patience. La génération d'une vidéo, très gourmande en ressources, prend au moins une minute. Si ce n'est plus.
- Promptez droit au but. Hors de question d'écrire des prompts longs comme le bras. En vidéo IA, less is more. Un prompt de 4 ou 5 mots suffit.
- Itérez. Le premier jet sera rarement le bon. Il faut parfois 5 ou 6 itérations avant d'arriver à un résultat correct.
Commençons enfin l'exploration ! Afin de comparer les trois modèles, je les ai mis à l'épreuve en utilisant toujours le même prompt.
A black cat is running on the moon.Pour facilement les embedder, je partage ci-dessous les vidéos générées sous forme de GIF. Les vidéos n'ont pas été visiblement altérées par cette conversion.
1️⃣ La référence : le prodigieux Runway
Runway propose l'interface la plus intuitive, avec la possibilité de générer des vidéos à partir d'un texte ou d'une image.
Avec votre inscription (gratuite), vous héritez de suffisamment de crédits pour réaliser beaucoup de générations.
Le modèle à l'œuvre, Gen-2, est sorti en juin dernier, et s'il marque un net progrès, il ne permet pas encore d'atteindre un quelconque degré de réalisme.
Jugez par vous-même avec la meilleure vidéo générée sur le prompt test (sur 5 ou 6 itérations) :
Le modèle est plus performant en chargeant une référence imagée. J'ai donc inclus dans le prompt ce visuel créé avec Midjourney.
La qualité du résultat est bien supérieure, mais encore peu naturelle. Il faudrait faire des dizaines d'itérations avant d'arriver miraculeusement à une séquence presque correcte (une démarche crédible du chat).
Le verdict :
Runway
✅ Probablement l'outil le plus accessible. Interface web facile à utiliser. L'option de référence image est un vrai plus.
❌ Les résultats sont encore loin d'être très exploitables, à moins d'y passer des heures. L'outil est payant après quelques essais.