Premium

[UP160] Intuitif

Par Sane,

Publié le 25 sept. 2024   —   10 min lu

Réalisé par Sane sur Midjourney

Résumé

Éditez vos fichiers vidéo et podcast ultra facilement | Interview de Colin Dunn, fondateur de Visual Electric | Le nouveau mode voix de ChatGPT enfin dispo.

News : Le nouveau mode voix de ChatGPT enfin dispo (mais…)
3 questions à : Colin Dunn, fondateur de Visual Electric.
Quick hack : Éditez vos fichiers vidéo et podcast ultra facilement.
Prompts : Des visuels pour célébrer l'automne.


Salut à tous,

Quel honneur d'interviewer dans cette édition le PDG de Visual Electric, un générateur image que j'ai si souvent complimenté dans ces colonnes et couvert en formation.

Visual Electric est pensé pour être accessible à tous, avec son interface originale et si intuitive. et c'est aussi le cas de l'outil de montage vidéo couvert dans la rubrique "Quick Hack" de cette édition.

Avec Upmynt puis avec mon guide pratique sorti ce mois-ci, j'ai aussi cette obsession de rendre l'IA accessible à tous, et de ne laisser personne sur le bas-côté. Car la révolution IA n'en sera vraiment une que si elle est partagée. 💜

Bonne lecture !

Sane de Upmynt

PS : Pssst! Il parait que mon ouvrage est en rupture de stocks dans certaines Fnac. Il y aura bientôt un réassort, mais en attendant, vous pouvez toujours le commander en ligne sur Amazon ou Fnac.fr :)


🗣️Woah. Le nouveau mode voix de ChatGPT (sur l'app smartphone) est enfin disponible… Sauf pour nous les Européens. Mais il est possible de contourner le blocage avec un VPN.

Il faut être en outre détenteur d'un plan payant (Plus ou Teams) pour y accéder.

C'est un énorme progrès en terme de réalisme, de tonalité et en définitive d'expérience utilisateur. J'y reviendrai.


🥇Super intelligence. Dans un billet sur son blog, Sam Altman anticipe l'atteinte du stade de "super intelligence" (ou AGI) dans "quelques milliers de jours", soit une dizaine d'années.

Il pressent une métamorphose du monde du travail, avec une création de valeur sans précédent.

« À terme, nous pourrons chacun avoir une équipe d'IA personnelle, composée d'experts virtuels dans différents domaines, travaillant ensemble pour créer presque tout ce que nous pouvons imaginer. »

Il y déclare sa foi pour l'IA, et la prospérité qu'elle sera capable d'apporter pour l'humanité, allant même jusqu'à prédire sa capacité à résoudre la crise climatique et permettre les colonies spatiales. Rien que ça.


👻 Snapchat IA. Une nouvelle fonctionnalité IA de Snapchat permet de créer des Lens AR avec un simple prompt. Les utilisateurs peuvent donc désormais personnaliser une mini expérience de réalité augmentée simplement en la décrivant.

Les petites entreprises et agences peuvent pour leur part exploiter cette fonctionnalité pour créer des expériences AR interactives et personnalisées pour leurs clients.

Cela ouvre de nouvelles possibilités pour des campagnes engageantes et créatives sur Snapchat, un réseau toujours aussi plébiscité par les ados et les jeunes adultes.


⏰ Brain-to-text. Des chercheurs suisses ont développé une micropuce qui convertit les pensées en texte avec une précision de 91,3 %.

Cette interface cerveau-ordinateur miniaturisée (MiBCI) est compacte et consomme peu d'énergie, surpassant les systèmes traditionnels.

Le système fonctionne via des électrodes implantées qui captent les signaux neuronaux lorsque la personne imagine écrire, les traduisant en texte.

Cette news vous est proposée en partenariat avec la newsletter Ristretto : l'essentiel de l'actu en 5 minutes chrono, tous les matins, sans s'ennuyer.


Le principe : 3 questions chaque semaine à une figure montante de l'IA.

Colin Dunn, fondateur de Visual Electric

Ravi d'avoir pu interviewer Colin Dunn, le co-fondateur et PDG de Visual Electric. Du coup, l'interview consistera exceptionnellement en 4 questions au lieu de 3 ;-)

Ceux qui suivent Upmynt depuis longtemps savent que j'ai toujours plébiscité cette plateforme pour son accessibilité, son intuitivité, et son rapport qualité prix.

Tout au long de sa carrière, Colin Dunn a travaillé à l'intersection du design, des outils créatifs et de la collaboration. Il a dirigé le design produit et la conception de marques chez des entreprises comme Universe et Playspace, et a travaillé en tant que designer chez Dropbox, Facebook et Pentagram.

Le nouveau modèle de Visual Electric, VE2, démontre une grande adhérence aux prompts, une amélioration du rendu du texte et une qualité visuelle générale qui rivalise avec Midjourney. Il est également un peu plus rapide que le modèle précédent et excelle dans une variété de styles, pas seulement la photographie.

Crédit image : Visual Electric

▹ Q1 : Pourriez-vous nous en dire plus sur le développement du modèle VE 2 ? Quelle part de celui-ci est basée sur des modèles open-source existants comme Stable Diffusion ou Flux ?

Colin : Nous utilisons un pipeline de génération d'images personnalisé basé sur Google Imagen 3 que nous appelons VE2.

Nous ne formons pas nos propres modèles de base, mais nous nous concentrons sur la création de la meilleure expérience produit en utilisant les meilleurs modèles disponibles publiquement à un moment donné. Nous pensons que pour une startup, c'est la meilleure stratégie.

Crédit image : Visual Electric

▹ Q2 : Visual Electric se distingue des autres générateurs par son accessibilité et sa facilité d’utilisation — notamment avec son interface de prompt (y compris l'assistance aux prompts) et, plus important encore, cette incroyable interface moodboard (canvas). D’où est venue l'idée de cette UX unique ? Était-ce votre concept personnel ?

Colin : Lorsque nous avons lancé Visual Electric, la plupart des produits IA utilisaient des interfaces de chat, comme Midjourney et ChatGPT. Nous croyons que le chat est une excellente interface pour utiliser un modèle de langage (LLM), mais nous pensons que pour les esprits visuels qui travaillent avec des images, une toile (canvas) est une interface bien plus naturelle.

Le chat présuppose une nature linéaire, où vous avez un point de départ et un point de fin. Nous pensons que la créativité est non linéaire et multi-ramifiée. Nous avons conçu Visual Electric pour fonctionner comme le fait la créativité.

Crédit image : Visual Electric

▹ Q3 : Je mets régulièrement mes lecteurs à jour sur les nouvelles fonctionnalités de Visual Electric. Après la sortie de VE2 et tous les nouveaux styles, à quoi pouvons-nous nous attendre prochainement ?

Colin : Nous travaillons sur de nombreuses nouvelles fonctionnalités passionnantes, y compris la possibilité de former vos propres modèles sur des personnages, des styles, des produits et des logos.

Aujourd'hui, Visual Electric est un remplacement pour les banques d'images. Une fois que nous aurons lancé des modèles personnalisés, nous croyons que Visual Electric remplacera les séances photo.

Crédit image : Zach Ogaard (via Visual Electric)

▹ Q4 : Y a-t-il un autre outil IA qui vous a récemment impressionné, notamment un qui propose une interface intuitive, comme ce que Visual Electric tente d’accomplir ?

Colin : Je suis un grand fan de Descript, qui vous permet d'éditer des fichiers vidéo et audio comme un document.

Descript est un excellent exemple d’un produit rendu unique par l'IA — ils ont développé une interface révolutionnaire, bien plus naturelle à utiliser, rendant la production vidéo et audio accessible à beaucoup plus de personnes. C’est exactement ce que nous essayons de faire avec Visual Electric.


Éditez vos fichiers vidéo et podcast ultra facilement.

En découvrant la reco de Colin Dunn (cf Q4 de son interview ci-dessus), j'ai eu envie de tester Descript, et j'ai été effectivement assez bluffé.

Descript propose d'éditer un fichier audio (type podcast) ou vidéo comme vous le feriez avec un document texte.

Dès lors que vous intervenez sur le transcript de la vidéo (en retirant, déplaçant ou ajustant du texte), cela transforme en conséquence la vidéo.

J'ai essayé sur un épisode (vidéo) du podcast Comptoir IA (en récupérant le fichier mp4). Moi qui n'y connait strictement rien en montage vidéo, j'ai pu effectivement éditer à ma guise et obtenir une nouvelle vidéo montée, avec les séquences ajustées et dans un nouvel ordre, ultra simplement.

En outre et grâce à l'IA, Descript repère et supprime automatiquement les mots parasites ("euh…") et le son studio (arrière plan) pour un meilleur look & feel et - pour une séquence face caméra - il peut corriger le regard de l'intervenant pour son regard soit bien orienté vers le viewer.

Il est aussi possible d'ajouter des sous-titres ou d'incruster des transitions ou même de générer des vidéos courtes (type TikTok) à partir d'une version longue.

Petit bémol : dans mon expérience, le transcript fonctionnait bien mieux sur les vidéos anglaises que françaises. En français, il y avait quand même pas mal de confusions dans le transcript (ce qui n'empêche pas pour autant d'éditer la vidéo).

De même, pensez bien dans les menus à choisir l'option "always ask before transcribing", car sinon, par défaut, l'outil essaiera de générer un transcript anglais pour votre vidéo en français, ce qui donne un résultat délirant.


Une sélection d'outils IA à découvrir, selon vos besoins actuels :

 Clones : Cette plateforme propose des compagnons IA personnalisés pour des conversations supposément enrichissantes et des conseils précieux.

Les utilisateurs peuvent recevoir des conseils d'experts, participer à des discussions amicales et trouver de l'aide pour divers défis de la vie, le tout adapté aux besoins individuels.

🔐 La suite de cette liste (5 autres outils) est réservée aux membres Upmynt Pro.


Prompt 1 - Générer l'objet parfait pour une campagne emailing

Quand vous faites une demande à votre assistant, n'hésitez pas à lui demander plusieurs versions d'une même idée. Pourquoi ? Parce que vous aurez la possibilité de comparer, affiner et choisir la meilleure option selon votre objectif.

Par exemple, si vous cherchez l'objet parfait pour une campagne d'emailing, voici un prompt optimal :

Génère 5 variations d'un objet d'email engageant pour une campagne qui promeut [produit/service]. Le ton doit être [amical/professionnel/fun/etc] et l'objet doit rester concis (moins de 50 caractères) tout en incitant à ouvrir l'email.

Prompt 2 - Des visuels pour célébrer l'automne

L'automne est déjà là. Cette saison apporte une douceur mélancolique, aux teintes rouge et or. Les journées raccourcissent, l'air devient plus frais, et une envie de cocooning s'installe. C'est la saison des boissons chaudes, des pulls confortables, et des promenades sous les arbres colorés.

Voici comment procéder niveau prompting pour générer très facilement des images dans cette ambiance à volonté sur Midjourney.

This post is for subscribers only

Subscribe now and have access to all our stories, enjoy exclusive content and stay up to date with constant updates.

S'abonner

Vous avez déjà un compte ? Se connecter

Partager sur Facebook Partager sur Linkedin Partager sur Twitter Envoyer par email

Passez à la vitesse IA

Abonnez-vous à la newsletter Upmynt et boostez vos activités professionnelles grâce à l'IA : dernières opportunités, meilleurs outils et conseils pratiques.

S'abonner