Premium

[UP163] Duel

Par Sane,

Publié le 7 oct. 2024   —   12 min lu

Réalisé par Sane sur Midjourney

Résumé

Flux détrône-t-il Midjourney ? | La nouvelle interface "Canvas" de ChatGPT | Meta dévoile un modèle vidéo prometteur.

News : Meta dévoile son modèle vidéo très prometteur.
Zoom : Canvas, la nouvelle interface ultra pratique de ChatGPT.
Deep Dive : Midjourney versus Flux - quel est le meilleur modèle image ?


Salut à tous,

ChatGPT semble indétrônable, et sa toute nouvelle fonctionnalité Canvas (présentée plus bas) vient encore creuser l'écart.

Quid de son alter ego coté image, le roi Midjourney ? Depuis les débuts d'Upmynt, je l'ai toujours considéré comme la Rolls-Royce des IA image. Mais le lancement récent du modèle open source Flux (et plus encore la toute dernière version pro 1.1) aurait d'après beaucoup rebattu les cartes.

Qu'en est-il vraiment ? Verdict dans le sujet central de cette édition.

Sane de Upmynt 💜


🎬 Prometteur. Meta dévoile son modèle vidéo Movie Gen, prévu pour être open source, mais aussi déployé dans les apps du groupe, à commencer par Instagram.

  • Capable de générer des vidéos de 16 secondes (vs 5 à 10 secondes pour la concurrence).
  • Peut également éditer des vidéos pour les transformer. Vous pourrez insérer des objets, remplacer des éléments et modifier les arrière-plans des clips que vous avez filmés. Et c'est ainsi que Zuck s'entraîne soudainement en poussant des nuggets.
  • Le modèle a la capacité unique de générer de l'audio parallèlement à vos clips (effets sonores et musique de fond).
  • Meta assure que ses modèles ont été entraînés avec des données publiques et sous licence, et prévoit de les affiner davantage en collaborant avec des créateurs. (gros "mouais")
Crédit vidéo : Meta (l'embed dégrade la qualité)

↔️ Flux 1.1. Black Forest Labs dévoile la dernière version de son modèle d'image open source. Flux 1.1 [pro] offre une génération 6x plus rapide que son prédécesseur Flux 1 [pro] tout en améliorant la qualité de l'image, l'adhérence du prompt et la diversité. Que demande le peuple ?

Basé sur les votes (à l'aveugle) des utilisateurs, le classement ELO Arena le place d'ores et déjà en tête des modèles d'images.

En outre, la nouvelle API bêta apporte les capacités de Flux directement aux développeurs et aux entreprises qui cherchent à intégrer la génération d'images de pointe dans leurs propres applications.

À noter qu'à ce jour, Midjourney ne propose toujours pas d'API…


👁 Pubs avec chatbots. Meta permet aux entreprises de créer des chatbots intégrés à l'unité de pub sur FB et Instagram.

Les annonceurs peuvent désormais configurer ces chatbots accessibles depuis la publicité ainsi diffusée sur la plateforme. Ces derniers peuvent répondre aux clients, offrir une assistance et faciliter une commande.


⏰ Aperçu IA. Le géant a annoncé l'arrivée des pubs dans les "AI overviews", c'est-à-dire les réponses IA-générées en tête des résultats de recherche,qui sont d'ailleurs légèrement redesignés au passage pour plus de clarté.

L'entreprise justifie cette nouveauté par l'utilité supposée pour les utilisateurs. Et moi qui croyais à des motivations purement commerciales…

« Nous avons constaté que les utilisateurs trouvent utiles les annonces présentes directement dans les aperçus IA, car ils peuvent ainsi se connecter rapidement aux entreprises, produits et services pertinents pour continuer leur navigation. »

Les aperçus IA ne sont proposés qu'aux utilisateurs américains pour l'instant.


🌈 It's okay to be gAI. L'app de rencontres gay développerait non pas un vulgaire chatbot, mais bien un vrai agent IA autonome qui agirait comme "wingman" pour l'utilisateur.

Le wingman en question rechercherait des relations long terme, organiserait des rendez-vous et même interagirait avec les wingman d'autres utilisateurs pour vérifier la compatibilité avant une éventuelle mise en contact.

Lancement d'ici 2027. Quelle époque.


Vous allez recevoir votre copie !

À tous les abonnés Upmynt Pro (annuel), les exemplaires promis de "Boostez votre Business avec l'IA" ont bien été envoyés en fin de semaine dernière. Vous devriez les recevoir en ce début de semaine, si ce n'est déjà fait.

➡️ Que faire si je n'ai rien reçu ?

Si vous êtes détenteur d'un abo annuel à Upmynt Pro, m'avez-vous bien envoyé votre adresse postale ? Si oui, attendez encore 2-3 jours avant de me relancer.

Si non, vous savez ce qu'il vous reste à faire : envoyez-moi simplement votre adresse postale par mail (en répondant par exemple à cette newsletter) pour recevoir votre exemplaire cadeau.

➡️ Puis-je encore profiter de l'offre ?

L'offre reste temporairement disponible : souscrivez maintenant à Upmynt Pro (annuel) et profitez de votre exemplaire inclus de "Boostez votre Business avec l'IA" (valeur 22€).

Si vous êtes déjà abonné en plan mensuel, vous devez basculer en plan annuel pour être éligible à l'offre.

Cet espace "Communauté" est le vôtre. Répondez à cet email avec votre besoin : Recrutement, ressource à partager, demande d'aide, question…


Canvas, la nouvelle interface ultra pratique de ChatGPT

OpenAI vient de lancer Canvas, une nouvelle version de l'interface ChatGPT qui permet des projets de rédaction (et de codage) plus "collaboratifs" avec le chatbot : vous pouvez en particulier éditer directement le document généré par ChatGPT.

⚠️ Attention, la fonctionnalité est réservée aux utilisateurs payants.

Elle est accessible depuis la liste de modèle dans le menu supérieur.

Important à savoir :

  • La fenêtre de collaboration apparaît automatiquement si ChatGPT détecte que cela peut être utile (typiquement, si vous lui demandez une génération éditoriale).
  • Vous pouvez éditer vous-même directement dans Canvas en corrigeant, supprimant, enrichissant le texte généré.
  • Feedbackez ChatGPT sur n'importe quel passage en le surlignant et en formulant votre requête. Voici un exemple sur un passage d'un communiqué de presse généré par GPT :

ChatGPT s'exécute et édite le passage concerné :

En définitive, le travail collaboratif avec ChatGPT est grandement facilité.

Allongez ou raccourcissez un bloc de texte, ajustez sa complexité technique, changez-en le ton, traduisez-le, ajoutez une dernière couche de finition : tout est facilité !


Midjourney versus Flux : quel est le meilleur modèle image ?

Flux a fait sensation a son lancement inopiné l'été dernier. Le modèle vient tout juste d'être édité avec une version "1.1 Pro" supposément encore meilleure.

Le temps est venu de rendre mon verdict : Flux a-t-il détrôné le roi Midjourney ?

💡
Quel cadre pour cet expérience ?

- J'ai testé les deux versions les plus avancées de chaque côté : Midjourney v6.1 et Flux 1.1 Pro.
- J'ai utilisé systématiquement le même prompt pour MJ et Flux.
- J'ai réalisé 7 à 8 générations à chaque fois et choisi le résultat le plus satisfaisant et/ou le plus représentatif.

▹ Comment accéder à ces deux modèles ?

Avant de rentrer dans le vif du sujet, voici comment accéder aux deux outils :

    • Midjourney : il faut s'abonner sur le site Midjourney. Ensuite, vous pouvez générer des visuels depuis l'interface web ou depuis Discord, selon votre pref.
    • Flux : il s'agit d'un modèle open source. Plusieurs options :

Si votre hardware est suffisamment robuste, vous pouvez donc le télécharger sur votre ordinateur et le faire tourner en local. Attention, ceci est un usage avancé qui nécessite l'usage d'une interface graphique comme ComfyUI.

Sinon, vous pouvez le faire tourner sur le cloud via des plateformes comme Replicate : seul les ressources GPU alors consommées vous sont facturées (quelques centimes par génération).

Flux est aussi proposé dans de nombreux générateurs image comme Civitai, Everart ou Sezam.

Enfin, Flux est intégré à Grok, le chatbot accessible sur X pour tout abo premium.

Place aux 9 matchs !

▹ Photo-réalisme (portrait) : l'excellence des deux côtés

Midjourney est à peu près capable de photo-réalisme depuis la v5 et à l'époque il était le seul à pouvoir s'en enorgueillir.

Depuis, nous en sommes à la version 6.1 avec un rendu encore affiné. Mais entre temps, Flux a débarqué et semble sérieusement concurrencer Midjourney.

La réalité : on peut toujours prétendre laver plus blanc que blanc, mais force est de constater que sur le front du réalisme, les deux générateurs font jeu égal. Cela est déjà en soi une prouesse de Flux, car c'est la première fois que Midjourney se fait égaler sur ce terrain.

Le prompt :

A portrait photography of an elderly woman with deep wrinkles, an intense gaze, natural lighting at the end of the day, blurred background in a garden.

À noter cependant la (légère) meilleure adhérence au prompt de Flux. Malgré la mention d'un jardin en arrière-plan, Midjourney s'est souvent borné à générer des portraits sur fond neutre, alors que Flux a systématiquement respecté la requête.

▹ Food photography : avantage Midjourney

Une composition alimentaire est un exercice fastidieux pour un générateur : la moindre anomalie, et le tout devient soudainement beaucoup moins appétissant.

Midjourney saisit mieux ce qui fait le succès d'une photographie de plat : recettes générées fidèlement et textures alléchantes. En comparaison, les plats générés par Flux ont parfois manqué de cohérence, notamment sur les textures, comme ces sushis un peu douteux.

Le prompt :

A typical beautifully arranged sushi platter on a wooden board, soft natural lighting from the side, with a shallow depth of field to focus on the sushi. Food photography.

▹ Style artistique : performances comparées

Un modèle d'image, ce n'est pas que du photo-réalisme. J'ai donc challengé les 2 modèles sur 3 styles visuels très spécifiques.

    • Pixel Art : avantage Flux

Les modèles d'images sont entraînés à affiner au max les textures et le rendu, si bien que le challenge "pixel art" est contre-intuitif pour eux.

Si aucun des deux modèles ne réussit pleinement à retranscrire un screenshot de jeu 8-bit (type Nes), c'est éventuellement Flux qui s'en rapproche le plus.

Midjourney génère bien du pixel art, mais à un niveau de détail bien trop poussé.

Le prompt :

A retro video game screenshot with a knight in armor fighting a dragon, all in an 8-bit style with bright colors and simple shapes. Pixel art.

    • Flat design : (léger) avantage Midjourney

Le flat design est plébiscité, notamment en B2B, pour faire passer des messages de manière claire et simplifiée. Sur ce style, les deux générateurs s'en sortent mieux que bien.

Aucun des deux modèles n'a respecté fidèlement la composition demandée (le chat sur une chaise). Midjourney propose une composition légèrement plus minimaliste et donc plus en phase avec les attentes pour un design de ce type.

Le prompt :

Flat design image of a person working from home, sitting at a desk with a computer, coffee cup, and notepad. A cat sleeps on a nearby chair, and a plant sits on the desk. The background features a large window with a cityscape view. Use bright colors and minimal details to create a professional but relaxed vibe

This post is for subscribers only

Subscribe now and have access to all our stories, enjoy exclusive content and stay up to date with constant updates.

S'abonner

Vous avez déjà un compte ? Se connecter

Partager sur Facebook Partager sur Linkedin Partager sur Twitter Envoyer par email

Passez à la vitesse IA

Abonnez-vous à la newsletter Upmynt et boostez vos activités professionnelles grâce à l'IA : dernières opportunités, meilleurs outils et conseils pratiques.

S'abonner