▹ Édito : Google nouveau maître de l'IA.
▹ News : Le buzz Ghibli x ChatGPT n'en finit plus.
▹ Zoom : Ideogram, que vaut la version 3 ?
▹ Deep Dive : 5 cas d'usage incroyables pour exploiter le modèle image de GPT.
Salut à tous,
Google est officiellement le nouveau champion de l'IA, mais personne n'en parle.
OpenAI, pour la première fois depuis la sortie de ChatGPT, est bien à la traîne, tout comme Anthropic.
C'est la première fois que Google est objectivement en tête — toutes catégories confondues, prix et rapidité — sur le match des modèles IA (LLM).
La semaine dernière, la sortie de Gemini 2.5 Pro (en version "expérimentale") a été totalement occulté par le buzz "Ghibli" sur ChatGPT.
Ce n'est qu'une victoire court terme pour OpenAI : en réalité, le rapport de force a changé, en faveur de Google.
Récapitulatif : LiveBench, LMSYS, humanity’s last exam, Aiden bench, et même le test de QI : tous les benchmarks désignent "Gemini 2.5 Pro" comme le leader incontesté du peloton, quand bien même il n s'agit encore que de sa version expérimentale (non définitive). Ça promet !

Et pour enfoncer le clou, ce nouveau modèle a été rendu disponible ce weekend à tous les utilisateurs de Gemini (payant ou gratuit) !
Connectez-vous simplement à Gemini avec votre compte Google puis sélectionnez ce modèle dans la liste des modèles disponibles.
Réagir à cet édito sur Linkedin
Pour le reste, bon début de semaine et bonne lecture !
Sane de Upmynt 💜

🐷 Studio Ghibli. ChatGTP peut convertir n'importe quelle photographie dans un style Studio Ghibli, et les utilisateurs s'en sont donnés à cœur joie.
Les visuels correspondant ont inondé X ces derniers jours. Pour le meilleur et pour le pire. L'essentiel étant bien sûr dédié au recyclage de fameux memes. Et même pour un remake du trailer du Seigneur des Anneaux.
Même les politiques français s'y sont mis, ce qui n'a pas manqué de choquer la rédaction de Libé (un peu sensibles les pépères).

Attention, vous deverz être abonné payant pour profiter du nouveau modèle d'image de ChatGPT.
💸 Les gros sous. OpenAI serait sur le point de finaliser un tour de table de $40Mds, mené par SoftBank. De quoi valoriser le créateur de ChatGPT à $300Mds.
$300Mds, c'est 50x la valo de notre champion IA national Mistral ($6Mds). Hum…
🤔 GPT-4o alpha plus turbo 2. Malgré la sortie de GPT-4.5 (censé être son successeur), GPT-4o vient d'être mis à jour par OpenAI. Moi-même je n'y comprends plus rien. Au programme :
- Meilleure capacité à suivre des instructions détaillées, notamment celles contenant plusieurs demandes.
- Meilleure capacité à résoudre des problèmes techniques et de codage complexes.
- Intuition et créativité améliorées.
- Moins d'émojis. (c'est vrai qu'il avait tendance à en coller partout 🚀)
👥 Fast Fashion IA. H&M prévoit d'utiliser l'IA pour créer des mannequins « jumeaux numériques » qui seront utilisés dans certaines publications et campagnes marketing de l'entreprise sur les réseaux sociaux. (source)
Le tout est réalisé avec l'autorisation des mannequins, insiste l'entreprise (encore heureux).
Les mannequins conserveront ainsi les droits sur leurs répliques numériques et seront rémunérés pour leur utilisation.

🤢 xAI x X. Elon Musk vient d'annoncer que sa startup xAI a acquis la plateforme X (ex Twitter) dans le cadre d'une transaction en actions, combinant les 2 entreprises dans une nouvelle entité appelée xAI Holdings, évaluée à plus de $100Mds.

▹ Lien favori
C'est le lien vers le générateur Reve qui a recueilli le plus de clics la semaine dernière.
Reve s'est propulsé dès son lancement comme le meilleur modèle image du marché, devant Recraft, Flux et Midjourney. Une prouesse.
Cet espace "Communauté" est le vôtre. Répondez à cet email avec votre besoin : Recrutement, ressource à partager, demande d'aide, question…

Ideogram : que vaut la version 3 ?
Initiallement un modèle confidentiel spécialisé dans la génération de visuels incorportant du texte, la v2 de Ideogram avait surpris par la qualité de ses rendus.
La v3 sera-t-elle la version ultime ? Ideogram promet un réalisme boosté. Pas de quoi se différencier outre mesure. Cela étant, la combinaison texte + photo réalisme peut permettre de créer des visuels de type publicité.
Illustration avec cet essai :
Ideogram incorpore un module qui améliore automatiquement vos prompts, si bien que le prompt final effectivement utilisé est le suivant :
Pour ce résultat :

Pas mal à première vue, mais on y regardant de plus près, on reste encore relativement éloigné du photo-réalisme, sans compter les anomalies (comme sur le design de la canette). Il faudrait donner au visuel un coup d'upscaler.
Le modèle connaît effectivement Red Bull, donc il peut reproduire "facilement" le look & feel des publicités de la marque. Quid de votre marque, probablement plus confidentielle ?
Eh bien, la grosse nouveauté de cette v3, ce sont surtout les références stylistiques.
Vous chargez jusqu'à 3 visuels références, et Ideogram est capable d'appliquer le même style à n'importe quelle nouvelle image générée. Cette fonctionnalité est cependant réservée aux utilisateurs payants.

Je regrette l'absence d'une fonctionnalité d'édition pour simplement corriger facilement les imperfections dans une image générée.
Bref, si Ideogram v3 fait mieux par rapport à la v2, il ne semble pas tenir la route face aux rouleau compresseur OpenAI (cf sujet central).

5 cas d'usage incroyables pour exploiter le modèle image de ChatGPT
Le modèle 4o Image Generation n'est pas que capable de générer des images dans le style Ghibli. Il peut bien plus. Panorama avec 5 cas d'usage précédemment irréalisables.
▹ Créer une publicité originale
Réutilisons le prompt de la pub Red Bull utilisé pour Ideogram et comparons ! On repart du prompt de départ, puisque ChatGPT est lui aussi censé l'améliorer.

La première version est acceptable mais peu convaincante. Et c'est là toute la force de l'interface conversationnelle de ChatGPT, il m'a suffit de lui demander de représenter l'athlète dans une position plus typique du saut en chute libre, à savoir en position "ventre vers le sol".

Il ne s'agit pas de prétendre ici que la publicité est utilisable pour une diffusion massive, mais le niveau atteint en seulement deux essais est déjà remarquable. Cela ferait typiquement largement l'affaire pour un brief à une agence créative.
▹ Intégrer un produit à une publicité ou un visuel e-commerce
Vous pouvez charger un cliché produit à ChatGPT et lui demander de le représenter en contexte ou porté.
Exemple ci-dessous avec les produits Horace :

Il faut bien comprendre que le visuel fourni est un JPG, pas même un PNG transparent. Qu'à cela ne tienne ! ChatGPT va extraire les produits et les intégrer harmonieusement dans un nouveau visuel publicitaire créé sur mesure.

Un autre exemple glané sur X :
