[UP109] Not So Green

Le véritable coût environnemental de l'IA | Un générateur de contenu éditorial riche et optimisé | La cohérence des personnages, enfin sur Midjourney.

News : La cohérence des personnages, enfin sur Midjourney.
Quick hack : Un générateur de contenu éditorial riche et optimisé.
Deep Dive : Le véritable coût environnemental de l'IA.

Salut à tous,

C'est une objection (légitime !) que j'ai souvent entendu en formation parmi les apprenants les plus réticents à l'IA : l'impact carbone supposément significatif de la technologie.

J'ai voulu creusé le sujet et j'ai rapidement constaté qu'il était extraordinairement opaque, surtout du fait d'un écran de fumée savamment entretenu par les géants de la tech.

Je suis parvenu à réunir des données et conclusions solides, réunies dans le sujet central de cette édition. Plusieurs heures de recherche concentrées ici-bas, en somme.

Bonne lecture !

Sane de Upmynt 💙

Les news chaudes 🔥

👥 Cohérence des personnages. C'était une fonctionnalité très attendue et elle est enfin disponible sur Midjourney. Grâce à la "character consistency", il est désormais possible de représenter la même personne d'une image générée à l'autre.

Je ne serais pas étonné que beaucoup d'utilisateurs profitent de cette fonctionnalité pour lancer leur influenceur virtuel maison…

🔧 Copilot personnalisé. Le générateur de GPT version Microsoft est arrivé. Le "Copilot GPT Builder" permet aux utilisateurs de créer des versions personnalisées de l'assistant IA Copilot. Fonctionnalité réservée aux abonnés Pro payants ($30 par mois), pour l'instant seulement aux US.

🇫🇷 La France doit accélérer sur l'IA. C'est la conclusion du premier rapport du "comité de l'intelligence artificielle générative", nommé en septembre dernier par Matignon (et dans lequel on retrouve des têtes comme Yann Le Cun, lead IA chez Meta, et Arthur Mensch de Mistral).

Concrètement, le rapport estime que la France a besoin de tripler le niveau d’investissements dans les technologies d’IA générative, pour atteindre au moins 5Mds € par an.

Quick hack avec SEOpital ⚡️ Un générateur de contenu éditorial riche et optimisé

Lorsque SEOpital* m'a contacté pour me proposer un partenariat, ils ont insisté dès le début pour que je teste leur solution moi-même afin de pouvoir rapporter un résultat concret à mes lecteurs. J'ai trouvé que l'approche était rassurante.

SEOpital se présente comme un outil de génération de contenu de haute qualité, optimisé pour le SEO.

La promesse est d'autant plus alléchante que c'est une tâche sur laquelle, de mon point de vue, ChatGPT échoue largement.

Les limites de ChatGPT

Sur le front éditorial, ChatGPT peut aider à trouver des idées de contenu et même établir un calendrier éditorial, assister sur la rédaction de contenus courts, ou bien synthétiser un texte existant, voire l'améliorer.

Mais je déconseille fortement son usage pour générer from scratch des contenus longs, car le tout est excessivement vague, générique et en définitive rébarbatif. Sans compter les hallucinations encore fréquentes.

📊 Même avec une amélioration de 40% de sa précision, GPT-4 publie toujours, selon le rapport technique publié par OpenAI, des informations inexactes dans 20% à 25% des cas.

J'ai donc testé SEOpital avec de grosses attentes, et j'ai challengé l'outil sur un case précis : la génération d'un article sur les enjeux éthiques de l'IA, publié sur le blog de upmynt.com le mois dernier.

SEOpital : un contenu éditorial solide

Première surprise, contrairement à ChatGPT, la génération du texte n'est pas instantanée. Le crawler de SEOpital va automatiquement consulter les premiers sites web rankés sur Google sur le sujet demandé, et en extraire des informations précises, afin de les remastériser dans un nouvel article ainsi généré.

SEOpital prétend que son IA a été entraînée à collecter les informations les plus pertinentes et à garantir la fiabilité du contenu généré.

Après une dizaine de minutes, l'article est disponible, et un premier constat s'impose : l'attente était justifiée, car l'article généré par SEOpital est non seulement long (quasi 2000 mots), mais surtout riche en informations précises. Mieux, les données chiffrées mentionnées sont véridiques (j'ai vérifié).

Même si, comme pour tout contenu IA-généré, une relecture s'impose, et que je recommande de peaufiner le contenu avant diffusion, voire de l'enrichir avec du rich content (visuel et/ou une vidéo Youtube), le tout constitue une base non seulement exploitable mais surtout ultra solide sur laquelle itérer sereinement.

Et surtout, le tout semble visiblement optimisé pour le SEO. Mais pour en avoir le cœur net, j'ai voulu monitorer l'évolution de son ranking dans les SERP au cours des semaines.

Une performance SEO avérée

Le challenge est de taille car Upmynt.com est un domaine relativement jeune (~1 an) avec une autorité quasi inexistante (!) Pour ne rien arranger, je publie rarement sur le blog.

Malgré ces fondamentaux fragiles, l'article est progressivement monté dans les résultats de recherche, semaine après semaine.

	Semaine 1	Semaine 2	Semaine 3	Semaine 4
Position SERP	42	29	19	14

En a peine un mois, l'article s'est hissé à la 14e position pour la recherche "enjeux éthiques IA", et ce, devant l'article de Radio France (21e), celui des Echos (23e) et celui de la BNF (25e).

Etant donné la dynamique en cours, j'ai bon espoir qu'il finisse même par atteindre la première page.

En bref : un générateur bien supérieur à ChatGPT

Bref, la qualité éditoriale de l'article et son optimisation SEO m'a permis de coiffer au poteau des sites avec une autorité et une réputation pourtant bien supérieure à celle d'un site confidentiel comme Upmynt.

Pour peu que votre domaine soit un minimum établi et que le sujet choisi rentre dans votre ligne éditoriale habituelle, atteindre la première page des SERP semble donc tout à fait atteignable.

Je ne cacherai donc pas mon enthousiasme sur SEOpital*, qui m'a positivement surpris par sa performance. L'outil est particulièrement adapté pour toute stratégie ambitieuse de création de contenu à grande échelle avec objectif d'acquisition de trafic organique.

Essayez par vous-même, l'essai est gratuit (sans CB). Et tenez-moi au courant des résultats obtenus !

Essayer gratuitement SEOpital

* Liens sponsorisés.

Deep dive 🔍 Le véritable coût environnemental de l'IA

Création from scratch de contenus éditoriaux convaincants, de visuels photo-réalistes et bientôt de vidéos plus vrais que nature : l'IA générative réalise de véritables miracles digitaux.

Mais cette révolution digitale, aussi miraculeuse soit-elle, a un revers écologique plus sombre, dont on sous-estime l'ampleur.

L'entraînement des modèles IA : une empreinte carbone difficile à estimer mais probablement énorme

On estime que l'entrainement de modèles d’IA est très polluant, mais les émissions exactes qui lui sont attribuables sont inconnues car les grandes entreprises tech rechignent à partager les données nécessaires au calcul de leur empreinte carbone.

J'ai quand même pu mettre la main sur une estimation - elle date de 2019.

📊 Des chercheurs du MIT ont estimé que l'entraînement d'un seul modèle pourrait équivaloir aux émissions de 5 véhicules sur leur cycle de vie entier.

Il s'agissait de l'évaluation pour un modèle de langage type GPT-2. Or, GPT-2 a été entrainé sur "seulement" 1,5Md de paramètres. À comparer avec les 175Mds de paramètres de GPT-3.5… et même les 1760Mds pour GPT-4 !!

Bref GPT-4 est 1000 fois plus volumineux que GPT-2. Et cela ne signifie que son entraînement ait été "juste" 1000 fois plus consommateur en énergie.

🚨 En effet, les chercheurs de cette étude de 2019 alertaient déjà :

« Les coûts informatiques et environnementaux de l'entraînement augmentent proportionnellement à la taille du modèle, puis explosent lorsque des étapes de réglage supplémentaires sont utilisées pour augmenter la précision finale du modèle. »

Bref, le fine-tuning d'un modèle fait "exploser" sa consommation énergétique.

Et on parlait ici des modèles dit NLP (Natural Language Processing), c'est-à-dire qui digèrent exclusivement du texte. L'énergie nécessaire à l'entrainement des modèles images est probablement bien supérieur encore, ne serait-ce que du fait du volume des données nécessaires.

Le PDG de Midjourney avait révélé que les premières versions de son modèle avait nécessité "des centaines de millions d'images".

La consommation des centre de données pointée du doigt

L'autre point noir est bien sûr du côté de l'utilisation des modèles IA.

📊 Une étude réalisée par Hugging Face et l'Université Carnegie Mellon (USA) a révélé en 2023 que la génération d’une seule image consomme autant d'énergie que la recharge complète d’un smartphone. Une IA générative d’images comme Midjourney est donc extrêmement énergivore.

A titre de comparaison, avec un modèle comme ChatGPT, la même étude révèle qu’un millier de requêtes de création de textes utilisent l’équivalent de 16% de la recharge d’un smartphone.

La génération d’une seule image consomme donc plus de 6 fois plus que la génération d’un millier de textes.

Mais il y a beaucoup plus d'utilisateurs de ChatGPT (180M) que d'adeptes des modèles d'image comme Midjourney (environ 16M).

Afin d'estimer la consommation totale d'énergie induite par l'usage de tous ces modèles, passons à la loupe la consommation des centres de données.

Lire la newsletter complète

Inscrivez-vous maintenant pour lire cette édition dans son intégralité et accéder à tous les contenus premium.

Abonnez-vous

Vous avez déjà un compte ? Se connecter

[UP109] Not So Green

Les news chaudes 🔥

Quick hack avec SEOpital ⚡️ Un générateur de contenu éditorial riche et optimisé

Deep dive 🔍 Le véritable coût environnemental de l'IA

Lire la newsletter complète

[UP121] Olympique

[UP120] Reçu 5 sur 5

[UP119] Custom