Premium

[UP157] Chaîne de pensée

Par Sane,

Publié le 16 sept. 2024   —   11 min lu

Réalisé par Sane sur Midjourney

Résumé

Faut-il utiliser o1, le nouveau modèle de ChatGPT ? | Midjourney tease sa V7.

News : Midjourney tease sa V7.
Communauté : Une offre spéciale pour vous ! 🎁
Deep Dive : Faut-il utiliser o1, le nouveau modèle proposé sur ChatGPT ?


Salut à tous,

La sortie d'un nouveau modèle par OpenAI est toujours un événement et celle de o1 ne fait pas exception à la règle.

Dans cette édition qui lui y est dédiée, j'ai voulu vous expliquer de la manière la plus claire possible en quoi il marque un vrai tournant, et vous livrer mes impressions sur son utilité effective.

Bonne lecture éclairée !

Sane de Upmynt 💜


🎬 Midjourney tease sa v7. La version 7 serait prévue dans un à deux mois, avec des améliorations pour la rendre plus accessible et professionnelle.

Les nouvelles fonctionnalités incluront :

  • La génération de 8 images à la fois (contre 4 actuellement).
  • Un éditeur d'images pour travailler sur des images externes.
  • Un système 3D utilisant un format type "NeRF" pour des images AI plus immersives.
  • Des personnalisations plus poussées, dans la continuité des fonctionnalités déjà disponibles et décrites dans la dernière édition d'Upmynt.

🦾 Robot Rock. Google DeepMind a dévoilé 2 nouveaux systèmes spécialisés dans la robotique.

  • ALOHA Unleashed permet aux robots d'utiliser deux bras pour manipuler des objets, réalisant des tâches comme lacer des chaussures ou accrocher des vêtements.

Ça n'a l'air de rien, mais le laçage de chaussures est une tâche difficile pour les robots depuis des décennies.

  • DemoStart, quant à lui, utilise l'apprentissage par renforcement pour entraîner des mains robotiques multi-doigts en simulation.

L'apprentissage en simulation est un élément clé pour réduire les coûts et le temps associés aux expérimentations physiques, tout en permettant un transfert efficace des compétences du monde virtuel au monde réel.

Crédit image : DeepMind

La vraie révolution, c'est que les robots de DeepMind peuvent désormais apprendre ces tâches complexes simplement en regardant les humains les faire, avant de les décomposer dans leur système et de les reproduire (d'abord en simulation, puis en réel).


💽 Quand c'est gratuit… Meta a confirmé qu'elle utilise depuis 2007 tous les textes et photos publiés publiquement sur Facebook et Instagram pour entraîner ses modèles d'IA.

Les utilisateurs européens peuvent refuser, mais ce n'est pas le cas pour le reste du monde. Meta a même inclus les posts de personnes qui étaient mineures à l'époque.

L'affaire soulève de sérieuses questions outre-atlantique sur la vie privée et l'exploitation des données, les Américains allant même jusqu'à envier les utilisateurs européens, protégés par la législation de l'UE.


Offre spéciale pour les nouveaux abonnés Upmynt Pro (annuel)

L'abonnement annuel à Upmynt Pro (80€) inclut pour une durée limitée un exemplaire de mon ouvrage "Boostez votre business avec l'IA" (éditions Vuibert).

Si vous êtes un abonné mensuel, basculez en annuel pour bénéficier de l'offre ! Une fois votre abonnement effectif, je reviendrai vers vous pour obtenir votre adresse postale.

📖
"Boostez votre Business avec l'IA" : le livre
👉 Toutes les bases pour découvrir les meilleurs usages et outils IA, maitriser ChatGPT, découvrir comment mobiliser Midjourney, Dall-e, Synthesia et bien d’autres.
👉 Un guide pratique pour métamorphoser votre stratégie marketing, augmenter votre force de frappe commerciale et simplifier votre gestion grâce à l'IA.
👉 Une ressource essentielle, accessible à tous, quel que soit votre niveau (débutant bienvenus !).

Et pour les abonnés existants ? (Upmynt Pro annuel)

Répondez à cet email en me transmettant simplement votre adresse postale et je vous ferai parvenir un exemplaire offert. C'est aussi simple que ça : votre confiance est récompensée 💜.

Vous avez déjà acheté le livre ?

Vous avez déjà acheté mon livre ? D'abord, merci pour votre confiance ! Une fois abonné à Upmynt Pro annuel, transférez-moi simplement le mail de confirmation d'achat du livre à sane@upmynt.com, ou (si l'ouvrage a été acheté à la Fnac ou libraire) un selfie avec l'ouvrage. Souriez ! 📸

J'aurai le plaisir de vous faire parvenir un bon d'achat Amazon de 20€ ou de procéder à un refund à hauteur de 20€ de votre abonnement Pro, selon votre préférence.

👔
Et pour les abonnés Upmynt Entreprise ?
Si vous êtes abonné à Upmynt via votre entreprise, seul le détenteur de l'abonnement Upmynt Entreprise peut réclamer son exemplaire.

Faut-il utiliser o1, le nouveau modèle proposé sur ChatGPT ?

OpenAI a soudainement lancé son nouveau modèle, baptisé "o1", et longtemps teasé sous le nom "Strawberry".

À la surprise générale, il ne s'agit pas d'un modèle dans la continuité des GPT (dont le dernier en date, GPT-4o) mais bien d'un tout nouveau type.

Résultat : il est loin d'être indiqué pour tous les usages, mais excelle pour certains. Je fais le point pour vous.

▹ Qu'est-ce que o1 et comment y accéder ?

o1 est un nouveau type de modèle IA qui serait capable de faire preuve de raisonnement, via une chaîne de pensée.

En clair, le modèle innoverait par son approche unique du raisonnement et de la résolution de problèmes, en s'inspirant de la façon dont nous, humains, réfléchissons.

Une version "preview" est d'ores et déjà accessible dans l'interface ChatGPT, uniquement pour les utilisateurs payants (GPT Plus, GPT Teams, GPT Enterprise).

Le modèle par défaut reste GPT-4o

⚠️ Attention, le modèle est restreint à 30 interactions par semaine, mais c’est déjà un bon début pour tester ses capacités et son potentiel.

La révolution de la chaîne de pensée

Le modèle o1 introduit donc le nouveau concept de "Chain of Thought" (chaîne de pensée).

Imaginez un instant que vous êtes face à une question complexe. Vous allez sûrement réfléchir longuement avant de répondre, en décomposant le problème en étapes plus simples. C’est exactement ce que fait o1.

⚙️ Grâce à un algorithme de renforcement à grande échelle, ce modèle apprend à affiner sa chaîne de pensée, à reconnaître et corriger ses erreurs, et à adapter sa stratégie lorsqu'il rencontre un obstacle.

Ainsi, la chaîne de pensée permettrait d'exceller dans des tâches exigeant une planification complexe ou une résolution de problèmes avancée. De quoi donner un sérieux coup de boost à toutes les applications de l'IA !

💡
Une chaîne de pensée bien mystérieuse…
Le plus fascinant, c'est que cette chaîne de pensée n'est pas vraiment visible pour l'utilisateur, si ce n'est quelques mentions vagues apparaissant de manière successive pendant le raisonnement de la bête.

C'est un choix délibéré d'OpenAI, qui cite l'expérience utilisateur, mais aussi la volonté de protéger cette innovation de la concurrence.

Effet collatéral de ce système : il faut le plus souvent attendre une quinzaine de secondes, si ce n'est plus, pour que la réponse s'affiche. Le temps pour la machine de tourner 7 fois sa langue dans sa bouche avant de répondre…

Un nouvel horizon pour l'IA

Alors que l'entraînement était de plus en plus coûteux et semblait atteindre un plafond de verre, OpenAI décide donc de booster le processus dit d'inférence, durant lequel le modèle est sollicité par l'utilisateur. C'est là que la chaine de pensée est mise en œuvre.

La chaine de pensée booste les capacités du modèle o1 pendant l'inférence

C'est très bien expliqué par Noam Brown (chercheur chez OpenAI) sur X :

« o1 est entraîné à "réfléchir" avant de répondre via une chaîne de pensée privée. Plus il réfléchit, mieux il s’en sort dans les tâches de raisonnement. Cela ouvre de nouvelles perspectives en terme de capacité. Nous ne sommes plus limités par l'entrainement du modèle. Nous pouvons désormais également booster l'inférence. »

Alors que précédemment, il fallait soi-même décomposer des requêtes complexes - via une chaine de prompts - pour que le modèle progresse dans la direction souhaitée, il est désormais possible de laisser la machine raisonner par elle-même.

Un objectif général ou vague suffit donc désormais au modèle pour proposer une réponse détaillée, étape par étape, et plus encore (on va le voir plus bas).

Bref, moins d'humain, plus de machine.

▹ Quel usage ?

Le modèle o1 n'est pas forcément indiqué pour tous les usages. OpenAI le reconnait volontiers et diffuse ce benchmark avec GPT-4o.

On constate que côté rédaction, o1 (dans sa version preview déjà disponible) est moins performant que GPT-4o.

C'est plutôt côté mathématiques et coding que o1 excelle très nettement : deux usages peu convaincants pour la majorité d'entre nous. D'ailleurs, OpenAI a fièrement partagé les performances remarquables de son nouveau modèle sur des tests mathématiques références. Mais à moins que vous vous amusiez à résoudre des problèmes de maths sur ChatGPT, ça vous en touche une sans faire bouger l'autre…

Reste donc l'analyse de données citée par OpenAI comme mieux gérée par o1, et qui est un domaine utile pour tout professionnel qui manie des données, par exemple de performance.

This post is for subscribers only

Subscribe now and have access to all our stories, enjoy exclusive content and stay up to date with constant updates.

S'abonner

Vous avez déjà un compte ? Se connecter

Partager sur Facebook Partager sur Linkedin Partager sur Twitter Envoyer par email

Passez à la vitesse IA

Abonnez-vous à la newsletter Upmynt et boostez vos activités professionnelles grâce à l'IA : dernières opportunités, meilleurs outils et conseils pratiques.

S'abonner