▹ News : GPT-5 en retard.
▹ Deep Dive : Les trophées Upmynt 2024 couronnent le meilleur de l'IA.
▹ Pépites : Zoom sur les Google AI Glasses, le futur de l'IA.
Salut à tous,
Qui était déjà là pour les trophées Upmynt 2023 ?! Seuls les anciens savent ;)
Cette dernière édition de l'année me permet donc de distribuer les bons et les mauvais points avec les grands gagnants de l'année mais aussi les plus grosses déceptions.
C'est mon parti-pris depuis l'inception d'Upmynt : partager avec vous ce qui fonctionne et ne pas hésiter à pointer du doigt ce qui est bancal ou qui relève des fausses promesses.
Ça ne changera pas en 2025. D'ici là, joyeuses fêtes !
Sane de Upmynt 💜
PS : Après une petite pause bien méritée, je vous retrouve le lundi 6 janvier pour une rentrée sur les chapeaux de roue !
⏰ GPT-5 en retard. OpenAI serait notamment en manque de données qualitatives, nécessaire à l'entraînement de la bête, révèle le WSJ.
Résultat : l'entreprise créé elle-même de la donnée "from scratch", ce qui rallonge le processus de développement.
« Selon Altman, l'entraînement de GPT-4 a coûté plus de $100M. Les futurs modèles IA devraient coûter plus d'un milliard de dollars. Un échec d'entraînement est comparable à l'explosion d'une fusée spatiale dans le ciel peu après son lancement. »
Je recommande la lecture de cette enquête du WSJ qui est véritablement riche en enseignements sur les défis actuels rencontrés par l'industrie IA.
📲 ChatGPT dans Whatsapp. Vous pouvez désormais discuter avec ChatGPT depuis Whatsapp. L'interface est bien plus limitée que sur l'app native, mais si cela peut vous dépanner, alors ajoutez +1 800 242 8478 à vos contacts.
Après l'intégration à iOS, cette nouvelle initiative confirme la volonté d'OpenAI de rendre ChatGPT accessible au plus grand nombre.
🎬 Générateur vidéo. Kling s'améliore, avec la version 1.6 de so modèle. On nous promet en particulier une meilleure adhérence au prompt et des animations plus crédibleds. Le générateur, d'origine chinoise, reste l'un des meilleurs rapports qualité prix à ce jour.
🧠 Raisonnement avancé. OpenAI révèle le modèle successeur à o1, baptisé… o3 (parce que o2 était déjà pris).
- Amélioration du raisonnement : o3 consacre davantage de temps à l'analyse des requêtes, améliorant ainsi sa capacité à résoudre des problèmes complexes nécessitant un raisonnement logique étape par étape.
- Performances accrues : Le modèle surpasse o1 sur plusieurs benchmarks, notamment en codage avancé, mathématiques et sciences. Par exemple, il a obtenu un score de 87,5% sur le benchmark ARC AGI, dépassant la moyenne humaine de 85%.
Actuellement en phase de test interne, il devrait être lancé publiquement dès début 2025. Qui pourra arrêter OpenAI ?
Les trophées Upmynt 2024
Il est venu le temps de couronner les plus grosses réussites 2024 sur le front IA… mais aussi les plus grosses déceptions.
▹ Meilleur innovateur IA en 2024
- Gagnant 🏆 Google
Plutôt discret tout au long de l'année, (si ce n'est une polémique en février sur leur modèle image devenu trop "woke"), le géant a réalisé un 4e trimestre tonitruant, qui justifie à lui seul son statut de gagnant, sur le fil du rasoir face à OpenAI.
Cette percée est largement couverte dans la dernière édition d'Upmynt (#183) : Bien joué, Google.
Ce qui fait la force de Google, c'est d'avoir enfin compris qu'au-delà de la puissance des modèles, ce sont les produits effectivement disponibles qui comptent vraiment. Avec NotebookLM, Whisk et plus largement le Google AI Studio, Google a mis dans les mains du grand public des outils innovants, surprenants, et accessibles.
Côté LLM, Gemini 2.0 (version flash) est d'ores et déjà accessible gratuitement depuis l'assistant Gemini.
Ce qui est frappant, c'est la capacité de Google a être présent sur TOUS les fronts de manière ultra compétitive : LLM (Gemini 2), image (Imagen 3), vidéo (Veo 2), Agent (Project mariner)…
À suivre en 2025 : l'intégration de Gemini à la suite Google Drive, en espérant une exécution plus convaincante que celle de Copilot sur Office… (cf plus bas)
- Plus grosse déception 👎 Apple
J'attendais avec impatience l'incursion d'Apple sur le front IA. L'entreprise était très en retard, alors il fallait compenser avec des fonctionnalités étonnantes.
Non seulement Apple Intelligence ne propose rien de très nouveau d'un point de vue tech, mais l'udpate est en plus toujours inaccessible en Europe.
Tout juste peut-on saluer une interface léchée et claire, mais c'était bien le minimum à espérer.
Comme un aveu d'échec, Apple a même dû intégrer ChatGPT, sur lequel Siri se défausse lorsque la question de l'utilisateur dépasse ses capacités (limitées).
Les utilisateurs eux-mêmes ne s'y sont pas trompés : 73% ont ainsi déclaré voir peu ou pas du tout de valeur dans le système.
- À suivre en 2025 👀 Mistral
Plus qu'un choix basé sur les faits, il s'agit ici d'un espoir. Celui que l'Europe puisse être le berceau de nouvelles innovations côté IA. Il y a peu de candidats à ce titre, mais le Français Mistral reste probablement le mieux placé.
Le mois dernier, "Le Chat", a connu une refonte salutaire, qui le remet sur la carte des assistants IA, avec de nombreuses fonctionnalités pratiques (canevas, search, génération d'images), le tout accessible gratuitement.
Il manque encore au Chat une personnalité plus engageante, une interface plus intuitive et la sacro-sainte navigation web. Et pourquoi pas de nouvelles fonctionnalités encore jamais vues chez la concurrence ?
En juin dernier, la société dirigée par Arthur Mensch a bouclé un nouveau tour de table de 600M€… Une telle somme doit pouvoir permettre à l'entreprise de nous étonner. À suivre…
▹ Meilleur assistant IA
- Gagnant 🏆 ChatGPT
Sur presque tous les fronts, ChatGPT est et reste le meilleur assistant IA.
D'un point de vue technologique, il est constamment propulsé par les meilleurs modèles IA disponibles. Tout au long de l'année, un coup d'œil aux benchmarks de LLM comme Artificial Analysis renvoie un modèle d'OpenAI en tête du classement (voire 2 d'entre eux sur le podium).
Au niveau fonctionnalités, ChatGPT reste l'un des plus intuitifs, et le seul à proposer une telle richesse de features, en tête desquels la mémorisation des infos cruciales à votre sujet (tout en vous laissent le contrôle), le mode collaboratif Canvas, les apps smartphone et desktop, le mode voix avancé, l'analyse avancée de données, et depuis peu, la possibilité d'organiser ses convos par projet.
Quel assistant peut en dire autant ?
- Plus grosse déception 👎 Copilot
Copilot est probablement le succès IA le plus incompréhensible à mes yeux.
Bien qu'il tourne théoriquement sur la même tech que ChatGPT (et notamment sur le modèle GPT-4o), sa performance semble régulièrement inférieure.
Mais surtout, l'interface de Copilot est un cauchemar, les fonctionnalités apparaissent puis disparaissent (comme la commande vocale) sans aucune raison, les réponses sont souvent lentes, et de nombreuses fonctionnalités manquent (comme la mémoire, l'analyse de données) ou sont difficiles d'accès (historique des convos).
Quant à Copilot 365, à savoir l'intégration de l'assistant aux logiciels de la suite Office, c'est un exemple flagrant d'intégration exécutée à la va-vite, dont l'usage est pour l'essentiel anecdotique, voire bourré de bugs. Une immense déception.
- À suivre en 2025 👀 Meta AI
Meta AI fait enfin son arrivée en Europe à travers les lunettes Ray-Ban, à partir desquelles il est possible d'interpeler l'IA à tout moment.
Meta AI, c'est aussi un assistant classique accessible depuis les apps Whatsapp, Messenger et Insta. Pour l'instant bloqué en Europe, sa disponibilité est attendue en 2025.
Aux US, Meta AI talonne déjà de peu ChatGPT en terme d'usage. Pourrait-il devancer le roi en 2025 ? À suivre…