ChatGPT, AlphaCode : si les IA peuvent coder, peuvent-elles créer des IA ?
Publié le 3 janvier 2025Télécom SudParis
Des systèmes d’intelligence artificielle sont capables d’écrire des lignes de code et de contrôler un ordinateur. Qu’est-ce qui les empêche de créer d’autres IA ? Leur absence de volonté propre et leur incapacité à s’adapter dynamiquement. Explications par Julien Romero.
En bref :
Fin octobre 2024, Anthropic a dévoilé Computer-Use, un programme permettant à leur modèle d’intelligence artificielle Claude de contrôler un ordinateur comme un humain. Que se passerait-il si une IA pouvait également accéder à des ressources financières pour acquérir des machines supplémentaires et des services ? Cette hypothèse, bien qu’exagérée, soulève une question fascinante. Une IA pourrait-elle réellement devenir autonome et créer d’autres IA sans intervention humaine ?
Comme nous allons le voir, les grandes entreprises comme OpenAI, Facebook ou Google utilisent déjà des IA pour entraîner des IA de plus en plus complexes, et ce n’est un secret pour personne, pas même pour les IA.
Des IA entraînent des IA
Pour comprendre comment cela est possible, il nous faut revenir en arrière et expliquer ce qui a permis les récents progrès. Tout commence en 2017 quand une équipe de chercheurs chez Google publie un article scientifique : « Attention is all you need » (L’attention est tout ce dont vous avez besoin). Dans cette publication, les chercheurs introduisaient une nouvelle architecture neuronale appelée « Transformers » qui apprend à quels mots faire « attention » pour pouvoir générer le mot suivant. Cette architecture Transformers structure désormais tous les réseaux de neurones des IA modernes générant du texte.
L’apparition des Transformers a conduit OpenAI à lancer en 2018 la première version de GPT pour générer du texte. Bien que les principes fondamentaux aient peu évolué depuis, l’échelle et l’ambition des « grands modèles de langage » (ou large langage models, LLM en anglais) ont explosé.
Lire l’intégralité de l’article sur le blog I’MTech de l’Institut Mines-Télécom.