
Après le « NFT » en 2020/21, le « métavers » en 2021/22, « ChatGPT » pourrait sans aucun doute être considéré comme le « mot-clé de l'année 2022/23 ». Acclamé ou décrié, il est vivement débattu à la télévision, sur les réseaux sociaux et au sein des entreprises. S'agit-il de l'émergence d'une technologie révolutionnaire, au même titre que l'avènement des microprocesseurs, comme le souligne Bill Gates, ou simplement de « la popularisation d'une technologie déjà existante », comme l'affirme Yann LeCun, directeur scientifique de l'IA chez Facebook ?
La réponse se situe probablement entre les deux. Oui, ChatGPT apporte de nombreuses avancées en matière de traitement du langage humain. Utilisé habilement, il peut améliorer significativement les performances de certains modèles d'IA, auparavant à la pointe de la technologie. Mais derrière ChatGPT se cachent des modèles de langage connus depuis plusieurs années, déjà largement utilisés et exploités par les experts en IA, notamment chez eleven, où ils ont été mis en œuvre pour plus d'une douzaine de projets pour des acteurs industriels et des start-ups.
ChatGPT, le chatbot développé par OpenAI, est une application d'une technologie en plein essor depuis 2018 : les LLM, ou Modèles d'apprentissage du langage. Parfois également appelés « modèles fondamentaux », ils sont le cœur de la compréhension du langage humain par les machines. Pour ce faire, ils s'appuient sur une architecture complexe de réseaux neuronaux et des centaines de milliards de paramètres à ajuster de manière itérative. Le principe est simple : pour une phrase d'exemple donnée, prédire le mot suivant.
L'IA détermine ainsi le sens d'un mot en tenant compte des contextes dans lesquels elle l'a rencontré. L'entraînement d'un modèle avec autant de paramètres nécessite une grande quantité de données, généralement issues de données accessibles au public telles que Wikipédia (3 % du corpus d'entraînement), des articles de presse, des livres en libre accès, etc. À titre d'exemple, GPT-3 (Generative Pre-trained Transformers-3), composé de 175 milliards de paramètres, a nécessité l'ingestion de près de 570 Go de données, soit environ 300 milliards de mots. Ces chiffres pharaoniques sont synonymes de coûts financiers considérables : on parle de 4,6 millions de dollars dépensés pour l'entraînement de GPT-3, sans parler de l'impact écologique qui en découle.
Figure 1 : Évolution du nombre de paramètres utilisés par les modèles LLM depuis 2018 (4).

Il en résulte des modèles d'IA très puissants, capables de comprendre toute la sémantique de chaque langue sur laquelle ils ont été entraînés, leur permettant de réaliser de nombreux cas d'usage : traduction de texte, rédaction d'essais, etc. Plus largement, ils peuvent être spécialisés, c'est-à-dire adaptés à un cas d'usage, leur offrant un large éventail de tâches possibles, à l'image de ChatGPT.
ChatGPT est un chatbot basé sur GPT-3 capable d'émuler l'expérience humaine d'une conversation réelle. Treize mille paires de questions/réponses ont été utilisées pour transformer un modèle de « prédiction du mot suivant » en un modèle capable de répondre à des questions. En parallèle, un modèle de récompense – l'apprentissage par renforcement – aide ChatGPT à s'orienter vers la production de réponses attendues par un humain. Cette dernière étape, au cours de laquelle des humains classent différentes réponses possibles à la même question, permet la modération de certains contenus considérés comme illégaux ou dangereux.
Malgré ses performances remarquables, ChatGPT souffre à ce jour de sévères limitations éthiques et techniques.
D'un point de vue éthique, la technologie est confrontée à un certain nombre de problèmes importants, liés à son fonctionnement et à son processus d'entraînement.
Les LLM basés sur des données ouvertes et disponibles en open source, tels qu'Alpaca, développé par Stanford, se heurtent aux limites de la confidentialité et de la propriété intellectuelle, mais sont moins performants et restent sujets aux biais et aux contenus préjudiciables.
ChatGPT fournit une réponse plausible, ce qui est le moins qu'on puisse dire, étant donné tous les contextes qu'il a rencontrés lors de son entraînement. Il est donc étranger au concept de vérité. De ce point clé découlent plusieurs limitations techniques :
Plusieurs options existent pour contourner ces limitations techniques : utiliser des frameworks pour sourcer l'information et rechercher des sources externes (comme LangChain), utiliser GPT-4 (la version payante la plus récente et plus puissante d'OpenAI), ou spécialiser ChatGPT à des cas d'usage spécifiques.
Heureusement, il ne s'agit pas principalement d'entraîner un modèle linguistique à partir de zéro, mais de tirer parti de son apprentissage linguistique pour lui faire effectuer des tâches spécifiques. C'est ce qu'on appelle le « Transfer Learning », lorsqu'un modèle pré-entraîné est ajusté à un cas d'usage spécifique, une étape qui est significativement moins énergivore.
ChatGPT est une technologie utile et prometteuse, qui pourrait être utilisée dans de nombreux domaines à l'avenir. Chez eleven, nous constatons un intérêt de la part de différentes professions qui correspond à la couverture médiatique du sujet, et nous leur parlons de nombreuses applications :
Plus généralement, les modèles de langage peuvent être mis à profit pour de nombreuses tâches, de l'automatisation des processus aux tâches humaines complexes, telles que l'analyse de données et le traitement de documents.
Les projets qu'eleven a accompagnés ont cependant mis en évidence certains prérequis pour une utilisation efficace de la technologie :
En suivant ces préconisations, nous avons amélioré la performance d'extraction d'informations clés du plan local de développement de 13% avec une méthode Plug & Play, à 55% avec une bonne présélection du corpus et de l'ingénierie de prompts. À noter que la meilleure performance obtenue sans modèles de langage est de 26% pour un tel sujet, soit deux fois mieux que GPT sans ajustements, et deux fois moins bien que GPT avec accompagnement.
Eleven accompagne les entreprises dans l'expérimentation, le développement et l'intégration de ces outils pour des cas d'usage concrets. Avec une approche stratégique, des attentes réalistes, et surtout une compréhension claire de son fonctionnement et de ses limites, les entreprises peuvent réellement tirer parti de la technologie derrière ChatGPT.
(1) https://www.independent.co.uk/tech/harvard-chatbot-teacher-computer-science-b2363114.html
(2) https://fr.wikipedia.org/wiki/GPT-3
(3) https://arxiv.org/pdf/2302.04023.pdf
(4) https://huggingface.co/blog/large-language-models