GPT-4

Informations
Développé par	OpenAI
Première version	14 mars 2023
Écrit en	Python
Type	Grand modèle de langage Modèle d'intelligence artificielle (d) Transformateur génératif pré-formé
Licence	Licence propriétaire
Site web	openai.com/gpt-4

Chronologie des versions

GPT-3

modifier - modifier le code - voir Wikidata (aide)

GPT-4 (acronyme de Generative Pre-trained Transformer 4) est un modèle de langage multimodalmultimodal, de type transformeur génératif pré-entraîné, développé par la société OpenAI et sorti le 14 mars 2023. Il succède à GPT-3^[1].

Caractéristiques

OpenAI annonce, sur son blog, GPT-4 comme étant « plus fiable, créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5 »^[2]. L'organisation a produit deux versions de GPT-4 avec des fenêtres contextuelles de 8 192 et 32 768 jetons, une amélioration significative par rapport à GPT-3.5 et GPT-3, qui étaient limités à 4 096 et 2 048 jetons respectivement^[3]. Contrairement à son prédécesseur, GPT-4 peut prendre des images ainsi que du texte comme entrées.

OpenAI adopte une approche fermée en ce qui concerne les détails techniques de GPT-4 ; le rapport technique s'est explicitement abstenu de spécifier la taille, l'architecture, le matériel ou la méthode de formation du modèle. Le rapport affirme que « le paysage concurrentiel et les implications sur la sécurité des modèles à grande échelle » sont des facteurs qui ont influencé cette décision. Le nombre précis de paramètres de GPT-4 reste inconnu, mais The Verge cite des rumeurs selon lesquelles GPT-4 augmenterait considérablement le nombre de paramètres de GPT-3 de 175 milliards à 100 000 milliards. Le PDG d'OpenAI, Sam Altman, qualifie ces rumeurs de « conneries complètes ». Un nombre plus fréquemment avancé est celui de 1000 milliards de paramètres^[4]^,^[5].

Les représentants américains Don Beyer et Ted Lieu ont confirmé au New York Times qu'Altman s'était rendu au Congrès des États-Unis en janvier 2023 pour faire la démonstration du GPT-4 et de ses "contrôles de sécurité" améliorés par rapport aux autres modèles d'IA.

Limites

Aussi, même si cette version est améliorée par rapport à son prédécesseur, GPT-4 peut halluciner^[6] et présenter des biais^[7].

Applications

ChatGPT Plus

GPT-4 est accessible via une application web appelée ChatGPT Plus, version payante, plus rapide et améliorée de l'application gratuite ChatGPT.

Des modules complémentaires sont développés par des tiers pour étendre les fonctionnalités de ChatGPT Plus et connecter le robot à leurs propres services.
Open AI développe également ses propres modules d'extensions (plugin) dont un « Interprète (informatique) » dit Advanced data analysis (précédemment appelé Code interpreter)^[8]. Un outil permettant au robot de traiter des fichiers en exécutant lui-même du code Python, ce qui permet à l'utilisateur de réaliser des traitements de données et des cartes ou graphiques en langage naturel, comme s'il avait accès à la programmation, mais sans savoir coder (grâce au code Python qui sera généré et exécuté par ChatGPT)^[9]. Ce module permet d'envoyer des fichiers afin d'étayer des prompts, et il améliore les capacités de résolution de problèmes en mathématiques, physique et chimie^[10] et il permet d'utiliser ChatGPT pour finement décrire une image, transformer une image en vidéo^{[réf. nécessaire]}, créer des images, des cartes, extraire la palette de couleur d'une image, créer des documents Word ou PowerPoint^{[réf. nécessaire]}, faire de la data visualisation, des simulations, etc. et après réponse de l'IA, dans le champ conversationnel, un bouton dédié permet d'obtenir le détail de la procédure utilisée^[9].

À partir du 6 juillet 2023, il permet à ChatGPT d'éventuellement accéder aux fichiers téléchargés par l'utilisateur abonné, et — à la demande — de les modifier, d'en analyser des données, de créer des calculs et/ou des graphiques, etc. (avec une taille limite de 2 Mo pour les fichiers), l'IA pouvant écrire du code en Python et manipuler des fichiers jusqu’à 100 Mo^[11]. Une faille de sécurité a été découverte dans Code Interpreter (testée et confirmé en novembre 2023)^[12].

Bing

En février 2023, Microsoft dote son moteur de recherche Bing d'un agent conversationnel reposant sur la technologie GPT-4. Cet agent répond aux questions de l'utilisateur en effectuant des recherches web. Contrairement à l'application d'Open AI, il cite ses sources, ce qui permet à l'utilisateur de les consulter lui-même^[13].

Réception

Pour le New York Times, GPT-4 est plus précis que GPT-3.5, il est capable de résumer et de commenter des images ainsi que des textes compliqués. Le journal affirme également qu'il a réussi un examen du barreau et plusieurs tests standardisés, mais qu'il montre cependant une tendance à halluciner dans certaines de ses réponses^[14].

Critiques

Selon Patronus AI, GPT-4 est le LLM avec le plus haut taux de violation du droit d'auteur^[15]. En mai 2023, Numerama rapporte déjà qu'Open AI, sur la base d'une étude de chercheurs de Berkeley, avait entrainé ses modèles sur un nombre important de livres : « Nous avons découvert que les modèles d’OpenAI ont mémorisé une vaste collection de matériaux protégés par le droit d’auteur et que le degré de mémorisation est lié à la fréquence à laquelle des extraits de ces livres apparaissent sur le web »^[16].

Notes et références

↑ Thomas Coëffé, « OpenAI dévoile GPT-4 : tout savoir sur le nouveau modèle d’IA multimodale », sur BDM, 14 mars 2023 (consulté le 15 mars 2023)
↑ Wiggers, « OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art » [archive du 15 mars 2023], TechCrunch, 14 mars 2023 (consulté le 15 mars 2023)
↑ (en) « OpenAI API », platform.openai.com (consulté le 16 mars 2023)
↑ (en) « GPT-4 has more than a trillion parameters », sur The decoder, 25 mars 2023 (consulté le 17 novembre 2023).
↑ (en) Reed Albergotti, « The secret history of Elon Musk, Sam Altman, and OpenAI / Semafor », sur semafor.com, 23 mars 2023 (consulté le 17 novembre 2023).
↑ « Avec GPT-4, OpenAI prend le large sur les IA génératives », sur Le Monde Informatique, 15 mars 2023 (consulté le 9 juillet 2023)
↑ « OpenAI annonce la disponibilité de GPT-4, nouvelle version de son modèle de langage », sur L'Usine Digitale, 15 mars 2023 (consulté le 9 juillet 2023)
↑ (en-US) « ChatGPT plugins », sur openai.com (consulté le 9 octobre 2023).
↑ ^{a et b} Maximilien Herr, « ChatGPT intègre désormais Code Interpreter, qu'est-ce que c'est, comment ça marche, et comment l'utiliser ? », sur Clubic.com, 10 août 2023 (consulté le 9 octobre 2023).
↑ (en) Hugo G. Lapierre et Patrick Charland, « ChatGPT, allié ou adversaire pour l’enseignement des sciences et des mathématiques ? », sur The Conversation, 31 août 2023 (consulté le 9 octobre 2023).
↑ Matthieu Eugène, « ChatGPT : 10 exemples pour découvrir le plugin Code Interpreter », sur BDM, 10 juillet 2023 (consulté le 17 novembre 2023).
↑ Magloire B, « ChatGPT : N’utilisez pas le Code Interpreter ! Ce bug permet aux hackers de… », sur lebigdata.fr, 17 novembre 2023 (consulté le 17 novembre 2023).
↑ « Avec Fabric, Microsoft veut unifier et simplifier l'analyse de données - Le Monde Informatique », sur LeMondeInformatique, 25 mai 2023 (consulté le 3 juin 2023)
↑ (en-US) Cade Metz, « 10 Ways GPT-4 Is Impressive but Still Flawed », The New York Times,‎ 14 mars 2023 (lire en ligne [archive du 14 mars 2023], consulté le 14 mars 2023)
↑ « GPT-4 est le LLM avec le plus haut taux de violation du droit d'auteur », sur ZDNet, 7 mars 2024 (consulté le 9 mars 2024)
↑ « OpenAI a instruit ChatGPT sans se soucier du droit d’auteur », sur Numerama, 3 mai 2023 (consulté le 9 mars 2024)