Les grands modèles de langage: moyens ou objets?

Le LLM comme moyen

La mise en forme

La facilité d'accès

Le partenaire de conversation

Le LLM comme objet

Une approche formaliste

Une approche auctoriale

Une approche critique

Une approche de la réception

Pistes de conclusion

Les grands modèles de langage: moyens ou objets?

Pierre Depaz (NYU Berlin) - 26.11.2024


Google Smart Reply est une des premières applications grand public d'un modèle d'IA générative
Google Smart Reply est une des premières applications grand public d'un modèle d'IA générative


The digital humanities try to take account of the plasticity of digital forms and the way in which they point toward a new way of working with representation and mediation, what might be called the digital ‘folding’ of reality, whereby one is able to approach culture in a radically new way. 1


Quelles places peuvent prendre les grands modèles de langage dans les sciences humaines?

Quelles sont les implications de les envisager comme un moyen de la recherche? Comme un objet de la recherche?


  1. Le LLM comme moyen de recherche
  2. Le LLM comme objet de recherche
  3. Pistes d'épistémologie critique

Le LLM comme moyen


Toute technologie est une extension de l'humain 2 , et est un pharmakôn 3 .


Toute technologie computationnelle est une mnémotechnique, et nos interactions avec elles résultent en des assemblages cognitifs. 4 5


Le grand modèle de langage comme traversée d'espaces syntactiques.


La mise en forme


Étude de cas: le secrétariat de rédaction et la pose de style.


Deux parties, deux sous-parties comme horizon d'attente de lecture.

Manuel de culture générale pour les concours des grandes écoles
Manuel de culture générale pour les concours des grandes écoles


Voilà donc un supplice, et un emploi du temps. Ils ne sanctionnent pas les mêmes crimes, ils ne punissent pas le même genre de délinquants. Mais ils définissent bien, chacun, un certain style pénal. Moins d'un siècle les séparent. 6


La forme et le contenu ne sont pas disjoints.


La facilité d'accès


Etude de cas: La recherche en ondes gravitationnelles 7

La baisse des coûts d'opportunité.


Étude de cas:: Détection des motifs de langages dans des grands corpus (détection et contextualisation) 8 .


Étude de cas: Interagir avec des stéréotypes dans une étude de psychologie 10


De la baisse des coûts d'opportunité:


Le partenaire de conversation


Discuter et raisonner avec un LLM. 13


Étude de cas: Programmer avec un LLM.

La programmation assistée par canard en plastique (source: boredpanda.com)
La programmation assistée par canard en plastique (source: boredpanda.com)


Implications de la programmation assistée par LLM 14 :


"Les grands modèles de langage sont la preuve que lire rend intelligent, et nous les utilisons pour arrêter de lire." 15


Un grand modèle de langage est-il une bibliothèque, ou une bibliothécaire? 16


Le LLM comme objet


Analyser du langage naturel par des méthodes de sciences informatiques,

ou analyser du langage machine par des méthodes de sciences humaines.


L'interprétation des textes numériques est au coeur des software studies, l'étude du logiciel comme artefact culturel 17 18 .


One thing that foreigners, computers and poets have in common is that they make unexpected linguistic associations 19 .


Une approche formaliste


L'étude de textes des LLMs peut impliquer des théories de l'épistolaire, des analyses du registre formel, ou encore des approches comparatives, dans une optique d'extension du domaine de la littérature 20 .


La tendance de Google AI à vouloir comparer (@samhenrigold)
La tendance de Google AI à vouloir comparer (@samhenrigold)


So, it seems that at minimum, ChatGPT is a soft bullshitter: if we take it not to have intentions, there isn’t any attempt to mislead about the attitude towards truth, but it is nonetheless engaged in the business of outputting utterances that look as if they’re truth-apt 21 .


Une approche auctoriale


La figure de l'auteur peut-être reconsidérée comme une chaîne d'écritures 22 , dont il faut aussi déterminer le but.


Quelles sont les chaînes d'écriture des LLMs 23 ?


Étude de cas: Les examens scolaires comme preuve de l'intelligence. 25


Une approche critique


Mettre à jour ce qui est lisible par les LLMs, et ce qui ne l'est pas.


Étude de cas: Tracer la conception de la "toxicité" le long de ces chaînes d'écriture comme exemple de critical code studies 26 27 .


Le logiciel est un langage exécutable qui réifie des idées, et ainsi incarne une sorte d'idéologie 28 29 .


Une approche de la réception


La dynamique et les conditions d'assignation de sens sont encore à élucider.

Il semble y a voir une corrélation entre anthropomorphisation et déshumanisation 30 .


Si il y a anthropomorphisation, quel est ce nouveau personnage?


L'application des théories littéraires peuvent être fructueuses pour nous aider à comprendre ce que sont vraiment ces nouveaux écrits, ces nouvelles manières d'écrire, et ces nouvelles manières de lire.


Pistes de conclusion


La question de la littératie socio-technique. 31


La question de la rigueur du processus de recherche. 32


La question de la justice épistémologique.


Il est difficile de quantifier exactement l'empreinte carbone du cycle de vie d'un LLM mais il est clair qu'elle augmente relative aux techniques précédentes.


Les sciences du texte sont peuvent traiter ces grands modèles de langage comme objets d'études et comme moyens d'études.