Borges et l'intelligence artificielle

MSN - 19/12
Une approche légèrement différente de la nature des modèles linguistiques – et de ce qu’ils signifient pour nous. Un article d'invité.

Bien avant les dilemmes actuels sur les ambitions et les hallucinations de l’intelligence artificielle, un style littéraire qui mêlait réalisme magique, réalité et fiction pour donner vie à de nouveaux mondes. Le travail de l’auteur Jorge Luis Borges était en avance de plusieurs décennies sur l’ère des grands modèles linguistiques (LLM). Ses histoires visuellement puissantes et complexes sont fermement ancrées dans notre héritage culturel. Ils créent des mondes dans lesquels le fonctionnement interne du langage et sa relation avec la réalité sont mis en lumière. L’imagerie mentale de Borges peut aider à comprendre la nature des modèles linguistiques et leur importance pour l’intelligence artificielle.

Les grands modèles linguistiques absorbent d’énormes quantités de connaissances culturelles humaines et les représentent avec une dextérité qui, pour beaucoup, y compris les modèles eux-mêmes, inaugure l’ère de l’intelligence artificielle. Leurs capacités suscitent des émotions contradictoires telles que l’admiration, la peur et l’avidité. Cette confusion vient de notre ignorance de la nature de ces systèmes et de leur impact sur l’humanité.

Il ne s'agit pas seulement d'absorber des faits, des chiffres, du jargon ou des équations mathématiques. Les humains ont besoin d’une imagerie mentale qui explique ces processus complexes par des analogies, en s’appuyant sur les connaissances et les expériences humaines pour comprendre le phénomène et acquérir la capacité de l’utiliser de manière rentable pour notre bénéfice – ou celui de tous.

Les débats sur l’IA sont souvent dominés par l’imagerie de la science-fiction. Nous pensons que la fiction de Borges fournit des images plus convaincantes et éclaire la relation entre les modèles de langage et l'IA.

PARTIE I : Sur les grands modèles de langage

« Fang, disons, a un secret. Un inconnu frappe à sa porte. Fang décide de le tuer. Bien sûr, il y a plusieurs résultats possibles : Fang peut tuer l'intrus, l'intrus peut tuer Fang, les deux peuvent survivre, les deux peuvent mourir, et ainsi de suite. Dans l’œuvre de Ts’ui Pên, toutes les sorties se produisent ; chacun est un point de départ pour d’autres fourches. Parfois les chemins de ce labyrinthe convergent : par exemple, vous arrivez à cette maison ; dans un passé possible, tu es mon ennemi, mais dans un autre tu es mon ami. » (« Le Jardin aux sentiers qui bifurquent », 1941)

Imaginons une collection qui contienne non seulement tous les textes écrits par des humains, mais inclut également tous les textes qu'un humain pourrait lire et comprendre au moins superficiellement - bien au-delà de ce qui a déjà été écrit. Cette collection infinie de textes plausibles peut inclure des livres, des dialogues, des articles, des prières, des sites Web et des programmes informatiques, dans n'importe quelle langue et sous n'importe quelle forme. Nous écrivons quelques premiers mots d’un texte sur une longue feuille de papier. Une machine scanne la bande de papier, sélectionne au hasard une occurrence de cette séquence de mots dans notre collection infinie, lit le mot suivant et l'imprime sur la bande. En répétant ce processus, de plus en plus de mots sont ajoutés au volume. Chaque séquence de mots imprimée sur la bande se retrouve dans notre collection infinie de textes plausibles et forme ainsi une continuation possible de notre séquence de mots originale. Nous appelons cela un modèle de langage parfait, dans la tradition de Claude Shannon, qui a introduit la modélisation statistique ...
[Courte citation de 8% de l'article original]

Loading...