Une intelligence artificielle libre est-elle possible ? - LinuxFr.org

Liorel - LinuxFr - 26/02
Une intelligence artificielle libre est-elle possible ?

Ces derniers temps, on a beaucoup parlé d’intelligence artificielle sur LinuxFr.org. D’IA propriétaires, et d’IA libres. Mais peut-on vraiment faire une IA libre ? La notion n’est pas sans poser quelques difficultés. Une (pas si) courte discussion du problème.

Sommaire

  • On appellera IA un réseau de neurones artificiels
  • Pour comprendre le réseau de neurones, il est nécessaire de disposer de bases statistiques
    • Les statistiques reposent sur la modélisation
      • Un exemple : la régression linéaire
  • Le réseau de neurones
    • Le neurone naturel
    • Le neurone formel
    • La mise en réseau
    • Le réseau de neurones est Turing-complet
    • Le réseau de neurones présente un effet boîte noire important
    • Le réseau de neurones est un modèle statistique
      • Tous les modèles sont faux, certains sont utiles, et c’est vrai aussi pour le réseau de neurones
  • Le but du logiciel libre est de rendre le pouvoir à l’utilisateur
    • La première des libertés est celle de savoir ce que je fais
    • Si je sais ce que je fais, je dois pouvoir modifier ce que je fais
  • Le réseau de neurones est difficilement compatible avec le libre
    • Personne ne sait vraiment ce que fait un réseau de neurones
    • Disposer de la description complète d’un réseau de neurones ne permet pas de l’améliorer
    • La définition du code source d’un réseau de neurones est ambiguë
    • Cette ambiguïté fait courir un risque juridique sous certaines licences libres
      • Comment les boîtes qui font de l’IA non libre résolvent-elles ce dilemme ? Elles ne le résolvent pas
    • La définition d’une IA open source ressemble furieusement à un constat d’échec
  • Conclusion : qu’attendre d’une IA libre ?

On appellera IA un réseau de neurones artificiels

Commençons par définir notre objet d’étude : qu’est-ce qu’une IA ? Par « intelligence artificielle », on pourrait entendre tout dispositif capable de faire réaliser par un ordinateur une opération réputée requérir une tâche cognitive. Dans cette acception, un système expert qui prend des décisions médicales en implémentant les recommandations d’une société savante est une IA. Le pilote automatique d’un avion de ligne est une IA.

Cependant, ce n’est pas la définition la plus couramment employée ces derniers temps. Une IA a battu Lee Sedol au go, mais ça fait des années que des ordinateurs battent les humains aux échecs et personne ne prétend que c’est une IA. Des IA sont employées pour reconnaître des images alors que reconnaître un chien nous semble absolument élémentaire, mais l’algorithme de Youtube qui te suggère des vidéos pouvant te plaire parmi les milliards hébergées fait preuve d’une certaine intelligence et personne ne l’appelle IA. Il semble donc que le terme « IA » s’applique donc à une technique pour effectuer une tâche plus qu’à la tâche en elle-même, ou plutôt à un ensemble de techniques partageant un point commun : le réseau de neurones artificiels.

Dans la suite de cette dépêche, j’utiliserai donc indifféremment les termes d’IA et de réseau de neurones1.

Pour comprendre le réseau de neurones, il est nécessaire de disposer de bases statistiques

Les statistiques (ou la statistique, on peut dire les deux, comme en Alexandrie), c’est la branche des mathématiques qui s’intéresse aux moyens, à partir de données observées et fondamentalement probabilistes, d’en tirer des conclusions généralisables (et idéalement, de prédire l’avenir à partir du passé).

La data science, c’est la branche de l’informatique qui s’intéresse aux moyens, à partir de données emmagasinées sur lesquelles on ne fait pas d’hypothèse de mode de génération, d’en tirer des conclusions généralisables (et idéalement, de prédire les données futures).

Ça vous semble similaire ? Ça l’est. Les deux champs vont avoir des divergences de vocabulaire, de langages (les stateux préfèreront R, les data scientists Python), de formation (les stateux sont plutôt des universitaires, les data scientists plutôt des informaticiens au niveau licence, mais ils ont les mêmes masters et doctorats), mais fondamentalement, et surtout mathématiquement, c’est la même chose. Les connaissances en inférence statistique (notamment bayésienne, pour ceux à qui ça parle) se généralisent très bien à la data science.

Pour faire court, un statisticien est un data scientist qui se la pète, alors qu’un data scientist est un informaticien qui, n’étant pas assez bon pour survivre à la rude concurrence universitaire, a multiplié son salaire par 10 ou 20 en allant vendre ses compétences statistiques à Facebook.

Les statistiques reposent sur la modélisation

En statistique, la manière la plus courante de répondre à une question est de construire un modèle. Prenons une question simple : je dispose d’un...
[Courte citation de 8% de l'article original]

Loading...