CNN : du point de vue d'un débutant

DEV - 12/11
J'ai appris ce sujet environ 20 fois maintenant, certains sont un peu déroutants, et bien sûr, j'en connais quelques-uns de base...

J'ai appris ce sujet une vingtaine de fois maintenant, certains sont un peu déroutants et bien sûr, je connais certaines choses essentielles. Dans cet article, je vais décomposer CNN pour faciliter la compréhension des bases et peut-être du CNN avancé.

D'accord, de votre point de vue, comment reconnaissez-vous le visage de votre ami dans une pièce bondée ?

Genre, vraiment, que se passe-t-il dans votre cerveau ? Vous ne calculez pas les valeurs de pixels ni ne comparez les vecteurs de caractéristiques. Vous les voyez et vous pensez instantanément : « Oh, c'est Sarah ».

Votre cerveau fait quelque chose d’incroyablement sophistiqué sans que vous vous en rendiez compte. Et c’est exactement ce que tentent de faire les CNN (Convolutional Neural Networks). Ils essaient d’apprendre aux ordinateurs à voir et à comprendre les images comme le fait votre cerveau.

Quel est le problème que nous essayons de résoudre avec les CNN ?

Avant les CNN, les gens essayaient d'utiliser des réseaux de neurones classiques (réseaux entièrement connectés) pour traiter les images. Voici comment cela a fonctionné : prenez une image, aplatissez-la en une longue liste de nombres (chaque pixel devient un nombre) et introduisez-la dans un réseau neuronal.

Désolé, cela va précipiter les choses, mais reste avec moi ici

Une image de 224 x 224 pixels contient environ 150 000 pixels. Si vous avez une image RVB (3 canaux de couleur), cela fait 450 000 nombres. Si votre première couche cachée contient 1 000 neurones, vous disposez désormais de 450 millions de poids à apprendre uniquement dans la première couche.

C'est énorme. Votre réseau devient incroyablement coûteux à former, lent à fonctionner et sujet au surajustement (mémorisation au lieu d'apprendre).

Mais voici le problème, et c'est important : les images ont une structure. Les pixels côte à côte sont liés. Un œil est un œil, qu'il se trouve en haut à gauche ou en bas à droite de votre im...
[Courte citation de 8% de l'article original]

Loading...