Portrait – 6 infos clés sur Andrej Karpathy, le talent que tout l’écosystème de l’IA s’arrache (il vient de choisir Anthropic)

Portrait - 6 infos clés sur Andrej Karpathy, le talent que tout l’écosystème de l’IA s’arrache (il vient de choisir Anthropic)

Un chercheur formé dans les meilleures institutions mondiales

Né en Slovaquie en 1986, Andrej Karpathy a grandi au Canada avant de s’installer aux États-Unis pour poursuivre ses études. Il obtient son doctorat à Stanford University sous la direction de Fei-Fei Li, l’une des pionnières de la vision par ordinateur. Sa thèse porte sur la connexion entre le langage naturel et les images, un sujet qui s’avérera visionnaire. Avant même de terminer son doctorat, il participe à des travaux qui façonneront durablement le domaine de l’apprentissage profond.

Son passage à Stanford lui permet de côtoyer les meilleurs chercheurs de la planète et d’affiner une approche pédagogique rare : celle de rendre les concepts les plus complexes accessibles au plus grand nombre.

Le rôle fondateur chez OpenAI

En 2015, Karpathy rejoint OpenAI dès sa fondation, aux côtés d’Elon Musk, Sam Altman et d’autres figures majeures de la tech. Il y occupe le poste de chercheur senior et contribue à poser les bases des premiers grands modèles de langage. Son travail sur les réseaux de neurones récurrents et les architectures transformers lui vaut une reconnaissance internationale.

C’est durant cette période qu’il développe également une réputation de pédagogue hors pair, en publiant des tutoriels et des cours en ligne qui deviennent des références absolues pour des milliers d’étudiants et de praticiens à travers le monde.

Directeur de l’IA chez Tesla : une parenthèse industrielle décisive

Entre 2017 et 2022, Karpathy quitte temporairement la recherche pure pour rejoindre Tesla en tant que directeur de l’intelligence artificielle et de la vision par ordinateur. Il prend en charge le développement du système Autopilot, qui repose sur une approche entièrement basée sur la vision — sans radar ni lidar — une décision aussi audacieuse que controversée dans le secteur.

« La meilleure façon de comprendre un réseau de neurones, c’est d’en construire un depuis zéro. »

Cette expérience industrielle lui apporte une dimension rare parmi les chercheurs en IA : la confrontation directe avec les contraintes du monde réel, les impératifs de sécurité et les exigences de déploiement à grande échelle. Il quitte Tesla en 2022 pour se consacrer à nouveau à ses projets personnels et à la recherche.

Un pédagogue inégalé dans l’écosystème de l’IA

L’une des facettes les plus appréciées de Karpathy est sans doute sa capacité à vulgariser des concepts techniques d’une grande complexité. Sa série de vidéos Neural Networks: Zero to Hero, publiée sur YouTube, est aujourd’hui considérée comme l’une des meilleures ressources gratuites pour apprendre le deep learning de manière rigoureuse et progressive.

Il a également développé micrograd et nanoGPT, deux projets open source minimalistes qui permettent de comprendre le fonctionnement interne des grands modèles de langage. Ces outils pédagogiques sont utilisés dans des universités du monde entier et ont contribué à démocratiser l’accès aux fondements techniques de l’IA générative.

  • Auteur de cours en ligne suivis par des millions de personnes
  • Créateur de nanoGPT, implémentation épurée d’un modèle GPT
  • Contributeur actif à la communauté open source
  • Conférencier régulier dans les grandes conférences académiques (NeurIPS, CVPR…)
  • Présence très active sur les réseaux sociaux, notamment sur X (ex-Twitter)

Un retour chez OpenAI… puis un choix inattendu

En 2023, Karpathy effectue un retour remarqué chez OpenAI, suscitant un immense enthousiasme dans la communauté. Il y travaille pendant plusieurs mois avant d’annoncer, début 2024, une nouvelle démission. La raison invoquée : l’envie de retrouver une liberté totale pour explorer ses propres projets et contribuer à l’avancement de l’IA de façon plus indépendante.

C’est finalement Anthropic, la startup fondée par d’anciens membres d’OpenAI dont Dario et Daniela Amodei, qui parvient à le convaincre de les rejoindre. Ce choix est perçu comme un signal fort dans l’industrie : Anthropic, connue pour son approche centrée sur la sécurité de l’IA et ses travaux sur les modèles Claude, gagne ainsi en crédibilité scientifique et en attractivité auprès des meilleurs talents mondiaux.

Pourquoi ce choix d’Anthropic est significatif

Le recrutement de Karpathy par Anthropic ne relève pas du simple coup de communication. Il traduit une tendance de fond : les chercheurs les plus en vue du domaine accordent une importance croissante aux questions d’alignement et de sécurité des systèmes d’IA. Anthropic a bâti sa réputation sur ces enjeux, avec une approche dite d’IA constitutionnelle visant à rendre les modèles plus fiables et moins susceptibles de produire des contenus nuisibles.

Pour Karpathy, rejoindre Anthropic représente probablement l’opportunité de travailler sur des modèles de frontier tout en contribuant à des recherches fondamentales sur la robustesse et l’interprétabilité des réseaux de neurones. Un mariage entre excellence technique et responsabilité scientifique qui semble parfaitement cohérent avec le parcours de cet homme discret mais incontestablement influent.

Questions fréquentes

Qui est Andrej Karpathy ?
Andrej Karpathy est un chercheur en intelligence artificielle slovaco-canadien, ancien directeur de l’IA chez Tesla et cofondateur d’OpenAI. Il est reconnu mondialement pour ses contributions en deep learning et sa pédagogie accessible.
Pourquoi Karpathy a-t-il rejoint Anthropic ?
Après deux passages chez OpenAI et une expérience chez Tesla, Karpathy a choisi Anthropic pour sa culture de recherche axée sur la sécurité et l’alignement de l’IA. Ce choix reflète son intérêt croissant pour des questions de responsabilité scientifique.
Qu’est-ce que nanoGPT ?
NanoGPT est un projet open source créé par Karpathy qui propose une implémentation minimaliste d’un modèle de type GPT. Il est largement utilisé à des fins pédagogiques pour comprendre le fonctionnement des grands modèles de langage.
Quelle était la mission de Karpathy chez Tesla ?
Chez Tesla, il dirigeait l’équipe en charge du développement de l’Autopilot et des systèmes de conduite autonome basés uniquement sur la vision par caméra, sans recours au radar ni au lidar.
Où peut-on suivre les cours d’Andrej Karpathy ?
Ses cours sont disponibles gratuitement sur YouTube, notamment la série Neural Networks: Zero to Hero. Ses projets open source sont également accessibles sur GitHub.