Un chercheur formé dans les meilleures institutions mondiales
Né en Slovaquie en 1986, Andrej Karpathy a grandi au Canada avant de s’installer aux États-Unis pour poursuivre ses études. Il obtient son doctorat à Stanford University sous la direction de Fei-Fei Li, l’une des pionnières de la vision par ordinateur. Sa thèse porte sur la connexion entre le langage naturel et les images, un sujet qui s’avérera visionnaire. Avant même de terminer son doctorat, il participe à des travaux qui façonneront durablement le domaine de l’apprentissage profond.
Son passage à Stanford lui permet de côtoyer les meilleurs chercheurs de la planète et d’affiner une approche pédagogique rare : celle de rendre les concepts les plus complexes accessibles au plus grand nombre.
Le rôle fondateur chez OpenAI
En 2015, Karpathy rejoint OpenAI dès sa fondation, aux côtés d’Elon Musk, Sam Altman et d’autres figures majeures de la tech. Il y occupe le poste de chercheur senior et contribue à poser les bases des premiers grands modèles de langage. Son travail sur les réseaux de neurones récurrents et les architectures transformers lui vaut une reconnaissance internationale.
C’est durant cette période qu’il développe également une réputation de pédagogue hors pair, en publiant des tutoriels et des cours en ligne qui deviennent des références absolues pour des milliers d’étudiants et de praticiens à travers le monde.
Directeur de l’IA chez Tesla : une parenthèse industrielle décisive
Entre 2017 et 2022, Karpathy quitte temporairement la recherche pure pour rejoindre Tesla en tant que directeur de l’intelligence artificielle et de la vision par ordinateur. Il prend en charge le développement du système Autopilot, qui repose sur une approche entièrement basée sur la vision — sans radar ni lidar — une décision aussi audacieuse que controversée dans le secteur.
« La meilleure façon de comprendre un réseau de neurones, c’est d’en construire un depuis zéro. »
Cette expérience industrielle lui apporte une dimension rare parmi les chercheurs en IA : la confrontation directe avec les contraintes du monde réel, les impératifs de sécurité et les exigences de déploiement à grande échelle. Il quitte Tesla en 2022 pour se consacrer à nouveau à ses projets personnels et à la recherche.
Un pédagogue inégalé dans l’écosystème de l’IA
L’une des facettes les plus appréciées de Karpathy est sans doute sa capacité à vulgariser des concepts techniques d’une grande complexité. Sa série de vidéos Neural Networks: Zero to Hero, publiée sur YouTube, est aujourd’hui considérée comme l’une des meilleures ressources gratuites pour apprendre le deep learning de manière rigoureuse et progressive.
Il a également développé micrograd et nanoGPT, deux projets open source minimalistes qui permettent de comprendre le fonctionnement interne des grands modèles de langage. Ces outils pédagogiques sont utilisés dans des universités du monde entier et ont contribué à démocratiser l’accès aux fondements techniques de l’IA générative.
- Auteur de cours en ligne suivis par des millions de personnes
- Créateur de nanoGPT, implémentation épurée d’un modèle GPT
- Contributeur actif à la communauté open source
- Conférencier régulier dans les grandes conférences académiques (NeurIPS, CVPR…)
- Présence très active sur les réseaux sociaux, notamment sur X (ex-Twitter)
Un retour chez OpenAI… puis un choix inattendu
En 2023, Karpathy effectue un retour remarqué chez OpenAI, suscitant un immense enthousiasme dans la communauté. Il y travaille pendant plusieurs mois avant d’annoncer, début 2024, une nouvelle démission. La raison invoquée : l’envie de retrouver une liberté totale pour explorer ses propres projets et contribuer à l’avancement de l’IA de façon plus indépendante.
C’est finalement Anthropic, la startup fondée par d’anciens membres d’OpenAI dont Dario et Daniela Amodei, qui parvient à le convaincre de les rejoindre. Ce choix est perçu comme un signal fort dans l’industrie : Anthropic, connue pour son approche centrée sur la sécurité de l’IA et ses travaux sur les modèles Claude, gagne ainsi en crédibilité scientifique et en attractivité auprès des meilleurs talents mondiaux.
Pourquoi ce choix d’Anthropic est significatif
Le recrutement de Karpathy par Anthropic ne relève pas du simple coup de communication. Il traduit une tendance de fond : les chercheurs les plus en vue du domaine accordent une importance croissante aux questions d’alignement et de sécurité des systèmes d’IA. Anthropic a bâti sa réputation sur ces enjeux, avec une approche dite d’IA constitutionnelle visant à rendre les modèles plus fiables et moins susceptibles de produire des contenus nuisibles.
Pour Karpathy, rejoindre Anthropic représente probablement l’opportunité de travailler sur des modèles de frontier tout en contribuant à des recherches fondamentales sur la robustesse et l’interprétabilité des réseaux de neurones. Un mariage entre excellence technique et responsabilité scientifique qui semble parfaitement cohérent avec le parcours de cet homme discret mais incontestablement influent.



