Les biais de l'IA au recrutement ne sont pas un problème d'IA, mais d'autonomie

Une étude menée par Stanford sur 4,2 M de candidatures montre que les filtres d'IA rejettent des candidats noirs à l'échelle de secteurs entiers. La solution n'est pas d'interdire l'IA, mais de garder l'humain dans la boucle.

Ernest Bursa

Founder · 10 juin 2026 · 10 min de lecture

A startup hiring manager reading a candidate summary on her laptop in a sunlit co-working loft, making the final call herself instead of letting a model decide

Une étude menée en 2026 sous l’égide de Stanford, portant sur 4,2 millions de candidatures, a montré que les outils de présélection par IA peuvent rejeter des candidats qualifiés à l’échelle de secteurs entiers, et pas seulement pour des postes isolés. Dans les données, 25,87 % des candidatures émanant de candidats noirs sont allées vers des postes dont le modèle présentait un impact défavorable à leur encontre, et 4 % des candidats ayant postulé à dix postes ont été rejetés des dix. La cause n’était pas « l’IA dans le recrutement ». C’était un choix de conception bien précis : un modèle qui rejette les candidats avant qu’aucun humain ne les ait vus, déployé par un nombre suffisant d’employeurs d’un même secteur pour écarter la même personne partout à la fois.

Le titre que tout le monde a lu, et le chiffre qui se cache dessous

L’étude qui alimente l’actualité s’intitule « Algorithmic Monocultures in Hiring », présentée à la conférence ACM 2026 sur l’équité, la responsabilité et la transparence (FAccT ‘26) par Rishi Bommasani, Sarah H. Bana, Kathleen A. Creel, Dan Jurafsky et Percy Liang. Trois des cinq auteurs sont à Stanford, donc parler d’une étude « menée par Stanford » est juste ; dire qu’elle est « entièrement de Stanford » ne l’est pas.

C’est la plus vaste étude réalisée à ce jour sur des décisions de recrutement par IA en conditions réelles : 4 197 168 candidatures émanant de 3 372 132 candidats pour 1 746 postes, répartis sur 156 employeurs dans 11 secteurs, totalisant un chiffre d’affaires annuel cumulé proche de 225 milliards de dollars, sur la période de décembre 2018 à décembre 2022. Chaque chiffre cité ici est repris mot pour mot de l’étude.

Toutes ces candidatures ont été présélectionnées par pymetrics, un éditeur d’évaluations sous forme de jeux (racheté par Harver en août 2022). Les candidats jouent à 12 à 16 mini-jeux en ligne, et un classifieur propre à chaque client renvoie « recommandé » ou « non recommandé ». En moyenne, 41,8 % des candidatures ont été classées « non recommandé », ce que l’étude assimile à un rejet.

Lorsque les chercheurs ont analysé l’impact défavorable de la manière qui s’impose réellement, poste par poste plutôt que de manière agrégée, les disparités étaient flagrantes :

25,87 % des candidatures émanant de candidats noirs sont allées vers des postes dont le modèle présentait un impact défavorable à l’encontre des candidats noirs.
30,70 % des candidats noirs ont postulé à au moins un poste présentant un impact défavorable à l’encontre des candidats noirs.
10,62 % des 1 746 postes présentaient un impact défavorable à l’encontre des candidats noirs.
14,74 % des candidatures émanant de candidats asiatiques sont allées vers des postes présentant un impact défavorable à l’encontre des candidats asiatiques.

Ce ne sont pas des cas marginaux relégués dans une note de bas de page. C’est le résultat central du plus grand jeu de données jamais constitué sur des décisions de recrutement par IA en conditions réelles.

Pourquoi il s’agit de « secteurs entiers », et pas seulement de « postes isolés »

Si un biais propre à un poste devient un problème à l’échelle d’un secteur, c’est à cause de la monoculture algorithmique : lorsque les modèles d’un même éditeur arbitrent la présélection chez de nombreux employeurs, un rejet dans une entreprise n’est plus indépendant d’un rejet dans une autre. Elles partagent le même modèle, donc les mêmes angles morts.

L’étude le chiffre directement. Parmi les candidats qui postulent à dix postes, 4 % sont rejetés des dix. C’est plus que ne le prédirait une prise de décision indépendante. Avec des décisions véritablement indépendantes, la probabilité d’échouer partout chute rapidement ; ici, elle chute plus lentement que le hasard ne le voudrait, parce que les décisions sont corrélées par un classifieur commun. Pour faire passer le taux de rejet systémique sous la barre des 0,1 %, un candidat devrait soumettre 25 candidatures au lieu de 10.

Ajoutez à cela le fait que, dans un secteur donné, les employeurs ont tendance à se regrouper sur le même éditeur. L’étude cite la finance, l’industrie manufacturière et l’entreposage. Un candidat dont le style de jeu présente des caractéristiques que le modèle défavorise ne perd pas un poste. Il peut se voir écarté de tout un domaine par un unique classifieur dont il n’a jamais su qu’il tranchait. C’est toute la différence entre un mauvais entretien et une porte fermée.

Les outils de recrutement par IA peuvent-ils être racialement biaisés ?

Oui. Une étude menée en 2026 sous l’égide de Stanford, portant sur 4,2 millions de candidatures, a montré que 25,87 % des candidatures émanant de candidats noirs ont été soumises à des modèles d’IA présentant un impact défavorable à leur encontre, et que 4 % des candidats ayant postulé à dix postes ont été rejetés des dix. Le biais est rarement explicite. Il découle de la discrimination par variable indirecte : le modèle apprend, dans les données comportementales ou de jeu, des schémas corrélés à l’origine ethnique, puis agit sur ces schémas comme s’ils relevaient du mérite.

Voici la partie qui devrait inquiéter quiconque se croit à l’abri parce que son éditeur « a passé un audit ». pymetrics en a bel et bien passé un. Un audit académique indépendant (Wilson et Mislove, FAccT 2021) a constaté qu’il appliquait fidèlement la règle des quatre cinquièmes sur une base agrégée. Or, le point soulevé par la nouvelle étude est que les audits agrégés masquent les disparités poste par poste. Lorsqu’on désagrège jusqu’au niveau du poste, l’impact défavorable réapparaît.

Contexte local

Un employeur français ne pourrait de toute façon pas reproduire cet audit en l’état. La collecte et le traitement de données révélant l’origine raciale ou ethnique sont en principe interdits (loi Informatique et Libertés ; le Conseil constitutionnel, dans sa décision n° 2007-557 DC du 15 novembre 2007, a jugé qu’un tel traitement ne peut reposer sur « l’origine ethnique ou la race »). Il n’existe donc pas, en France, de statistique du type « X % des candidats noirs ont été soumis à un modèle défavorable ». La discrimination s’y détecte autrement : campagnes de testing, indices objectifs (patronyme, origine géographique) et standard de la discrimination indirecte.

Comme l’a formulé Sarah Bana, co-autrice de l’étude, les « comportements captés par les jeux fonctionnent comme des variables indirectes de l’origine ethnique ». Rishi Bommasani a ajouté que ces « biais reflètent le fait que les caractéristiques de jeu sont inégalement réparties entre les groupes ethniques ». La leçon est sans détour : « nous avons audité notre modèle » n’équivaut pas à « aucun candidat n’est lésé ».

La vraie défaillance, c’est l’autonomie, pas l’IA

La phrase la plus importante de l’étude n’est pas une statistique. C’est une description de ce qui se passe une fois que le modèle a tranché. Lorsque l’algorithme renvoie « non recommandé », le candidat, selon les termes des auteurs, « risque d’être rejeté sans qu’aucun humain ne s’y intéresse ». Les outils « déterminent quels candidats sont considérés pour un entretien et quelles candidatures ne sont jamais vues par un humain ».

Relisez bien. Le préjudice ne vient pas de ce qu’un modèle se soit forgé une opinion. Le préjudice vient de ce que cette opinion ait été définitive et invisible. Aucun relecteur n’a vu le candidat. Personne n’a pesé l’ensemble de la candidature. Personne n’était responsable du rejet, et personne ne pouvait le corriger.

Cela recadre tout le débat. Le problème documenté sur 4,2 millions de candidatures n’est pas l’intelligence ; c’est l’autonomie doublée d’opacité, à grande échelle. Un modèle qui rédige un résumé destiné à être lu par un humain ne peut barrer à personne l’accès à un secteur. Un modèle qui rend un verdict avant qu’un humain ne regarde, lui, le peut — surtout quand c’est le même modèle qui tranche partout à la fois.

La question de conception, pour toute équipe qui utilise l’IA dans le recrutement, n’est donc pas « devrions-nous utiliser l’IA ? ». C’est « l’IA assiste-t-elle une décision humaine, ou la remplace-t-elle ? ».

C’est déjà un problème juridique et réglementaire

Si l’argument éthique ne fait pas bouger votre direction, celui de la responsabilité juridique devrait y parvenir. En France comme à l’échelle de l’Union européenne, une présélection autonome par IA vous expose, dès aujourd’hui, à un risque juridique bien réel.

Discrimination indirecte (Code du travail, art. L1132-1). Le droit français interdit toute discrimination, directe comme indirecte, sur l’ensemble du processus de recrutement. Une pratique, un critère ou une procédure d’apparence neutre — un score algorithmique, par exemple — qui désavantage particulièrement un groupe protégé constitue une discrimination indirecte (loi n° 2008-496 du 27 mai 2008, art. 1), sauf à être objectivement justifiée par un but légitime, avec des moyens nécessaires et appropriés. Un modèle qui écarte systématiquement un groupe sans justification démontrable tombe précisément sous cette définition.
Charge de la preuve aménagée. Dès lors que le candidat présente des éléments laissant supposer une discrimination, c’est à l’employeur de prouver que sa décision repose sur des éléments objectifs étrangers à toute discrimination (loi n° 2008-496, art. 4). Un employeur incapable d’expliquer pourquoi son modèle rejette tel profil ne peut pas satisfaire à cette exigence.
AI Act européen. Le règlement européen sur l’IA (AI Act, 2024) range les systèmes utilisés pour recruter, diffuser des offres, filtrer ou classer les candidatures et évaluer les candidats parmi les usages à haut risque (annexe III). À ce titre, l’employeur qui les déploie est tenu à des obligations de gestion des risques, de gouvernance des données, de journalisation, de transparence et de supervision humaine.
Recours et sanctions. Une victime peut saisir gratuitement le Défenseur des droits (via antidiscriminations.fr) ou le conseil de prud’hommes : la mesure discriminatoire est frappée de nullité, la réintégration est possible et l’indemnité ne peut être inférieure à six mois de salaire, sans compter l’exposition pénale prévue par le Code pénal (art. 225-1 et 225-2).

Le contentieux nord-américain en cours — Mobley c. Workday, ou le règlement de l’EEOC c. iTutorGroup aux États-Unis — n’oblige pas un employeur français, mais il dessine la même trajectoire : la responsabilité se déplace vers celui qui déploie l’outil. Le risque ne disparaît pas ; il se précise.

Comment utiliser l’IA au recrutement sans écarter les gens

Vous n’avez pas à choisir entre rapidité et équité. Vous devez refuser de laisser un modèle jouer le rôle de gardien. Quatre principes, tirés directement de ce que l’étude met en cause :

Faites de l’IA un assistant, pas un agent autonome. Servez-vous des modèles pour résumer, faire ressortir et contextualiser les candidats à l’intention d’un lecteur humain — jamais pour rejeter automatiquement. Le schéma « non recommandé qui court-circuite la relecture humaine » est précisément ce que l’étude met en accusation.
Gardez un humain dans chaque décision. Chaque avancée ou chaque rejet devrait être une action humaine journalisée, et non une sortie de modèle silencieuse. C’est une personne responsable, ayant l’ensemble de la candidature sous les yeux, qui tranche.
Rendez les étapes structurées et auditables. Les candidats devraient progresser à travers des étapes explicites, nommées et journalisées — l’inverse d’un score opaque « jamais vu par un humain ». C’est la transparence que réclament à la fois les chercheurs et le règlement européen sur l’IA (AI Act).
Laissez passer un sous-ensemble aléatoire. Le conseil de Sarah Bana elle-même aux employeurs : comprenez ce que votre algorithme retient et écarte pour chaque poste, et laissez un sous-ensemble aléatoire de candidats franchir la première étape. C’est un garde-fou peu coûteux et redoutablement efficace contre l’exclusion systémique.

Une réserve honnête : garder l’humain dans la boucle réduit le biais, mais ne l’élimine pas à lui seul. Les gens aussi ont leurs biais. L’essentiel, c’est qu’une décision humaine est responsable, corrigible et inspectable, alors qu’un verdict de modèle autonome que personne ne voit n’est rien de tout cela.

Comment Kit est conçu pour cela

Les outils de recrutement de Kit sont, par leur architecture même, l’exact inverse de la conception de pymetrics décrite par l’étude. L’IA assiste les personnes qui recrutent ; elle ne se place jamais entre un candidat et un humain comme un verrou.

L’IA assiste les relecteurs, sans jamais faire office de gardien autonome. L’IA de Kit produit des résumés à l’intention des humains, faisant ressortir et contextualisant un candidat pour qu’un relecteur lise plus vite et plus équitablement. Le rôle du modèle est d’aider une personne à décider, pas d’écarter qui que ce soit en silence.
Ce sont les humains qui décident, et c’est consigné. Chaque avancée et chaque rejet passe par une file de décisions en attente, sous la forme d’une action humaine délibérée. Il n’existe aucun chemin « le modèle a dit non, le candidat disparaît ».
Des étapes structurées et auditables. Les candidats progressent à travers des étapes explicites et nommées, de sorte que chaque transition est journalisée et vérifiable — l’inverse d’un score opaque que personne ne voit jamais.
Aucune monoculture silencieuse entre employeurs. Kit est un outillage propre à chaque compte, où votre équipe est maîtresse des critères et des décisions. Aucun classifieur unique n’arbitre l’entonnoir d’un secteur tout entier, si bien que la dynamique du « rejeté des dix postes par le même modèle » ne s’applique pas.

Dans Kit, un modèle n’écarte jamais un candidat avant qu’une personne ne l’ait vu. L’IA rédige le résumé ; un humain tranche ; chaque étape est consignée.

À retenir

La leçon de 4,2 millions de candidatures présélectionnées n’est pas que l’IA n’a pas sa place dans le recrutement. C’est que l’IA ne devrait jamais avoir le dernier mot. La défaillance documentée par l’étude tient à l’autonomie et à l’opacité : un modèle qui rejette des personnes qualifiées avant qu’un humain ne regarde, répliqué à l’échelle d’un secteur tout entier jusqu’à ce que le rejet devienne une porte verrouillée.

Gardez l’humain dans la boucle. Rendez les étapes auditables. Laissez passer un peu de hasard. Servez-vous de l’IA pour aider votre équipe à voir plus de candidats, plus équitablement — pas pour décider qui restera invisible. L’objectif est simple, et il est à l’opposé de ce contre quoi les gros titres mettent en garde : n’interdisez pas l’IA dans le recrutement. Refusez seulement de la laisser jouer le rôle de gardien.

Si vous voulez voir à l’œuvre l’IA assistive associée à la relecture humaine, vous pouvez découvrir l’approche de Kit en matière d’IA au recrutement ou démarrer un essai gratuit.

Les biais de l'IA au recrutement ne sont pas un problème d'IA, mais d'autonomie

Le titre que tout le monde a lu, et le chiffre qui se cache dessous

Pourquoi il s’agit de « secteurs entiers », et pas seulement de « postes isolés »

Les outils de recrutement par IA peuvent-ils être racialement biaisés ?

La vraie défaillance, c’est l’autonomie, pas l’IA

C’est déjà un problème juridique et réglementaire

Comment utiliser l’IA au recrutement sans écarter les gens

Comment Kit est conçu pour cela

À retenir

Articles similaires

Pret a recruter plus intelligemment ?

Le titre que tout le monde a lu, et le chiffre qui se cache dessous

Pourquoi il s’agit de « secteurs entiers », et pas seulement de « postes isolés »

Les outils de recrutement par IA peuvent-ils être racialement biaisés ?

La vraie défaillance, c’est l’autonomie, pas l’IA

C’est déjà un problème juridique et réglementaire

Comment utiliser l’IA au recrutement sans écarter les gens

Comment Kit est conçu pour cela

À retenir

Articles similaires

La guerre des ATS en 2026 : ce que veulent vraiment les recruteurs

La triche à l'entretien assistée par IA est devenue la norme. Voici comment y remédier

Vos candidats vous croient faux. Prouvez le contraire.

La fenêtre de recrutement en sécurité vient de s'ouvrir : coupes à la CISA + fermeture de Huntr

Des agents IA font désormais passer les entretiens. Le vôtre devrait-il le faire ?

Les conseils de recrutement par IA vous rendent plus sûr de vous et plus souvent dans l'erreur

Pret a recruter plus intelligemment ?

Pourquoi il s’agit de « secteurs entiers », et pas seulement de « postes isolés »

Les outils de recrutement par IA peuvent-ils être racialement biaisés ?

La guerre des ATS en 2026 : ce que veulent vraiment les recruteurs

La fenêtre de recrutement en sécurité vient de s'ouvrir : coupes à la CISA + fermeture de Huntr

Des agents IA font désormais passer les entretiens. Le vôtre devrait-il le faire ?