Les biais de l'IA au recrutement ne sont pas un problème d'IA, mais d'autonomie

Une étude menée par Stanford sur 4,2 M de candidatures montre que les filtres d'IA rejettent des candidats noirs à l'échelle de secteurs entiers. La solution n'est pas d'interdire l'IA, mais de garder l'humain dans la boucle.

Ernest Bursa

Ernest Bursa

Founder · · 10 min de lecture
A startup hiring manager reading a candidate summary on her laptop in a sunlit co-working loft, making the final call herself instead of letting a model decide

Une étude menée en 2026 sous l’égide de Stanford, portant sur 4,2 millions de candidatures, a montré que les outils de présélection par IA peuvent rejeter des candidats qualifiés à l’échelle de secteurs entiers, et pas seulement pour des postes isolés. Dans les données, 25,87 % des candidatures émanant de candidats noirs sont allées vers des postes dont le modèle présentait un impact défavorable à leur encontre, et 4 % des candidats ayant postulé à dix postes ont été rejetés des dix. La cause n’était pas « l’IA dans le recrutement ». C’était un choix de conception bien précis : un modèle qui rejette les candidats avant qu’aucun humain ne les ait vus, déployé par un nombre suffisant d’employeurs d’un même secteur pour écarter la même personne partout à la fois.

Le titre que tout le monde a lu, et le chiffre qui se cache dessous

L’étude qui alimente l’actualité s’intitule « Algorithmic Monocultures in Hiring », présentée à la conférence ACM 2026 sur l’équité, la responsabilité et la transparence (FAccT ‘26) par Rishi Bommasani, Sarah H. Bana, Kathleen A. Creel, Dan Jurafsky et Percy Liang. Trois des cinq auteurs sont à Stanford, donc parler d’une étude « menée par Stanford » est juste ; dire qu’elle est « entièrement de Stanford » ne l’est pas.

C’est la plus vaste étude réalisée à ce jour sur des décisions de recrutement par IA en conditions réelles : 4 197 168 candidatures émanant de 3 372 132 candidats pour 1 746 postes, répartis sur 156 employeurs dans 11 secteurs, totalisant un chiffre d’affaires annuel cumulé proche de 225 milliards de dollars, sur la période de décembre 2018 à décembre 2022. Chaque chiffre cité ici est repris mot pour mot de l’étude.

Toutes ces candidatures ont été présélectionnées par pymetrics, un éditeur d’évaluations sous forme de jeux (racheté par Harver en août 2022). Les candidats jouent à 12 à 16 mini-jeux en ligne, et un classifieur propre à chaque client renvoie « recommandé » ou « non recommandé ». En moyenne, 41,8 % des candidatures ont été classées « non recommandé », ce que l’étude assimile à un rejet.

Lorsque les chercheurs ont analysé l’impact défavorable de la façon dont les directives américaines l’exigent réellement, poste par poste plutôt que de manière agrégée, les disparités étaient flagrantes :

  • 25,87 % des candidatures émanant de candidats noirs sont allées vers des postes dont le modèle présentait un impact défavorable à l’encontre des candidats noirs.
  • 30,70 % des candidats noirs ont postulé à au moins un poste présentant un impact défavorable à l’encontre des candidats noirs.
  • 10,62 % des 1 746 postes présentaient un impact défavorable à l’encontre des candidats noirs.
  • 14,74 % des candidatures émanant de candidats asiatiques sont allées vers des postes présentant un impact défavorable à l’encontre des candidats asiatiques.

Ce ne sont pas des cas marginaux relégués dans une note de bas de page. C’est le résultat central du plus grand jeu de données jamais constitué sur des décisions de recrutement par IA en conditions réelles.

Pourquoi il s’agit de « secteurs entiers », et pas seulement de « postes isolés »

Si un biais propre à un poste devient un problème à l’échelle d’un secteur, c’est à cause de la monoculture algorithmique : lorsque les modèles d’un même éditeur arbitrent la présélection chez de nombreux employeurs, un rejet dans une entreprise n’est plus indépendant d’un rejet dans une autre. Elles partagent le même modèle, donc les mêmes angles morts.

L’étude le chiffre directement. Parmi les candidats qui postulent à dix postes, 4 % sont rejetés des dix. C’est plus que ne le prédirait une prise de décision indépendante. Avec des décisions véritablement indépendantes, la probabilité d’échouer partout chute rapidement ; ici, elle chute plus lentement que le hasard ne le voudrait, parce que les décisions sont corrélées par un classifieur commun. Pour faire passer le taux de rejet systémique sous la barre des 0,1 %, un candidat devrait soumettre 25 candidatures au lieu de 10.

Ajoutez à cela le fait que, dans un secteur donné, les employeurs ont tendance à se regrouper sur le même éditeur. L’étude cite la finance, l’industrie manufacturière et l’entreposage. Un candidat dont le style de jeu présente des caractéristiques que le modèle défavorise ne perd pas un poste. Il peut se voir écarté de tout un domaine par un unique classifieur dont il n’a jamais su qu’il tranchait. C’est toute la différence entre un mauvais entretien et une porte fermée.

Les outils de recrutement par IA peuvent-ils être racialement biaisés ?

Oui. Une étude menée en 2026 sous l’égide de Stanford, portant sur 4,2 millions de candidatures, a montré que 25,87 % des candidatures émanant de candidats noirs ont été soumises à des modèles d’IA présentant un impact défavorable à leur encontre, et que 4 % des candidats ayant postulé à dix postes ont été rejetés des dix. Le biais est rarement explicite. Il découle de la discrimination par variable indirecte : le modèle apprend, dans les données comportementales ou de jeu, des schémas corrélés à l’origine ethnique, puis agit sur ces schémas comme s’ils relevaient du mérite.

Voici la partie qui devrait inquiéter quiconque se croit à l’abri parce que son éditeur « a passé un audit ». pymetrics en a bel et bien passé un. Un audit académique indépendant (Wilson et Mislove, FAccT 2021) a constaté qu’il appliquait fidèlement la règle des quatre cinquièmes sur une base agrégée. Or, le point soulevé par la nouvelle étude est que les audits agrégés masquent les disparités poste par poste. Lorsqu’on désagrège jusqu’au niveau du poste, comme la loi américaine l’exige réellement (41 CFR 60-3.15.2(a)), l’impact défavorable réapparaît.

Comme l’a formulé Sarah Bana, co-autrice de l’étude, les « comportements captés par les jeux fonctionnent comme des variables indirectes de l’origine ethnique ». Rishi Bommasani a ajouté que ces « biais reflètent le fait que les caractéristiques de jeu sont inégalement réparties entre les groupes ethniques ». La leçon est sans détour : « nous avons audité notre modèle » n’équivaut pas à « aucun candidat n’est lésé ».

La vraie défaillance, c’est l’autonomie, pas l’IA

La phrase la plus importante de l’étude n’est pas une statistique. C’est une description de ce qui se passe une fois que le modèle a tranché. Lorsque l’algorithme renvoie « non recommandé », le candidat, selon les termes des auteurs, « risque d’être rejeté sans qu’aucun humain ne s’y intéresse ». Les outils « déterminent quels candidats sont considérés pour un entretien et quelles candidatures ne sont jamais vues par un humain ».

Relisez bien. Le préjudice ne vient pas de ce qu’un modèle se soit forgé une opinion. Le préjudice vient de ce que cette opinion ait été définitive et invisible. Aucun relecteur n’a vu le candidat. Personne n’a pesé l’ensemble de la candidature. Personne n’était responsable du rejet, et personne ne pouvait le corriger.

Cela recadre tout le débat. Le problème documenté sur 4,2 millions de candidatures n’est pas l’intelligence ; c’est l’autonomie doublée d’opacité, à grande échelle. Un modèle qui rédige un résumé destiné à être lu par un humain ne peut barrer à personne l’accès à un secteur. Un modèle qui rend un verdict avant qu’un humain ne regarde, lui, le peut — surtout quand c’est le même modèle qui tranche partout à la fois.

La question de conception, pour toute équipe qui utilise l’IA dans le recrutement, n’est donc pas « devrions-nous utiliser l’IA ? ». C’est « l’IA assiste-t-elle une décision humaine, ou la remplace-t-elle ? ».

C’est déjà un problème juridique et réglementaire

Si l’argument éthique ne fait pas bouger votre direction, celui de la responsabilité juridique devrait y parvenir. La présélection autonome par IA génère, dès maintenant, une exposition juridique réelle et avérée.

  • Mobley c. Workday. Une action collective alléguant que la présélection par IA de Workday discrimine en fonction de l’âge, de l’origine ethnique et du handicap. Le tribunal a admis une théorie de responsabilité au titre du « mandataire » en juillet 2024 (autrement dit, l’éditeur de l’IA peut lui-même être tenu pour responsable), a certifié une action collective nationale au titre de l’ADEA en mai 2025, et les griefs liés à l’âge se sont poursuivis jusqu’en 2026. Le plaignant principal, un candidat afro-américain en situation de handicap et âgé de plus de 40 ans, a été rejeté de plus de 100 postes.
  • EEOC c. iTutorGroup. Le premier règlement de l’EEOC pour discrimination au recrutement par IA : 365 000 dollars, après qu’un outil eut automatiquement rejeté les femmes de 55 ans et plus et les hommes de 60 ans et plus.
  • Contexte réglementaire. La Local Law 144 de New York impose des audits de biais annuels et indépendants ainsi qu’une notification au candidat pour les outils automatisés de décision d’embauche, sous peine d’amendes de 500 à 1 500 dollars par jour. La loi européenne sur l’IA (AI Act, 2024) classe l’IA de recrutement comme étant à haut risque.

Il y a eu un recul fédéral en 2025 : l’EEOC a retiré ses recommandations de 2023 sur l’IA au recrutement, et un décret a enjoint aux agences de reléguer au second plan la responsabilité pour impact défavorable (la doctrine du disparate impact). Mais la disposition relative à l’impact défavorable du Titre VII et les plaignants privés, eux, restent intacts. Le risque n’a pas disparu. Il s’est déplacé de l’application fédérale vers le contentieux privé, plus difficile à régler en toute discrétion.

Comment utiliser l’IA au recrutement sans écarter les gens

Vous n’avez pas à choisir entre rapidité et équité. Vous devez refuser de laisser un modèle jouer le rôle de gardien. Quatre principes, tirés directement de ce que l’étude met en cause :

  1. Faites de l’IA un assistant, pas un agent autonome. Servez-vous des modèles pour résumer, faire ressortir et contextualiser les candidats à l’intention d’un lecteur humain — jamais pour rejeter automatiquement. Le schéma « non recommandé qui court-circuite la relecture humaine » est précisément ce que l’étude met en accusation.
  2. Gardez un humain dans chaque décision. Chaque avancée ou chaque rejet devrait être une action humaine journalisée, et non une sortie de modèle silencieuse. C’est une personne responsable, ayant l’ensemble de la candidature sous les yeux, qui tranche.
  3. Rendez les étapes structurées et auditables. Les candidats devraient progresser à travers des étapes explicites, nommées et journalisées — l’inverse d’un score opaque « jamais vu par un humain ». C’est la transparence que réclament à la fois les chercheurs et la Local Law 144 de New York.
  4. Laissez passer un sous-ensemble aléatoire. Le conseil de Sarah Bana elle-même aux employeurs : comprenez ce que votre algorithme retient et écarte pour chaque poste, et laissez un sous-ensemble aléatoire de candidats franchir la première étape. C’est un garde-fou peu coûteux et redoutablement efficace contre l’exclusion systémique.

Une réserve honnête : garder l’humain dans la boucle réduit le biais, mais ne l’élimine pas à lui seul. Les gens aussi ont leurs biais. L’essentiel, c’est qu’une décision humaine est responsable, corrigible et inspectable, alors qu’un verdict de modèle autonome que personne ne voit n’est rien de tout cela.

Comment Kit est conçu pour cela

Les outils de recrutement de Kit sont, par leur architecture même, l’exact inverse de la conception de pymetrics décrite par l’étude. L’IA assiste les personnes qui recrutent ; elle ne se place jamais entre un candidat et un humain comme un verrou.

  • L’IA assiste les relecteurs, sans jamais faire office de gardien autonome. L’IA de Kit produit des résumés à l’intention des humains, faisant ressortir et contextualisant un candidat pour qu’un relecteur lise plus vite et plus équitablement. Le rôle du modèle est d’aider une personne à décider, pas d’écarter qui que ce soit en silence.
  • Ce sont les humains qui décident, et c’est consigné. Chaque avancée et chaque rejet passe par une file de décisions en attente, sous la forme d’une action humaine délibérée. Il n’existe aucun chemin « le modèle a dit non, le candidat disparaît ».
  • Des étapes structurées et auditables. Les candidats progressent à travers des étapes explicites et nommées, de sorte que chaque transition est journalisée et vérifiable — l’inverse d’un score opaque que personne ne voit jamais.
  • Aucune monoculture silencieuse entre employeurs. Kit est un outillage propre à chaque compte, où votre équipe est maîtresse des critères et des décisions. Aucun classifieur unique n’arbitre l’entonnoir d’un secteur tout entier, si bien que la dynamique du « rejeté des dix postes par le même modèle » ne s’applique pas.

Dans Kit, un modèle n’écarte jamais un candidat avant qu’une personne ne l’ait vu. L’IA rédige le résumé ; un humain tranche ; chaque étape est consignée.

À retenir

La leçon de 4,2 millions de candidatures présélectionnées n’est pas que l’IA n’a pas sa place dans le recrutement. C’est que l’IA ne devrait jamais avoir le dernier mot. La défaillance documentée par l’étude tient à l’autonomie et à l’opacité : un modèle qui rejette des personnes qualifiées avant qu’un humain ne regarde, répliqué à l’échelle d’un secteur tout entier jusqu’à ce que le rejet devienne une porte verrouillée.

Gardez l’humain dans la boucle. Rendez les étapes auditables. Laissez passer un peu de hasard. Servez-vous de l’IA pour aider votre équipe à voir plus de candidats, plus équitablement — pas pour décider qui restera invisible. L’objectif est simple, et il est à l’opposé de ce contre quoi les gros titres mettent en garde : n’interdisez pas l’IA dans le recrutement. Refusez seulement de la laisser jouer le rôle de gardien.

Si vous voulez voir à l’œuvre l’IA assistive associée à la relecture humaine, vous pouvez découvrir l’approche de Kit en matière d’IA au recrutement ou démarrer un essai gratuit.

Articles similaires

Pret a recruter plus intelligemment ?

Commencez gratuitement. Aucune carte de credit requise. Configurez votre premier pipeline de recrutement en quelques minutes.

Commencer gratuitement