El sesgo de la IA en contratación no es un problema de IA. Es un problema de autonomía.
Un estudio liderado por Stanford sobre 4,2 millones de candidaturas reveló que los filtros con IA rechazan a candidatos negros en sectores enteros. La solución no es prohibir la IA, sino mantener a una persona en el circuito.
Ernest Bursa
Un estudio de 2026 liderado por Stanford sobre 4,2 millones de candidaturas de empleo descubrió que las herramientas de cribado con IA pueden rechazar a candidatos cualificados en sectores enteros, no solo en puestos concretos. En los datos, el 25,87 % de las candidaturas de personas negras fueron a parar a puestos cuyo modelo mostraba impacto adverso contra ellas, y el 4 % de quienes se postularon a diez puestos fueron rechazados en los diez. La causa no fue “la IA en contratación”. Fue una decisión de diseño concreta: un modelo que rechaza a los candidatos antes de que ninguna persona los vea, desplegado por suficientes empleadores de un sector como para descartar a la misma persona en todas partes a la vez.
El titular que todos leyeron, y el número que hay debajo
El estudio que está marcando el ciclo de noticias es “Algorithmic Monocultures in Hiring”, presentado en la Conferencia ACM sobre Equidad, Responsabilidad y Transparencia de 2026 (FAccT ’26) por Rishi Bommasani, Sarah H. Bana, Kathleen A. Creel, Dan Jurafsky y Percy Liang. Tres de los cinco autores están en Stanford, así que “liderado por Stanford” es justo; “íntegramente de Stanford” no.
Es el mayor estudio sobre decisiones de contratación con IA ya desplegada hasta la fecha: 4 197 168 candidaturas de 3 372 132 aspirantes a 1746 puestos repartidos entre 156 empleadores de 11 sectores, con una facturación anual combinada cercana a los 225 000 millones de dólares, abarcando de diciembre de 2018 a diciembre de 2022. Cada cifra aquí es literal del artículo.
Todas esas candidaturas fueron cribadas por pymetrics, un proveedor de evaluaciones basadas en juegos (adquirido por Harver en agosto de 2022). Los aspirantes juegan de 12 a 16 minijuegos online, y un clasificador específico para cada cliente devuelve “recomendar” o “no recomendar”. De media, el 41,8 % de las candidaturas resultaron “no recomendadas”, lo que el artículo trata como rechazo.
Cuando los investigadores analizaron el impacto adverso tal y como realmente exigen las directrices de EE. UU., por puesto en lugar de en conjunto, las disparidades quedaron claras:
- El 25,87 % de las candidaturas de personas negras fue a parar a puestos cuyo modelo mostraba impacto adverso contra ellas.
- El 30,70 % de los aspirantes negros se postuló al menos a un puesto que perjudica a las personas negras.
- El 10,62 % de los 1746 puestos mostró impacto adverso contra las personas negras.
- El 14,74 % de las candidaturas de personas asiáticas fue a parar a puestos con impacto adverso contra las personas asiáticas.
No son casos aislados enterrados en una nota a pie de página. Son el hallazgo central del mayor conjunto de datos sobre resultados reales de contratación con IA que nadie haya reunido.
Por qué son “sectores enteros” y no solo “puestos concretos”
La razón por la que un sesgo a nivel de puesto se convierte en un problema que afecta a todo un sector es la monocultura algorítmica: cuando los modelos del mismo proveedor median el cribado en muchos empleadores, un rechazo en una empresa deja de ser independiente del rechazo en otra. Comparten el mismo modelo, así que comparten los mismos puntos ciegos.
El artículo lo cuantifica directamente. De los aspirantes que se postulan a diez puestos, el 4 % es rechazado en los diez. Eso es más de lo que predeciría una toma de decisiones independiente. Con decisiones genuinamente independientes, la probabilidad de fallar en todas partes cae rápido; aquí cae más despacio que el azar, porque las decisiones están correlacionadas por un clasificador compartido. Para reducir la tasa de rechazo sistémico por debajo del 0,1 %, un aspirante tendría que enviar 25 candidaturas en lugar de 10.
Ahora súmale el hecho de que los empleadores de un mismo sector tienden a concentrarse en el mismo proveedor. El artículo menciona las finanzas, la industria manufacturera y la logística de almacén. Un candidato cuyas características de juego el modelo casualmente desfavorece no pierde un empleo. Puede quedar descartado de todo un campo profesional por un único clasificador del que nunca supo que estaba decidiendo. Esa es la diferencia entre una entrevista que sale mal y una puerta cerrada.
¿Pueden las herramientas de contratación con IA tener sesgo racial?
Sí. Un estudio de 2026 liderado por Stanford sobre 4,2 millones de candidaturas descubrió que el 25,87 % de las candidaturas de personas negras fue a parar a modelos de IA que mostraban impacto adverso contra ellas, y que el 4 % de quienes se postularon a diez puestos fueron rechazados en los diez. El sesgo rara vez es explícito. Procede de la discriminación por variables sustitutivas: el modelo aprende patrones en los datos de comportamiento o de juego que correlacionan con la raza, y luego actúa sobre esos patrones como si fueran mérito.
Aquí viene la parte que debería inquietar a cualquiera que se sienta a salvo porque su proveedor “pasó una auditoría”. pymetrics sí pasó una. Una auditoría académica independiente (Wilson y Mislove, FAccT 2021) determinó que implementaba fielmente la regla de los cuatro quintos sobre una base agregada. Lo que demuestra el nuevo estudio es que las auditorías agregadas enmascaran las disparidades por puesto. Cuando desglosas al nivel de puesto que la ley estadounidense realmente exige (41 CFR 60-3.15.2(a)), el impacto adverso reaparece.
Como lo expresó Sarah Bana, coautora del estudio, los “comportamientos que los juegos captan están funcionando como variables sustitutivas de la raza”. Rishi Bommasani añadió que los “sesgos reflejan que las características de juego están distribuidas de forma desigual entre los grupos raciales”. La lección es contundente: “auditamos nuestro modelo” no es lo mismo que “ningún candidato resulta perjudicado”.
El verdadero modo de fallo es la autonomía, no la IA
La frase más importante del artículo no es una estadística. Es una descripción de lo que ocurre después de que el modelo habla. Cuando el algoritmo devuelve “no recomendar”, el aspirante, en palabras de los autores, “probablemente será rechazado sin que ninguna persona lo considere”. Las herramientas “determinan qué aspirantes se consideran para una entrevista y qué candidaturas no ve nunca una persona”.
Léelo otra vez. El daño no es que un modelo se formara una opinión. El daño es que la opinión fue definitiva e invisible. Ningún revisor vio al candidato. Nadie sopesó la candidatura completa. Nadie respondió por el rechazo, y nadie pudo corregirlo.
Esto replantea todo el debate. El problema documentado a lo largo de 4,2 millones de candidaturas no es la inteligencia; es autonomía más opacidad a escala. Un modelo que redacta un resumen para que lo lea una persona no puede cerrarle a nadie las puertas de un sector. Un modelo que dicta un veredicto antes de que una persona lo mire, sí puede, sobre todo cuando es el mismo modelo el que toma esa decisión en todas partes a la vez.
Así que la pregunta de diseño para cualquier equipo que use IA en contratación no es “¿deberíamos usar IA?”. Es “¿la IA está asistiendo una decisión humana, o sustituyéndola?”.
Esto ya es un problema legal y regulatorio
Si el argumento ético no mueve a tu dirección, el de la responsabilidad debería. El cribado autónomo con IA está generando exposición legal real y certificada ahora mismo.
- Mobley contra Workday. Una demanda colectiva que alega que el cribado con IA de Workday discrimina por edad, raza y discapacidad. El tribunal admitió una teoría de responsabilidad por “agencia” en julio de 2024 (lo que significa que el propio proveedor de IA puede ser responsable), certificó una colectiva nacional bajo la ADEA en mayo de 2025, y las reclamaciones por edad continuaron en 2026. El demandante principal, un aspirante afroamericano, con discapacidad y mayor de 40 años, fue rechazado de más de 100 empleos.
- EEOC contra iTutorGroup. El primer acuerdo de la EEOC por discriminación en contratación con IA: 365 000 dólares, después de que una herramienta rechazara automáticamente a mujeres de 55 años o más y a hombres de 60 o más.
- Contexto regulatorio. La Ley Local 144 de Nueva York exige auditorías de sesgo independientes anuales y aviso al candidato para las herramientas automatizadas de decisión en el empleo, con sanciones de entre 500 y 1500 dólares al día. La Ley de IA de la UE (2024) clasifica la IA de contratación como de alto riesgo.
En 2025 hubo un repliegue federal: la EEOC retiró sus directrices de 2023 sobre IA en contratación y una orden ejecutiva instruyó a las agencias a restar prioridad a la responsabilidad por impacto dispar. Pero la disposición sobre impacto dispar del Título VII y los demandantes privados siguen intactos. El riesgo no desapareció. Se trasladó de la aplicación federal a los litigios privados, que son más difíciles de cerrar de forma discreta.
Cómo usar la IA en contratación sin dejar a la gente fuera
No tienes que elegir entre velocidad y equidad. Tienes que negarte a dejar que un modelo sea el portero. Cuatro principios, extraídos directamente de lo que el estudio reprocha:
- Haz que la IA sea asistiva, no autónoma. Usa los modelos para resumir, destacar y contextualizar a los candidatos ante un lector humano, nunca para rechazar de forma automática. El patrón del “no recomendar que se salta la revisión humana” es exactamente lo que el artículo señala.
- Mantén a una persona en cada decisión. Cada avance o rechazo debería ser una acción humana registrada, no una salida silenciosa de un modelo. Alguien que responda por ello, con la candidatura completa delante, toma la decisión.
- Haz que las etapas sean estructuradas y auditables. Los candidatos deberían avanzar por etapas explícitas, nombradas y registradas, lo contrario de una puntuación opaca que “nunca ve una persona”. Esta es la transparencia que piden tanto los investigadores como la Ley Local 144 de Nueva York.
- Deja pasar un subconjunto al azar. El propio consejo de Bana a los empleadores: entiende qué selecciona y descarta tu algoritmo en cada puesto, y deja pasar un subconjunto aleatorio de aspirantes más allá de la primera etapa. Es una comprobación barata y potente contra la exclusión sistémica.
Una advertencia honesta: tener a una persona en el circuito reduce el sesgo, pero por sí solo no lo elimina. Las personas también arrastran sesgos. Lo importante es que una decisión humana es responsable, corregible e inspeccionable, mientras que un veredicto autónomo de un modelo que nadie ve no es nada de eso.
Cómo está construido Kit para esto
Las herramientas de contratación de Kit son, por arquitectura, lo opuesto al diseño de pymetrics que describe el estudio. La IA asiste a las personas que contratan; nunca se interpone entre un candidato y una persona como una barrera.
- La IA es asistiva para los revisores, nunca un portero autónomo. La IA de Kit produce resúmenes para personas, destacando y contextualizando a un candidato para que un revisor pueda leer más rápido y con más justicia. El trabajo del modelo es ayudar a una persona a decidir, no descartar a nadie en silencio.
- Las personas toman la decisión, y queda registrada. Cada avance y cada rechazo pasa por una cola de decisiones pendientes como una acción humana deliberada. No existe el camino de “el modelo dijo no, el candidato desaparece”.
- Etapas estructuradas y auditables. Los candidatos avanzan por etapas explícitas y nombradas, de modo que cada transición queda registrada y es revisable, lo contrario de una puntuación opaca que nadie ve jamás.
- Sin monocultura silenciosa entre empleadores. Kit es una herramienta por cuenta donde tu equipo es dueño de los criterios y de las decisiones. No hay un único clasificador mediando el embudo de todo un sector, así que la dinámica de “rechazado en los diez puestos por el mismo modelo” no aplica.
En Kit, un modelo nunca descarta a un candidato antes de que una persona lo vea. La IA redacta el resumen; una persona toma la decisión; cada etapa queda registrada.
La conclusión
La lección de 4,2 millones de candidaturas cribadas no es que la IA no tenga sitio en la contratación. Es que la IA nunca debería tener la última palabra. El fallo que documenta el estudio es la autonomía y la opacidad: un modelo que rechaza a personas cualificadas antes de que una persona las mire, replicado por todo un sector hasta que el rechazo se convierte en una puerta cerrada.
Mantén a la persona en el circuito. Haz que las etapas sean auditables. Deja pasar algo de aleatoriedad. Usa la IA para ayudar a tu equipo a ver a más candidatos con más justicia, no para decidir quién es invisible. El objetivo es simple, y es lo contrario de lo que advierten los titulares: no prohíbas la IA en la contratación. Niégate a dejar que sea el portero.
Si quieres ver en acción la IA asistiva junto con la revisión humana, puedes explorar cómo Kit aborda la IA en contratación o empezar una prueba gratuita.
Artículos relacionados
Contratación por competencias: crea scorecards estructurados que funcionan
La contratación por competencias ya superó el punto de inflexión. Te contamos cómo crear scorecards estructurados que más que duplican la capacidad de las entrevistas para predecir el desempeño.
¿Cuántas rondas de entrevista son normales? (Y cuándo son demasiadas)
Los mejores candidatos salen del mercado en 10 días. La contratación media tarda 44. Aquí tienes cuántas rondas de entrevista son normales y cómo arreglar un proceso inflado.
Trabajadores de TI norcoreanos: cómo frenar la contratación remota fraudulenta
El esquema de trabajadores de TI norcoreanos genera unos 250-600 millones de dólares al año colocando empleados remotos falsos dentro de empresas estadounidenses. Así los detectas en la puerta de entrada.
¿Listo para contratar de forma más inteligente?
Empiece gratis. Sin tarjeta de crédito. Configure su primer pipeline de contratación en minutos.
Empiece gratis