Un estudio de 2026 liderado por Stanford sobre 4,2 millones de candidaturas de empleo descubrió que las herramientas de cribado con IA pueden rechazar a candidatos cualificados en sectores enteros, no solo en puestos concretos. En los datos, el 25,87 % de las candidaturas de personas negras fueron a parar a puestos cuyo modelo mostraba impacto adverso contra ellas, y el 4 % de quienes se postularon a diez puestos fueron rechazados en los diez. La causa no fue "la IA en contratación". Fue una decisión de diseño concreta: un modelo que rechaza a los candidatos antes de que ninguna persona los vea, desplegado por suficientes empleadores de un sector como para descartar a la misma persona en todas partes a la vez.

## El titular que todos leyeron, y el número que hay debajo

El estudio que está marcando el ciclo de noticias es "Algorithmic Monocultures in Hiring", presentado en la Conferencia ACM sobre Equidad, Responsabilidad y Transparencia de 2026 (FAccT '26) por Rishi Bommasani, Sarah H. Bana, Kathleen A. Creel, Dan Jurafsky y Percy Liang. Tres de los cinco autores están en Stanford, así que "liderado por Stanford" es justo; "íntegramente de Stanford" no.

Es el mayor estudio sobre decisiones de contratación con IA ya desplegada hasta la fecha: **4 197 168 candidaturas** de **3 372 132 aspirantes** a **1746 puestos** repartidos entre **156 empleadores** de **11 sectores**, con una facturación anual combinada cercana a los **225 000 millones de dólares**, abarcando de diciembre de 2018 a diciembre de 2022. Cada cifra aquí es literal del artículo.

Todas esas candidaturas fueron cribadas por **pymetrics**, un proveedor de evaluaciones basadas en juegos (adquirido por Harver en agosto de 2022). Los aspirantes juegan de 12 a 16 minijuegos online, y un clasificador específico para cada cliente devuelve "recomendar" o "no recomendar". De media, el **41,8 % de las candidaturas resultaron "no recomendadas"**, lo que el artículo trata como rechazo.

Cuando los investigadores analizaron el impacto adverso tal y como realmente exigen las directrices de EE. UU., por puesto en lugar de en conjunto, las disparidades quedaron claras:

- El **25,87 %** de las candidaturas de personas negras fue a parar a puestos cuyo modelo mostraba impacto adverso contra ellas.
- El **30,70 %** de los aspirantes negros se postuló al menos a un puesto que perjudica a las personas negras.
- El **10,62 %** de los 1746 puestos mostró impacto adverso contra las personas negras.
- El **14,74 %** de las candidaturas de personas asiáticas fue a parar a puestos con impacto adverso contra las personas asiáticas.

No son casos aislados enterrados en una nota a pie de página. Son el hallazgo central del mayor conjunto de datos sobre resultados reales de contratación con IA que nadie haya reunido.

## Por qué son "sectores enteros" y no solo "puestos concretos"

La razón por la que un sesgo a nivel de puesto se convierte en un problema que afecta a todo un sector es la **monocultura algorítmica**: cuando los modelos del mismo proveedor median el cribado en muchos empleadores, un rechazo en una empresa deja de ser independiente del rechazo en otra. Comparten el mismo modelo, así que comparten los mismos puntos ciegos.

El artículo lo cuantifica directamente. **De los aspirantes que se postulan a diez puestos, el 4 % es rechazado en los diez.** Eso es más de lo que predeciría una toma de decisiones independiente. Con decisiones genuinamente independientes, la probabilidad de fallar en todas partes cae rápido; aquí cae más despacio que el azar, porque las decisiones están correlacionadas por un clasificador compartido. Para reducir la tasa de rechazo sistémico por debajo del 0,1 %, un aspirante tendría que enviar **25 candidaturas en lugar de 10**.

Ahora súmale el hecho de que los empleadores de un mismo sector tienden a concentrarse en el mismo proveedor. El artículo menciona las finanzas, la industria manufacturera y la logística de almacén. Un candidato cuyas características de juego el modelo casualmente desfavorece no pierde un empleo. Puede quedar descartado de todo un campo profesional por un único clasificador del que nunca supo que estaba decidiendo. Esa es la diferencia entre una entrevista que sale mal y una puerta cerrada.

## ¿Pueden las herramientas de contratación con IA tener sesgo racial?

Sí. Un estudio de 2026 liderado por Stanford sobre 4,2 millones de candidaturas descubrió que el 25,87 % de las candidaturas de personas negras fue a parar a modelos de IA que mostraban impacto adverso contra ellas, y que el 4 % de quienes se postularon a diez puestos fueron rechazados en los diez. El sesgo rara vez es explícito. Procede de la **discriminación por variables sustitutivas**: el modelo aprende patrones en los datos de comportamiento o de juego que correlacionan con la raza, y luego actúa sobre esos patrones como si fueran mérito.

Aquí viene la parte que debería inquietar a cualquiera que se sienta a salvo porque su proveedor "pasó una auditoría". pymetrics sí pasó una. Una auditoría académica independiente (Wilson y Mislove, FAccT 2021) determinó que implementaba fielmente la regla de los cuatro quintos sobre una base **agregada**. Lo que demuestra el nuevo estudio es que las auditorías agregadas **enmascaran** las disparidades por puesto. Cuando desglosas al nivel de puesto que la ley estadounidense realmente exige (41 CFR 60-3.15.2(a)), el impacto adverso reaparece.

Como lo expresó Sarah Bana, coautora del estudio, los "comportamientos que los juegos captan están funcionando como variables sustitutivas de la raza". Rishi Bommasani añadió que los "sesgos reflejan que las características de juego están distribuidas de forma desigual entre los grupos raciales". La lección es contundente: **"auditamos nuestro modelo" no es lo mismo que "ningún candidato resulta perjudicado".**

## El verdadero modo de fallo es la autonomía, no la IA

La frase más importante del artículo no es una estadística. Es una descripción de lo que ocurre después de que el modelo habla. Cuando el algoritmo devuelve "no recomendar", el aspirante, en palabras de los autores, **"probablemente será rechazado sin que ninguna persona lo considere".** Las herramientas "determinan qué aspirantes se consideran para una entrevista y qué candidaturas no ve nunca una persona".

Léelo otra vez. El daño no es que un modelo se formara una opinión. El daño es que la opinión fue **definitiva e invisible**. Ningún revisor vio al candidato. Nadie sopesó la candidatura completa. Nadie respondió por el rechazo, y nadie pudo corregirlo.

Esto replantea todo el debate. El problema documentado a lo largo de 4,2 millones de candidaturas no es la inteligencia; es **autonomía más opacidad a escala**. Un modelo que redacta un resumen para que lo lea una persona no puede cerrarle a nadie las puertas de un sector. Un modelo que dicta un veredicto antes de que una persona lo mire, sí puede, sobre todo cuando es el mismo modelo el que toma esa decisión en todas partes a la vez.

Así que la pregunta de diseño para cualquier equipo que use IA en contratación no es "¿deberíamos usar IA?". Es "¿la IA está asistiendo una decisión humana, o sustituyéndola?".

## Esto ya es un problema legal y regulatorio

Si el argumento ético no mueve a tu dirección, el de la responsabilidad debería. El cribado autónomo con IA está generando exposición legal real y certificada ahora mismo.

- **Mobley contra Workday.** Una demanda colectiva que alega que el cribado con IA de Workday discrimina por edad, raza y discapacidad. El tribunal admitió una teoría de responsabilidad por "agencia" en julio de 2024 (lo que significa que el propio proveedor de IA puede ser responsable), certificó una colectiva nacional bajo la ADEA en mayo de 2025, y las reclamaciones por edad continuaron en 2026. El demandante principal, un aspirante afroamericano, con discapacidad y mayor de 40 años, fue rechazado de más de 100 empleos.
- **EEOC contra iTutorGroup.** El primer acuerdo de la EEOC por discriminación en contratación con IA: **365 000 dólares**, después de que una herramienta rechazara automáticamente a mujeres de 55 años o más y a hombres de 60 o más.
- **Contexto regulatorio.** La Ley Local 144 de Nueva York exige auditorías de sesgo independientes anuales y aviso al candidato para las herramientas automatizadas de decisión en el empleo, con sanciones de entre 500 y 1500 dólares al día. La Ley de IA de la UE (2024) clasifica la IA de contratación como de alto riesgo.

En 2025 hubo un repliegue federal: la EEOC retiró sus directrices de 2023 sobre IA en contratación y una orden ejecutiva instruyó a las agencias a restar prioridad a la responsabilidad por impacto dispar. Pero la disposición sobre impacto dispar del Título VII y los demandantes privados siguen intactos. El riesgo no desapareció. **Se trasladó de la aplicación federal a los litigios privados**, que son más difíciles de cerrar de forma discreta.

## Cómo usar la IA en contratación sin dejar a la gente fuera

No tienes que elegir entre velocidad y equidad. Tienes que negarte a dejar que un modelo sea el portero. Cuatro principios, extraídos directamente de lo que el estudio reprocha:

1. **Haz que la IA sea asistiva, no autónoma.** Usa los modelos para resumir, destacar y contextualizar a los candidatos ante un lector humano, nunca para rechazar de forma automática. El patrón del "no recomendar que se salta la revisión humana" es exactamente lo que el artículo señala.
2. **Mantén a una persona en cada decisión.** Cada avance o rechazo debería ser una acción humana registrada, no una salida silenciosa de un modelo. Alguien que responda por ello, con la candidatura completa delante, toma la decisión.
3. **Haz que las etapas sean estructuradas y auditables.** Los candidatos deberían avanzar por etapas explícitas, nombradas y registradas, lo contrario de una puntuación opaca que "nunca ve una persona". Esta es la transparencia que piden tanto los investigadores como la Ley Local 144 de Nueva York.
4. **Deja pasar un subconjunto al azar.** El propio consejo de Bana a los empleadores: entiende qué selecciona y descarta tu algoritmo en cada puesto, y deja pasar un subconjunto aleatorio de aspirantes más allá de la primera etapa. Es una comprobación barata y potente contra la exclusión sistémica.

Una advertencia honesta: tener a una persona en el circuito **reduce** el sesgo, pero por sí solo no lo elimina. Las personas también arrastran sesgos. Lo importante es que una decisión humana es responsable, corregible e inspeccionable, mientras que un veredicto autónomo de un modelo que nadie ve no es nada de eso.

## Cómo está construido Kit para esto

Las herramientas de contratación de Kit son, por arquitectura, lo opuesto al diseño de pymetrics que describe el estudio. La IA asiste a las personas que contratan; nunca se interpone entre un candidato y una persona como una barrera.

- **La IA es asistiva para los revisores, nunca un portero autónomo.** La IA de Kit produce **resúmenes para personas**, destacando y contextualizando a un candidato para que un revisor pueda leer más rápido y con más justicia. El trabajo del modelo es ayudar a una persona a decidir, no descartar a nadie en silencio.
- **Las personas toman la decisión, y queda registrada.** Cada avance y cada rechazo pasa por una cola de decisiones pendientes como una acción humana deliberada. No existe el camino de "el modelo dijo no, el candidato desaparece".
- **Etapas estructuradas y auditables.** Los candidatos avanzan por etapas explícitas y nombradas, de modo que cada transición queda registrada y es revisable, lo contrario de una puntuación opaca que nadie ve jamás.
- **Sin monocultura silenciosa entre empleadores.** Kit es una herramienta por cuenta donde tu equipo es dueño de los criterios y de las decisiones. No hay un único clasificador mediando el embudo de todo un sector, así que la dinámica de "rechazado en los diez puestos por el mismo modelo" no aplica.

En Kit, un modelo nunca descarta a un candidato antes de que una persona lo vea. La IA redacta el resumen; una persona toma la decisión; cada etapa queda registrada.

<div class="blog-inline-cta">
  <p><strong>¿Quieres una IA que acelere la revisión sin convertirse en el juez?</strong> Los resúmenes asistivos de Kit ayudan a tu equipo a leer a los candidatos más rápido mientras una persona toma cada decisión de avance y rechazo, dejándola registrada.</p>
  <p><a href="/users/sign_up">Empieza tu prueba gratuita</a></p>
</div>

## La conclusión

La lección de 4,2 millones de candidaturas cribadas no es que la IA no tenga sitio en la contratación. Es que la IA nunca debería tener la última palabra. El fallo que documenta el estudio es la autonomía y la opacidad: un modelo que rechaza a personas cualificadas antes de que una persona las mire, replicado por todo un sector hasta que el rechazo se convierte en una puerta cerrada.

Mantén a la persona en el circuito. Haz que las etapas sean auditables. Deja pasar algo de aleatoriedad. Usa la IA para ayudar a tu equipo a ver a más candidatos con más justicia, no para decidir quién es invisible. El objetivo es simple, y es lo contrario de lo que advierten los titulares: **no prohíbas la IA en la contratación. Niégate a dejar que sea el portero.**

Si quieres ver en acción la IA asistiva junto con la revisión humana, puedes [explorar cómo Kit aborda la IA en contratación](/blog/what-is-ai-native-ats) o [empezar una prueba gratuita](/users/sign_up).