El sesgo de la IA en contratación no es un problema de IA. Es un problema de autonomía.

Un estudio liderado por Stanford sobre 4,2 millones de candidaturas reveló que los filtros con IA rechazan a candidatos negros en sectores enteros. La solución no es prohibir la IA, sino mantener a una persona en el circuito.

Ernest Bursa

Founder · 10 de junio de 2026 · 10 min de lectura

A startup hiring manager reading a candidate summary on her laptop in a sunlit co-working loft, making the final call herself instead of letting a model decide

Un estudio de 2026 liderado por Stanford sobre 4,2 millones de candidaturas de empleo descubrió que las herramientas de cribado con IA pueden rechazar a candidatos cualificados en sectores enteros, no solo en puestos concretos. En los datos, el 25,87 % de las candidaturas de personas negras fueron a parar a puestos cuyo modelo mostraba impacto adverso contra ellas, y el 4 % de quienes se postularon a diez puestos fueron rechazados en los diez. La causa no fue “la IA en contratación”. Fue una decisión de diseño concreta: un modelo que rechaza a los candidatos antes de que ninguna persona los vea, desplegado por suficientes empleadores de un sector como para descartar a la misma persona en todas partes a la vez.

El titular que todos leyeron, y el número que hay debajo

El estudio que está marcando el ciclo de noticias es “Algorithmic Monocultures in Hiring”, presentado en la Conferencia ACM sobre Equidad, Responsabilidad y Transparencia de 2026 (FAccT ’26) por Rishi Bommasani, Sarah H. Bana, Kathleen A. Creel, Dan Jurafsky y Percy Liang. Tres de los cinco autores están en Stanford, así que “liderado por Stanford” es justo; “íntegramente de Stanford” no.

Es el mayor estudio sobre decisiones de contratación con IA ya desplegada hasta la fecha: 4 197 168 candidaturas de 3 372 132 aspirantes a 1746 puestos repartidos entre 156 empleadores de 11 sectores, con una facturación anual combinada cercana a los 225 000 millones de dólares, abarcando de diciembre de 2018 a diciembre de 2022. Cada cifra aquí es literal del artículo.

Todas esas candidaturas fueron cribadas por pymetrics, un proveedor de evaluaciones basadas en juegos (adquirido por Harver en agosto de 2022). Los aspirantes juegan de 12 a 16 minijuegos online, y un clasificador específico para cada cliente devuelve “recomendar” o “no recomendar”. De media, el 41,8 % de las candidaturas resultaron “no recomendadas”, lo que el artículo trata como rechazo.

Cuando los investigadores analizaron el impacto adverso tal y como realmente exigen las directrices de EE. UU., por puesto en lugar de en conjunto, las disparidades quedaron claras:

El 25,87 % de las candidaturas de personas negras fue a parar a puestos cuyo modelo mostraba impacto adverso contra ellas.
El 30,70 % de los aspirantes negros se postuló al menos a un puesto que perjudica a las personas negras.
El 10,62 % de los 1746 puestos mostró impacto adverso contra las personas negras.
El 14,74 % de las candidaturas de personas asiáticas fue a parar a puestos con impacto adverso contra las personas asiáticas.

No son casos aislados enterrados en una nota a pie de página. Son el hallazgo central del mayor conjunto de datos sobre resultados reales de contratación con IA que nadie haya reunido.

Por qué son “sectores enteros” y no solo “puestos concretos”

La razón por la que un sesgo a nivel de puesto se convierte en un problema que afecta a todo un sector es la monocultura algorítmica: cuando los modelos del mismo proveedor median el cribado en muchos empleadores, un rechazo en una empresa deja de ser independiente del rechazo en otra. Comparten el mismo modelo, así que comparten los mismos puntos ciegos.

El artículo lo cuantifica directamente. De los aspirantes que se postulan a diez puestos, el 4 % es rechazado en los diez. Eso es más de lo que predeciría una toma de decisiones independiente. Con decisiones genuinamente independientes, la probabilidad de fallar en todas partes cae rápido; aquí cae más despacio que el azar, porque las decisiones están correlacionadas por un clasificador compartido. Para reducir la tasa de rechazo sistémico por debajo del 0,1 %, un aspirante tendría que enviar 25 candidaturas en lugar de 10.

Ahora súmale el hecho de que los empleadores de un mismo sector tienden a concentrarse en el mismo proveedor. El artículo menciona las finanzas, la industria manufacturera y la logística de almacén. Un candidato cuyas características de juego el modelo casualmente desfavorece no pierde un empleo. Puede quedar descartado de todo un campo profesional por un único clasificador del que nunca supo que estaba decidiendo. Esa es la diferencia entre una entrevista que sale mal y una puerta cerrada.

¿Pueden las herramientas de contratación con IA tener sesgo racial?

Sí. Un estudio de 2026 liderado por Stanford sobre 4,2 millones de candidaturas descubrió que el 25,87 % de las candidaturas de personas negras fue a parar a modelos de IA que mostraban impacto adverso contra ellas, y que el 4 % de quienes se postularon a diez puestos fueron rechazados en los diez. El sesgo rara vez es explícito. Procede de la discriminación por variables sustitutivas: el modelo aprende patrones en los datos de comportamiento o de juego que correlacionan con la raza, y luego actúa sobre esos patrones como si fueran mérito.

Aquí viene la parte que debería inquietar a cualquiera que se sienta a salvo porque su proveedor “pasó una auditoría”. pymetrics sí pasó una. Una auditoría académica independiente (Wilson y Mislove, FAccT 2021) determinó que implementaba fielmente la regla de los cuatro quintos sobre una base agregada. Lo que demuestra el nuevo estudio es que las auditorías agregadas enmascaran las disparidades por puesto.

Cuando desglosas puesto por puesto, reaparece la discriminación indirecta que prohíben la ley española y la europea: un criterio, práctica o sistema de selección aparentemente neutro que coloca a un grupo protegido en una situación de desventaja particular (Ley 15/2022, de 12 de julio, integral para la igualdad de trato y la no discriminación, y las Directivas 2000/43/CE y 2000/78/CE). Y aquí hay una diferencia de fondo: a diferencia de la regla numérica estadounidense, el test europeo es cualitativo —basta con esa desventaja particular, sin un umbral fijo del 80 %—, así que una disparidad por puesto que un promedio agregado disimula puede ser igualmente ilícita.

Como lo expresó Sarah Bana, coautora del estudio, los “comportamientos que los juegos captan están funcionando como variables sustitutivas de la raza”. Rishi Bommasani añadió que los “sesgos reflejan que las características de juego están distribuidas de forma desigual entre los grupos raciales”. La lección es contundente: “auditamos nuestro modelo” no es lo mismo que “ningún candidato resulta perjudicado”.

El verdadero modo de fallo es la autonomía, no la IA

La frase más importante del artículo no es una estadística. Es una descripción de lo que ocurre después de que el modelo habla. Cuando el algoritmo devuelve “no recomendar”, el aspirante, en palabras de los autores, “probablemente será rechazado sin que ninguna persona lo considere”. Las herramientas “determinan qué aspirantes se consideran para una entrevista y qué candidaturas no ve nunca una persona”.

Léelo otra vez. El daño no es que un modelo se formara una opinión. El daño es que la opinión fue definitiva e invisible. Ningún revisor vio al candidato. Nadie sopesó la candidatura completa. Nadie respondió por el rechazo, y nadie pudo corregirlo.

Esto replantea todo el debate. El problema documentado a lo largo de 4,2 millones de candidaturas no es la inteligencia; es autonomía más opacidad a escala. Un modelo que redacta un resumen para que lo lea una persona no puede cerrarle a nadie las puertas de un sector. Un modelo que dicta un veredicto antes de que una persona lo mire, sí puede, sobre todo cuando es el mismo modelo el que toma esa decisión en todas partes a la vez.

Así que la pregunta de diseño para cualquier equipo que use IA en contratación no es “¿deberíamos usar IA?”. Es “¿la IA está asistiendo una decisión humana, o sustituyéndola?”.

Contexto local

En la UE esta pregunta tiene además fuerza legal. El Reglamento (UE) 2024/1689 (Reglamento de Inteligencia Artificial) clasifica la IA de selección de personal como de alto riesgo (Anexo III, punto 4) y exige una supervisión humana efectiva: un “no recomendar” autónomo que nadie revisa es justo el patrón que la norma busca acotar. Y en España, antes de desplegar un sistema así, el empleador debe informar a la representación legal de los trabajadores de su lógica y sus parámetros (art. 64.4.d del Estatuto de los Trabajadores). Mantener a una persona en el circuito no es solo buena práctica: es lo que marca la normativa.

Esto ya es un problema legal y regulatorio

Si el argumento ético no mueve a tu dirección, el de la responsabilidad debería. El cribado autónomo con IA genera exposición legal real ahora mismo, también en España.

Discriminación indirecta. Un criterio o sistema de selección aparentemente neutro que coloca a un grupo protegido en una situación de desventaja particular es discriminación indirecta, prohibida en el acceso al empleo por la Ley 15/2022, de 12 de julio, integral para la igualdad de trato y la no discriminación, y por las Directivas europeas 2000/43/CE y 2000/78/CE. Las reclamaciones se ventilan ante la jurisdicción social y las vigila la Inspección de Trabajo y Seguridad Social; además, en los casos de discriminación se invierte la carga de la prueba: es el empleador quien debe demostrar que su criterio de selección era objetivo y proporcionado (Ley 15/2022 y Ley 36/2011, reguladora de la jurisdicción social). Todavía no hay en España una sentencia de referencia sobre cribado algorítmico discriminatorio, pero la exposición legal ya existe por esta vía ordinaria: un filtro automático que descarte, por ejemplo, por edad o por sexo encajaría de lleno en esa prohibición. (En EE. UU., el caso Mobley contra Workday —una demanda colectiva contra un proveedor de cribado con IA— da una idea de hacia dónde apunta el litigio internacional.)
Transparencia algorítmica. El artículo 64.4.d del Estatuto de los Trabajadores (incorporado por la “Ley Rider”, Ley 12/2021) da a la representación legal de los trabajadores el derecho a ser informada de los parámetros, las reglas y las instrucciones en que se basan los algoritmos o sistemas de IA que afectan al acceso y mantenimiento del empleo, a las condiciones de trabajo y a la elaboración de perfiles. A diferencia de la Ley Local 144 de Nueva York, no hay aquí un régimen de multa diaria ni un aviso individual a cada candidato: el derecho corresponde al comité de empresa, y existe aunque la decisión no sea totalmente automática.
Reglamento de IA de la UE. El Reglamento (UE) 2024/1689 (Reglamento de Inteligencia Artificial), directamente aplicable en España, clasifica la IA de contratación y selección de personas como de alto riesgo (Anexo III, punto 4). Esa clasificación obliga a garantizar supervisión humana efectiva, trazabilidad y transparencia. En España, su supervisión corresponde a la AESIA (Agencia Española de Supervisión de la Inteligencia Artificial).

Nada de esto necesita una orden ejecutiva ni un regulador específico de IA para activarse: la discriminación indirecta ya es accionable hoy ante los tribunales sociales, y es el empleador quien tiene que probar que su criterio era objetivo y proporcionado.

Cómo usar la IA en contratación sin dejar a la gente fuera

No tienes que elegir entre velocidad y equidad. Tienes que negarte a dejar que un modelo sea el portero. Cuatro principios, extraídos directamente de lo que el estudio reprocha:

Haz que la IA sea asistiva, no autónoma. Usa los modelos para resumir, destacar y contextualizar a los candidatos ante un lector humano, nunca para rechazar de forma automática. El patrón del “no recomendar que se salta la revisión humana” es exactamente lo que el artículo señala.
Mantén a una persona en cada decisión. Cada avance o rechazo debería ser una acción humana registrada, no una salida silenciosa de un modelo. Alguien que responda por ello, con la candidatura completa delante, toma la decisión.
Haz que las etapas sean estructuradas y auditables. Los candidatos deberían avanzar por etapas explícitas, nombradas y registradas, lo contrario de una puntuación opaca que “nunca ve una persona”. Esta es la transparencia que piden tanto los investigadores como la normativa española y europea (el deber de información a la representación de los trabajadores del artículo 64.4.d del Estatuto de los Trabajadores).
Deja pasar un subconjunto al azar. El propio consejo de Bana a los empleadores: entiende qué selecciona y descarta tu algoritmo en cada puesto, y deja pasar un subconjunto aleatorio de aspirantes más allá de la primera etapa. Es una comprobación barata y potente contra la exclusión sistémica.

Una advertencia honesta: tener a una persona en el circuito reduce el sesgo, pero por sí solo no lo elimina. Las personas también arrastran sesgos. Lo importante es que una decisión humana es responsable, corregible e inspeccionable, mientras que un veredicto autónomo de un modelo que nadie ve no es nada de eso.

Cómo está construido Kit para esto

Las herramientas de contratación de Kit son, por arquitectura, lo opuesto al diseño de pymetrics que describe el estudio. La IA asiste a las personas que contratan; nunca se interpone entre un candidato y una persona como una barrera.

La IA es asistiva para los revisores, nunca un portero autónomo. La IA de Kit produce resúmenes para personas, destacando y contextualizando a un candidato para que un revisor pueda leer más rápido y con más justicia. El trabajo del modelo es ayudar a una persona a decidir, no descartar a nadie en silencio.
Las personas toman la decisión, y queda registrada. Cada avance y cada rechazo pasa por una cola de decisiones pendientes como una acción humana deliberada. No existe el camino de “el modelo dijo no, el candidato desaparece”.
Etapas estructuradas y auditables. Los candidatos avanzan por etapas explícitas y nombradas, de modo que cada transición queda registrada y es revisable, lo contrario de una puntuación opaca que nadie ve jamás.
Sin monocultura silenciosa entre empleadores. Kit es una herramienta por cuenta donde tu equipo es dueño de los criterios y de las decisiones. No hay un único clasificador mediando el embudo de todo un sector, así que la dinámica de “rechazado en los diez puestos por el mismo modelo” no aplica.

En Kit, un modelo nunca descarta a un candidato antes de que una persona lo vea. La IA redacta el resumen; una persona toma la decisión; cada etapa queda registrada.

La conclusión

La lección de 4,2 millones de candidaturas cribadas no es que la IA no tenga sitio en la contratación. Es que la IA nunca debería tener la última palabra. El fallo que documenta el estudio es la autonomía y la opacidad: un modelo que rechaza a personas cualificadas antes de que una persona las mire, replicado por todo un sector hasta que el rechazo se convierte en una puerta cerrada.

Mantén a la persona en el circuito. Haz que las etapas sean auditables. Deja pasar algo de aleatoriedad. Usa la IA para ayudar a tu equipo a ver a más candidatos con más justicia, no para decidir quién es invisible. El objetivo es simple, y es lo contrario de lo que advierten los titulares: no prohíbas la IA en la contratación. Niégate a dejar que sea el portero.

Si quieres ver en acción la IA asistiva junto con la revisión humana, puedes explorar cómo Kit aborda la IA en contratación o empezar una prueba gratuita.

El sesgo de la IA en contratación no es un problema de IA. Es un problema de autonomía.

El titular que todos leyeron, y el número que hay debajo

Por qué son “sectores enteros” y no solo “puestos concretos”

¿Pueden las herramientas de contratación con IA tener sesgo racial?

El verdadero modo de fallo es la autonomía, no la IA

Esto ya es un problema legal y regulatorio

Cómo usar la IA en contratación sin dejar a la gente fuera

Cómo está construido Kit para esto

La conclusión

Artículos relacionados

¿Listo para contratar de forma más inteligente?

El titular que todos leyeron, y el número que hay debajo

Por qué son “sectores enteros” y no solo “puestos concretos”

¿Pueden las herramientas de contratación con IA tener sesgo racial?

El verdadero modo de fallo es la autonomía, no la IA

Esto ya es un problema legal y regulatorio

Cómo usar la IA en contratación sin dejar a la gente fuera

Cómo está construido Kit para esto

La conclusión

Artículos relacionados

La guerra de productos ATS en 2026: qué quieren de verdad los reclutadores

Hacer trampas con IA en las entrevistas ya es la norma. Aquí tienes la solución

Tus candidatos creen que tu reclutador es falso. Demuéstrales que es real.

Se acaba de abrir la ventana del talento en seguridad: recortes en CISA + cierre de Huntr

Ya hay agentes de IA entrevistando a candidatos. ¿Debería hacerlo el tuyo?

Los consejos de IA en contratación te dan más confianza y más errores

¿Listo para contratar de forma más inteligente?