Stronniczość AI w rekrutacji to nie problem AI. To problem autonomii.

Badanie 4,2 mln aplikacji prowadzone przez Stanford wykazało, że narzędzia AI do screeningu odrzucają czarnoskórych kandydatów w skali całych branż. Rozwiązaniem nie jest zakaz AI, tylko utrzymanie człowieka w pętli decyzyjnej.

Ernest Bursa

Ernest Bursa

Founder · · 10 min czytania
A startup hiring manager reading a candidate summary on her laptop in a sunlit co-working loft, making the final call herself instead of letting a model decide

W 2026 roku badanie 4,2 miliona aplikacji o pracę, prowadzone przez zespół ze Stanford, wykazało, że narzędzia AI do screeningu potrafią odrzucać wykwalifikowanych kandydatów w skali całych branż, a nie tylko pojedynczych stanowisk. W zebranych danych 25,87% aplikacji od czarnoskórych kandydatów trafiło na stanowiska, których model wykazywał wobec nich niekorzystny wpływ, a 4% osób, które aplikowały na dziesięć ofert, zostało odrzuconych ze wszystkich dziesięciu. Przyczyną nie było „AI w rekrutacji”. Była nią konkretna decyzja projektowa: model, który odrzuca kandydatów, zanim zobaczy ich jakikolwiek człowiek, wdrożony przez wystarczająco wielu pracodawców w danej branży, by odfiltrować tę samą osobę wszędzie naraz.

Nagłówek, który wszyscy przeczytali, i liczba, która się pod nim kryje

Badanie napędzające ten cykl newsowy to „Algorithmic Monocultures in Hiring”, zaprezentowane na konferencji 2026 ACM Conference on Fairness, Accountability, and Transparency (FAccT ‘26) przez Rishiego Bommasaniego, Sarah H. Banę, Kathleen A. Creel, Dana Jurafsky’ego i Percy’ego Lianga. Troje z pięciorga autorów pracuje na Stanford, więc „prowadzone przez Stanford” jest uczciwym opisem — „w całości stanfordzkie” już nie.

To jak dotąd największe badanie wdrożonych decyzji rekrutacyjnych AI: 4 197 168 aplikacji od 3 372 132 kandydatów na 1746 stanowisk u 156 pracodawców w 11 branżach, o łącznym rocznym przychodzie bliskim 225 miliardom dolarów, obejmujące okres od grudnia 2018 do grudnia 2022. Każda liczba tutaj jest podana dosłownie za publikacją.

Wszystkie te aplikacje przeszły przez screening pymetrics, dostawcy oceny opartej na grach (przejętego przez Harver w sierpniu 2022). Kandydaci grają w 12–16 krótkich gier online, a klasyfikator dopasowany do konkretnego klienta zwraca „rekomenduję” albo „nie rekomenduję”. Średnio 41,8% aplikacji otrzymało „nie rekomenduję”, co publikacja traktuje jako odrzucenie.

Kiedy badacze przeanalizowali niekorzystny wpływ tak, jak faktycznie wymagają tego wytyczne obowiązujące w USA — per stanowisko, a nie zbiorczo — dysproporcje były jasne:

  • 25,87% aplikacji od czarnoskórych kandydatów trafiło na stanowiska, których model wykazywał wobec nich niekorzystny wpływ.
  • 30,70% czarnoskórych kandydatów aplikowało na co najmniej jedno stanowisko o niekorzystnym wpływie wobec czarnoskórych.
  • 10,62% z 1746 stanowisk wykazało niekorzystny wpływ wobec czarnoskórych kandydatów.
  • 14,74% aplikacji od kandydatów pochodzenia azjatyckiego trafiło na stanowiska o niekorzystnym wpływie wobec osób pochodzenia azjatyckiego.

To nie są skrajne przypadki ukryte w przypisie. To główny wniosek z największego zbioru rzeczywistych wyników rekrutacji AI, jaki ktokolwiek do tej pory zebrał.

Dlaczego chodzi o „całe branże”, a nie tylko „pojedyncze stanowiska”

Powodem, dla którego stronniczość na poziomie jednego stanowiska zamienia się w problem całej branży, jest monokultura algorytmiczna: gdy modele tego samego dostawcy pośredniczą w screeningu u wielu pracodawców, odrzucenie w jednej firmie przestaje być niezależne od odrzucenia w innej. Korzystają z tego samego modelu, więc dzielą te same martwe punkty.

Publikacja podaje to wprost. Spośród kandydatów aplikujących na dziesięć stanowisk 4% zostaje odrzuconych ze wszystkich dziesięciu. To więcej, niż przewidywałyby niezależne decyzje. Przy decyzjach naprawdę niezależnych szansa na porażkę wszędzie naraz spada szybko; tutaj spada wolniej niż przypadek, bo decyzje są skorelowane przez wspólny klasyfikator. Żeby zepchnąć wskaźnik systemowego odrzucenia poniżej 0,1%, kandydat musiałby wysłać 25 aplikacji zamiast 10.

A teraz dołóż do tego fakt, że pracodawcy z danej branży zwykle grupują się wokół jednego dostawcy. Publikacja wymienia finanse, produkcję i logistykę magazynową. Kandydat, którego cechy rozgrywki model akurat ocenia gorzej, nie traci jednej pracy. Może zostać odfiltrowany z całej dziedziny przez jeden klasyfikator, o którym nawet nie wiedział, że to on podejmuje decyzję. To różnica między nieudaną rozmową a zamkniętymi drzwiami.

Czy narzędzia AI do rekrutacji mogą być stronnicze rasowo?

Tak. Badanie 4,2 miliona aplikacji prowadzone przez zespół ze Stanford w 2026 roku wykazało, że 25,87% aplikacji od czarnoskórych kandydatów trafiło do modeli AI wykazujących wobec nich niekorzystny wpływ, a 4% osób aplikujących na dziesięć ofert zostało odrzuconych ze wszystkich dziesięciu. Stronniczość rzadko jest jawna. Bierze się z dyskryminacji przez proxy: model uczy się w danych behawioralnych albo danych z rozgrywki wzorców skorelowanych z rasą, a potem działa na ich podstawie, jakby były miarą kompetencji.

A teraz fragment, który powinien zaniepokoić każdego, kto czuje się bezpiecznie, bo jego dostawca „przeszedł audyt”. pymetrics rzeczywiście przeszedł. Niezależny audyt akademicki (Wilson i Mislove, FAccT 2021) wykazał, że narzędzie wiernie stosuje regułę czterech piątych na poziomie zbiorczym. Sednem nowego badania jest to, że audyty zbiorcze maskują dysproporcje na poziomie pojedynczego stanowiska. Kiedy zejdziesz do poziomu per stanowisko, którego faktycznie wymaga prawo USA (41 CFR 60-3.15.2(a)), niekorzystny wpływ wraca.

Jak ujęła to współautorka badania Sarah Bana, „zachowania wychwytywane przez gry funkcjonują jako proxy dla rasy”. Rishi Bommasani dodał, że „te stronniczości odzwierciedlają fakt, iż cechy rozgrywki są nierównomiernie rozłożone między grupami rasowymi”. Lekcja jest brutalnie prosta: „zaudytowaliśmy nasz model” to nie to samo co „żaden kandydat nie poniósł szkody”.

Prawdziwy tryb awarii to autonomia, nie AI

Najważniejsze zdanie w całej publikacji nie jest statystyką. To opis tego, co dzieje się po tym, jak model się wypowie. Gdy algorytm zwraca „nie rekomenduję”, kandydat — cytując autorów — „prawdopodobnie zostanie odrzucony bez rozpatrzenia przez człowieka”. Narzędzia „kształtują to, których kandydatów rozważa się na rozmowę, a których aplikacji nigdy nie zobaczy człowiek”.

Przeczytaj to jeszcze raz. Szkodą nie jest to, że model wyrobił sobie zdanie. Szkodą jest to, że to zdanie było ostateczne i niewidoczne. Żaden recenzent nie zobaczył kandydata. Nikt nie zważył pełnej aplikacji. Nikt nie odpowiadał za odrzucenie i nikt nie mógł go skorygować.

To zmienia ramy całej debaty. Problem udokumentowany na 4,2 miliona aplikacji to nie inteligencja, tylko autonomia plus nieprzejrzystość w skali. Model, który tworzy podsumowanie do przeczytania przez człowieka, nie jest w stanie zamknąć nikomu drogi do całej branży. Model, który wydaje wyrok, zanim spojrzy człowiek — owszem, zwłaszcza gdy ten sam model podejmuje decyzję wszędzie naraz.

Pytanie projektowe dla każdego zespołu używającego AI w rekrutacji nie brzmi więc „czy powinniśmy używać AI?”. Brzmi: „czy AI wspiera decyzję człowieka, czy ją zastępuje?”.

To już jest problem prawny i regulacyjny

Jeśli argument etyczny nie poruszy twojego zarządu, powinien poruszyć argument o odpowiedzialności. Autonomiczny screening AI generuje już teraz realną, potwierdzoną przez sądy ekspozycję prawną.

  • Mobley v. Workday. Pozew zbiorowy zarzucający, że screening AI Workday dyskryminuje ze względu na wiek, rasę i niepełnosprawność. Sąd dopuścił teorię odpowiedzialności „agenta” w lipcu 2024 (co oznacza, że na haku może być sam dostawca AI), certyfikował ogólnokrajowy pozew zbiorowy w ramach ADEA w maju 2025, a roszczenia dotyczące wieku ciągnęły się w 2026 roku. Główny powód — czarnoskóry, niepełnosprawny kandydat po czterdziestce — został odrzucony z ponad 100 ofert.
  • EEOC v. iTutorGroup. Pierwsza ugoda EEOC w sprawie dyskryminacji rekrutacyjnej przez AI: 365 000 dolarów, po tym jak narzędzie automatycznie odrzucało kobiety 55+ i mężczyzn 60+.
  • Tło regulacyjne. NYC Local Law 144 wymaga corocznych niezależnych audytów stronniczości oraz powiadomienia kandydata przy zautomatyzowanych narzędziach decyzji rekrutacyjnych, pod groźbą kar od 500 do 1500 dolarów dziennie. Unijny AI Act (2024) klasyfikuje AI rekrutacyjne jako wysokiego ryzyka.

W 2025 roku doszło do odwrotu na poziomie federalnym: EEOC wycofał swoje wytyczne dotyczące AI w rekrutacji z 2023 roku, a rozporządzenie wykonawcze nakazało agencjom zdjąć priorytet z odpowiedzialności za niekorzystny wpływ. Ale przepis Title VII o niekorzystnym wpływie i prywatni powodowie pozostają nietknięci. Ryzyko nie zniknęło. Przesunęło się z egzekwowania federalnego do pozwów prywatnych, które trudniej wyciszyć ugodą.

Jak używać AI w rekrutacji, nie zamykając ludziom drzwi

Nie musisz wybierać między szybkością a uczciwością. Musisz odmówić oddania roli strażnika modelowi. Cztery zasady, wzięte wprost z tego, co badanie wytyka:

  1. Niech AI wspiera, a nie działa autonomicznie. Używaj modeli do podsumowywania, wydobywania i kontekstualizowania kandydatów dla człowieka czytającego — nigdy do automatycznego odrzucania. Wzorzec „nie rekomenduję, które omija przegląd przez człowieka” to dokładnie to, co publikacja piętnuje.
  2. Trzymaj człowieka w każdej decyzji. Każde przesunięcie dalej i każde odrzucenie powinno być zalogowanym działaniem człowieka, a nie cichym wynikiem modelu. Decyzję podejmuje ktoś odpowiedzialny, z pełną aplikacją przed oczami.
  3. Niech etapy będą ustrukturyzowane i audytowalne. Kandydaci powinni przechodzić przez jawne, nazwane, zalogowane etapy — przeciwieństwo nieprzejrzystego wyniku, którego „nigdy nie zobaczył człowiek”. O taką przejrzystość proszą zarówno badacze, jak i NYC LL144.
  4. Przepuszczaj losową próbkę. Własna rada Bany dla pracodawców: zrozum, kogo twój algorytm wpuszcza i kogo odsiewa per stanowisko, i przepuszczaj losową próbkę kandydatów przez pierwszy etap. To tani, mocny mechanizm kontroli przeciw systemowemu wykluczeniu.

Uczciwe zastrzeżenie: człowiek w pętli redukuje stronniczość, sam z siebie jej nie eliminuje. Ludzie też noszą w sobie uprzedzenia. Rzecz w tym, że decyzja człowieka jest rozliczalna, korygowalna i możliwa do skontrolowania — a autonomiczny wyrok modelu, którego nikt nie widzi, nie jest żadną z tych rzeczy.

Jak Kit jest pod to zbudowany

Narzędzia rekrutacyjne Kit są, z założenia architektonicznego, odwrotnością projektu pymetrics opisanego w badaniu. AI wspiera ludzi prowadzących rekrutację; nigdy nie staje między kandydatem a człowiekiem jako bramka.

  • AI wspiera recenzentów, nigdy nie jest autonomicznym strażnikiem. AI w Kit tworzy podsumowania dla ludzi, wydobywając i kontekstualizując kandydata, by recenzent mógł czytać szybciej i sprawiedliwiej. Zadaniem modelu jest pomóc człowiekowi zdecydować, a nie po cichu kogoś odsiać.
  • Decyzję podejmują ludzie, na piśmie. Każde przesunięcie dalej i każde odrzucenie przechodzi przez kolejkę oczekujących decyzji jako świadome działanie człowieka. Nie ma ścieżki „model powiedział nie, kandydat znika”.
  • Ustrukturyzowane, audytowalne etapy. Kandydaci przechodzą przez jawne, nazwane etapy, więc każde przejście jest zalogowane i możliwe do przejrzenia — przeciwieństwo nieprzejrzystego wyniku, którego nikt nigdy nie widzi.
  • Brak cichej monokultury między pracodawcami. Kit to narzędzie per konto, w którym twój zespół jest właścicielem kryteriów i decyzji. Nie ma jednego klasyfikatora pośredniczącego w lejku całej branży, więc dynamika „odrzucony ze wszystkich dziesięciu stanowisk przez ten sam model” tu nie zachodzi.

W Kit model nigdy nie odfiltrowuje kandydata, zanim zobaczy go człowiek. AI pisze podsumowanie; decyzję podejmuje człowiek; każdy etap jest na piśmie.

Wnioski

Lekcją z 4,2 miliona poddanych screeningowi aplikacji nie jest to, że AI nie ma miejsca w rekrutacji. Jest nią to, że AI nigdy nie powinno mieć ostatniego słowa. Awaria udokumentowana w badaniu to autonomia i nieprzejrzystość: model, który odrzuca wykwalifikowanych ludzi, zanim spojrzy człowiek, powielony w skali całej branży, aż odrzucenie zamieni się w zamknięte drzwi.

Trzymaj człowieka w pętli. Niech etapy będą audytowalne. Przepuść trochę losowości. Używaj AI, żeby pomóc zespołowi zobaczyć więcej kandydatów sprawiedliwiej, a nie żeby decydować, kto jest niewidzialny. Cel jest prosty i jest przeciwieństwem tego, przed czym ostrzegają nagłówki: nie zakazuj AI w rekrutacji. Odmów oddania mu roli strażnika.

Jeśli chcesz zobaczyć wspierające AI w połączeniu z przeglądem przez człowieka w praktyce, możesz poznać podejście Kit do AI w rekrutacji albo rozpocząć darmowy okres próbny.

Powiazane artykuly

Gotowy na madrzejsza rekrutacje?

Zacznij za darmo. Bez karty kredytowej. Skonfiguruj swoj pierwszy pipeline rekrutacyjny w kilka minut.

Zacznij za darmo