Stronniczość AI w rekrutacji to nie problem AI. To problem autonomii.

Badanie 4,2 mln aplikacji prowadzone przez Stanford wykazało, że narzędzia AI do screeningu odrzucają czarnoskórych kandydatów w skali całych branż. Rozwiązaniem nie jest zakaz AI, tylko utrzymanie człowieka w pętli decyzyjnej.

Ernest Bursa

Founder · 10 czerwca 2026 · 10 min czytania

A startup hiring manager reading a candidate summary on her laptop in a sunlit co-working loft, making the final call herself instead of letting a model decide

W 2026 roku badanie 4,2 miliona aplikacji o pracę, prowadzone przez zespół ze Stanford, wykazało, że narzędzia AI do screeningu potrafią odrzucać wykwalifikowanych kandydatów w skali całych branż, a nie tylko pojedynczych stanowisk. W zebranych danych 25,87% aplikacji od czarnoskórych kandydatów trafiło na stanowiska, których model wykazywał wobec nich niekorzystny wpływ, a 4% osób, które aplikowały na dziesięć ofert, zostało odrzuconych ze wszystkich dziesięciu. Przyczyną nie było „AI w rekrutacji”. Była nią konkretna decyzja projektowa: model, który odrzuca kandydatów, zanim zobaczy ich jakikolwiek człowiek, wdrożony przez wystarczająco wielu pracodawców w danej branży, by odfiltrować tę samą osobę wszędzie naraz.

Nagłówek, który wszyscy przeczytali, i liczba, która się pod nim kryje

Badanie napędzające ten cykl newsowy to „Algorithmic Monocultures in Hiring”, zaprezentowane na konferencji 2026 ACM Conference on Fairness, Accountability, and Transparency (FAccT ‘26) przez Rishiego Bommasaniego, Sarah H. Banę, Kathleen A. Creel, Dana Jurafsky’ego i Percy’ego Lianga. Troje z pięciorga autorów pracuje na Stanford, więc „prowadzone przez Stanford” jest uczciwym opisem — „w całości stanfordzkie” już nie.

To jak dotąd największe badanie wdrożonych decyzji rekrutacyjnych AI: 4 197 168 aplikacji od 3 372 132 kandydatów na 1746 stanowisk u 156 pracodawców w 11 branżach, o łącznym rocznym przychodzie bliskim 225 miliardom dolarów, obejmujące okres od grudnia 2018 do grudnia 2022. Każda liczba tutaj jest podana dosłownie za publikacją.

Wszystkie te aplikacje przeszły przez screening pymetrics, dostawcy oceny opartej na grach (przejętego przez Harver w sierpniu 2022). Kandydaci grają w 12–16 krótkich gier online, a klasyfikator dopasowany do konkretnego klienta zwraca „rekomenduję” albo „nie rekomenduję”. Średnio 41,8% aplikacji otrzymało „nie rekomenduję”, co publikacja traktuje jako odrzucenie.

Kiedy badacze przeanalizowali niekorzystny wpływ tak, jak nakazuje logika zakazu dyskryminacji pośredniej — per stanowisko, a nie zbiorczo — dysproporcje były jasne:

25,87% aplikacji od czarnoskórych kandydatów trafiło na stanowiska, których model wykazywał wobec nich niekorzystny wpływ.
30,70% czarnoskórych kandydatów aplikowało na co najmniej jedno stanowisko o niekorzystnym wpływie wobec czarnoskórych.
10,62% z 1746 stanowisk wykazało niekorzystny wpływ wobec czarnoskórych kandydatów.
14,74% aplikacji od kandydatów pochodzenia azjatyckiego trafiło na stanowiska o niekorzystnym wpływie wobec osób pochodzenia azjatyckiego.

To nie są skrajne przypadki ukryte w przypisie. To główny wniosek z największego zbioru rzeczywistych wyników rekrutacji AI, jaki ktokolwiek do tej pory zebrał.

Dlaczego chodzi o „całe branże”, a nie tylko „pojedyncze stanowiska”

Powodem, dla którego stronniczość na poziomie jednego stanowiska zamienia się w problem całej branży, jest monokultura algorytmiczna: gdy modele tego samego dostawcy pośredniczą w screeningu u wielu pracodawców, odrzucenie w jednej firmie przestaje być niezależne od odrzucenia w innej. Korzystają z tego samego modelu, więc dzielą te same martwe punkty.

Publikacja podaje to wprost. Spośród kandydatów aplikujących na dziesięć stanowisk 4% zostaje odrzuconych ze wszystkich dziesięciu. To więcej, niż przewidywałyby niezależne decyzje. Przy decyzjach naprawdę niezależnych szansa na porażkę wszędzie naraz spada szybko; tutaj spada wolniej niż przypadek, bo decyzje są skorelowane przez wspólny klasyfikator. Żeby zepchnąć wskaźnik systemowego odrzucenia poniżej 0,1%, kandydat musiałby wysłać 25 aplikacji zamiast 10.

A teraz dołóż do tego fakt, że pracodawcy z danej branży zwykle grupują się wokół jednego dostawcy. Publikacja wymienia finanse, produkcję i logistykę magazynową. Kandydat, którego cechy rozgrywki model akurat ocenia gorzej, nie traci jednej pracy. Może zostać odfiltrowany z całej dziedziny przez jeden klasyfikator, o którym nawet nie wiedział, że to on podejmuje decyzję. To różnica między nieudaną rozmową a zamkniętymi drzwiami.

Czy narzędzia AI do rekrutacji mogą być stronnicze rasowo?

Tak. Badanie 4,2 miliona aplikacji prowadzone przez zespół ze Stanford w 2026 roku wykazało, że 25,87% aplikacji od czarnoskórych kandydatów trafiło do modeli AI wykazujących wobec nich niekorzystny wpływ, a 4% osób aplikujących na dziesięć ofert zostało odrzuconych ze wszystkich dziesięciu. Stronniczość rzadko jest jawna. Bierze się z dyskryminacji przez proxy: model uczy się w danych behawioralnych albo danych z rozgrywki wzorców skorelowanych z rasą, a potem działa na ich podstawie, jakby były miarą kompetencji.

A teraz fragment, który powinien zaniepokoić każdego, kto czuje się bezpiecznie, bo jego dostawca „przeszedł audyt”. pymetrics rzeczywiście przeszedł. Niezależny audyt akademicki (Wilson i Mislove, FAccT 2021) wykazał, że narzędzie wiernie stosuje regułę czterech piątych na poziomie zbiorczym. Sednem nowego badania jest to, że audyty zbiorcze maskują dysproporcje na poziomie pojedynczego stanowiska. Kiedy zejdziesz na poziom pojedynczego stanowiska, niekorzystny wpływ wraca — a takie per-stanowiskowe dysproporcje nie obroniłyby się w teście dyskryminacji pośredniej, który — inaczej niż amerykańska reguła czterech piątych — nie opiera się na sztywnym progu liczbowym, lecz na obiektywnym uzasadnieniu.

Jak ujęła to współautorka badania Sarah Bana, „zachowania wychwytywane przez gry funkcjonują jako proxy dla rasy”. Rishi Bommasani dodał, że „te stronniczości odzwierciedlają fakt, iż cechy rozgrywki są nierównomiernie rozłożone między grupami rasowymi”. Lekcja jest brutalnie prosta: „zaudytowaliśmy nasz model” to nie to samo co „żaden kandydat nie poniósł szkody”.

Prawdziwy tryb awarii to autonomia, nie AI

Najważniejsze zdanie w całej publikacji nie jest statystyką. To opis tego, co dzieje się po tym, jak model się wypowie. Gdy algorytm zwraca „nie rekomenduję”, kandydat — cytując autorów — „prawdopodobnie zostanie odrzucony bez rozpatrzenia przez człowieka”. Narzędzia „kształtują to, których kandydatów rozważa się na rozmowę, a których aplikacji nigdy nie zobaczy człowiek”.

Przeczytaj to jeszcze raz. Szkodą nie jest to, że model wyrobił sobie zdanie. Szkodą jest to, że to zdanie było ostateczne i niewidoczne. Żaden recenzent nie zobaczył kandydata. Nikt nie zważył pełnej aplikacji. Nikt nie odpowiadał za odrzucenie i nikt nie mógł go skorygować.

To zmienia ramy całej debaty. Problem udokumentowany na 4,2 miliona aplikacji to nie inteligencja, tylko autonomia plus nieprzejrzystość w skali. Model, który tworzy podsumowanie do przeczytania przez człowieka, nie jest w stanie zamknąć nikomu drogi do całej branży. Model, który wydaje wyrok, zanim spojrzy człowiek — owszem, zwłaszcza gdy ten sam model podejmuje decyzję wszędzie naraz.

Pytanie projektowe dla każdego zespołu używającego AI w rekrutacji nie brzmi więc „czy powinniśmy używać AI?”. Brzmi: „czy AI wspiera decyzję człowieka, czy ją zastępuje?”.

To już jest problem prawny i regulacyjny

Jeśli argument etyczny nie poruszy twojego zarządu, powinien poruszyć argument o odpowiedzialności. W Polsce i w całej UE autonomiczny screening AI nie jest prawną szarą strefą — wpada wprost w trzy reżimy, z których jeden obowiązuje już dziś, a kolejny właśnie wchodzi w życie.

RODO, art. 22 — i to już teraz. Rozporządzenie (UE) 2016/679 zakazuje podejmowania decyzji opartych wyłącznie na zautomatyzowanym przetwarzaniu, w tym profilowaniu, jeśli wywołują one skutki prawne lub podobnie istotne — a odrzucenie aplikacji takim skutkiem jest. Kandydatowi przysługuje egzekwowalne prawo do interwencji człowieka, przedstawienia własnego stanowiska i zakwestionowania decyzji. Mówiąc wprost: model, który odrzuca kandydata, zanim spojrzy na niego człowiek, jest w polskim prawie wadliwy z definicji.
Unijny AI Act (rozporządzenie 2024/1689). Załącznik III pkt 4 lit. a) klasyfikuje AI do rekrutacji i selekcji — publikowanie ogłoszeń, filtrowanie aplikacji, ocenę kandydatów — jako system wysokiego ryzyka. To pociąga za sobą obowiązkowy nadzór człowieka, przejrzystość, ład nad danymi oraz obowiązek informowania kandydatów. (Ocena skutków dla praw podstawowych z art. 27 obejmuje wyłącznie podmioty publiczne i podmioty świadczące usługi publiczne, więc prywatnego pracodawcy zwykle nie dotyczy.) Obowiązki te wchodzą w życie etapami, a maksymalne kary przewidziane w rozporządzeniu sięgają 35 mln euro albo 7% globalnego obrotu.
Kodeks pracy, art. 18(3a)–18(3e). Zakaz dyskryminacji pośredniej: pozornie neutralne kryterium, które stawia osoby z grupy chronionej w szczególnie niekorzystnej sytuacji, jest niezgodne z prawem, chyba że da się je obiektywnie uzasadnić. To dokładnie ten sam mechanizm, który opisuje badanie — per-stanowiskowe dysproporcje, których zbiorczy audyt nie wychwytuje, nie przejdą testu dyskryminacji pośredniej.

W Polsce nie ma jednego odpowiednika amerykańskiego EEOC. Skargę na decyzję podjętą wyłącznie automatycznie rozpatruje Prezes UODO; roszczenia o dyskryminację w zatrudnieniu trafiają do sądów pracy i w pole działania Państwowej Inspekcji Pracy, a funkcję organu ds. równego traktowania pełni Rzecznik Praw Obywatelskich. Kierunek jest tu odwrotny niż za oceanem: w UE regulacja się zacieśnia, a nie wycofuje.

Kontekst lokalny

W przeciwieństwie do wchodzącego etapami AI Act, RODO już dziś daje polskiemu kandydatowi egzekwowalne prawo, by nie zostać odrzuconym wyłącznie przez automat — wraz z prawem do przeglądu decyzji przez człowieka (art. 22). To mocniejsza i już obowiązująca wersja tezy tego artykułu — „trzymaj człowieka w pętli” — niż jakikolwiek przepis zza oceanu.

Jak używać AI w rekrutacji, nie zamykając ludziom drzwi

Nie musisz wybierać między szybkością a uczciwością. Musisz odmówić oddania roli strażnika modelowi. Cztery zasady, wzięte wprost z tego, co badanie wytyka:

Niech AI wspiera, a nie działa autonomicznie. Używaj modeli do podsumowywania, wydobywania i kontekstualizowania kandydatów dla człowieka czytającego — nigdy do automatycznego odrzucania. Wzorzec „nie rekomenduję, które omija przegląd przez człowieka” to dokładnie to, co publikacja piętnuje.
Trzymaj człowieka w każdej decyzji. Każde przesunięcie dalej i każde odrzucenie powinno być zalogowanym działaniem człowieka, a nie cichym wynikiem modelu. Decyzję podejmuje ktoś odpowiedzialny, z pełną aplikacją przed oczami.
Niech etapy będą ustrukturyzowane i audytowalne. Kandydaci powinni przechodzić przez jawne, nazwane, zalogowane etapy — przeciwieństwo nieprzejrzystego wyniku, którego „nigdy nie zobaczył człowiek”. O taką przejrzystość proszą zarówno badacze, jak i unijny AI Act.
Przepuszczaj losową próbkę. Własna rada Bany dla pracodawców: zrozum, kogo twój algorytm wpuszcza i kogo odsiewa per stanowisko, i przepuszczaj losową próbkę kandydatów przez pierwszy etap. To tani, mocny mechanizm kontroli przeciw systemowemu wykluczeniu.

Uczciwe zastrzeżenie: człowiek w pętli redukuje stronniczość, sam z siebie jej nie eliminuje. Ludzie też noszą w sobie uprzedzenia. Rzecz w tym, że decyzja człowieka jest rozliczalna, korygowalna i możliwa do skontrolowania — a autonomiczny wyrok modelu, którego nikt nie widzi, nie jest żadną z tych rzeczy.

Jak Kit jest pod to zbudowany

Narzędzia rekrutacyjne Kit są, z założenia architektonicznego, odwrotnością projektu pymetrics opisanego w badaniu. AI wspiera ludzi prowadzących rekrutację; nigdy nie staje między kandydatem a człowiekiem jako bramka.

AI wspiera recenzentów, nigdy nie jest autonomicznym strażnikiem. AI w Kit tworzy podsumowania dla ludzi, wydobywając i kontekstualizując kandydata, by recenzent mógł czytać szybciej i sprawiedliwiej. Zadaniem modelu jest pomóc człowiekowi zdecydować, a nie po cichu kogoś odsiać.
Decyzję podejmują ludzie, na piśmie. Każde przesunięcie dalej i każde odrzucenie przechodzi przez kolejkę oczekujących decyzji jako świadome działanie człowieka. Nie ma ścieżki „model powiedział nie, kandydat znika”.
Ustrukturyzowane, audytowalne etapy. Kandydaci przechodzą przez jawne, nazwane etapy, więc każde przejście jest zalogowane i możliwe do przejrzenia — przeciwieństwo nieprzejrzystego wyniku, którego nikt nigdy nie widzi.
Brak cichej monokultury między pracodawcami. Kit to narzędzie per konto, w którym twój zespół jest właścicielem kryteriów i decyzji. Nie ma jednego klasyfikatora pośredniczącego w lejku całej branży, więc dynamika „odrzucony ze wszystkich dziesięciu stanowisk przez ten sam model” tu nie zachodzi.

W Kit model nigdy nie odfiltrowuje kandydata, zanim zobaczy go człowiek. AI pisze podsumowanie; decyzję podejmuje człowiek; każdy etap jest na piśmie.

Wnioski

Lekcją z 4,2 miliona poddanych screeningowi aplikacji nie jest to, że AI nie ma miejsca w rekrutacji. Jest nią to, że AI nigdy nie powinno mieć ostatniego słowa. Awaria udokumentowana w badaniu to autonomia i nieprzejrzystość: model, który odrzuca wykwalifikowanych ludzi, zanim spojrzy człowiek, powielony w skali całej branży, aż odrzucenie zamieni się w zamknięte drzwi.

Trzymaj człowieka w pętli. Niech etapy będą audytowalne. Przepuść trochę losowości. Używaj AI, żeby pomóc zespołowi zobaczyć więcej kandydatów sprawiedliwiej, a nie żeby decydować, kto jest niewidzialny. Cel jest prosty i jest przeciwieństwem tego, przed czym ostrzegają nagłówki: nie zakazuj AI w rekrutacji. Odmów oddania mu roli strażnika.

Jeśli chcesz zobaczyć wspierające AI w połączeniu z przeglądem przez człowieka w praktyce, możesz poznać podejście Kit do AI w rekrutacji albo rozpocząć darmowy okres próbny.

Powiazane artykuly

A three-person hiring-ops team at a whiteboard comparing ATS vendors on a hand-drawn feature grid, one pointing to a shortlisted column

Product

11 min czytania

Wojny produktowe ATS w 2026: czego naprawdę chcą rekruterzy

Greenhouse, Teamtailor i SmartRecruiters wypuściły w 2026 tę samą klasę funkcji. Sprawdź, dokąd naprawdę zmierza rynek ATS i jak kupować z głową.

Przeczytaj artykuł

An engineering director alone at a glass co-working desk cross-checking a candidate's real GitHub commit history on his laptop against handwritten interview notes

Hiring Guides

13 min czytania

Oszukiwanie AI na rozmowach to już norma. Jak się przed tym bronić

38,5% kandydatów oszukuje dziś na rozmowach na żywo, a 61% z nich i tak je zdaje. Zobacz, jak przeprojektować proces rekrutacji, by w 2026 roku wiedzieć, kogo naprawdę zatrudniasz.

Przeczytaj artykuł

A recruiter in his late fifties at a sunlit home-office desk leaning toward a laptop that shows a candidate email with a verified-sender badge and a link to a branded company careers portal

Security

11 min czytania

Kandydaci myślą, że twój rekruter to oszust. Udowodnij, że jesteś prawdziwy.

Oszustwa rekrutacyjne sprawiły, że kandydaci nie ufają też prawdziwym rekruterom. Oto dane i infrastruktura zaufania, która dowodzi, że twoja wiadomość jest prawdziwa, a nie oszustwem.

Przeczytaj artykuł

A young hiring duo, a Middle Eastern man and a white woman in their late twenties, collaborating over a laptop showing a hiring pipeline on a sunny San Francisco rooftop co-working deck at golden hour, the city skyline behind them

Engineering Hiring

10 min czytania

Okno możliwości na rynku talentów z bezpieczeństwa właśnie się otworzyło: cięcia w CISA i zamknięcie Huntr

CISA straciła ~1000 pracowników, a Huntr 30 czerwca zamknął swój program bug bounty dla open source. Doświadczeni specjaliści od bezpieczeństwa ofensywnego są dostępni na rynku. Oto jak startupy mogą ich szybko zatrudnić.

Przeczytaj artykuł

Two startup hiring managers reviewing an AI-generated interview transcript summary together on a laptop before making the advance-or-reject call themselves, in a plant-filled San Francisco studio office

AI in Hiring

11 min czytania

Agenty AI prowadzą już rozmowy z kandydatami. Czy twoja firma też powinna?

Fika Jobs zebrała 4 mln dolarów na agenty AI, które rozmawiają z kandydatami. Dane mówią jasno: automatyzuj lejek, nie osąd. Oto gdzie przebiega granica i dlaczego to ważne.

Przeczytaj artykuł

Three startup hiring teammates around a laptop showing a confident 94 out of 100 AI candidate score in a plant-filled sunlit studio, two leaning in and nodding while the third sits back looking unconvinced

AI in Hiring

12 min czytania

Porady AI w rekrutacji dodają ci pewności siebie i częściej cię mylą

Nowe badanie (N=3 132) pokazuje, że porady AI zwiększają pewność siebie i obniżają trafność — celność decyzji spadła z 27,5% do 9,2%, nawet gdy AI się myliło.

Przeczytaj artykuł

Gotowy na madrzejsza rekrutacje?

Zacznij za darmo. Bez karty kredytowej. Skonfiguruj swoj pierwszy pipeline rekrutacyjny w kilka minut.

Zacznij za darmo

Powrot do bloga