Logo StartupKit
FR

Extraction IA des données candidats

Comment l'IA extrait automatiquement les valeurs des champs de données candidats à partir des CV, des réponses aux formulaires et des questionnaires.

Pourquoi c’est important

Examiner des dizaines de candidatures implique de lire manuellement chaque CV, de rechercher les prétentions salariales enfouies dans une lettre de motivation, puis de les saisir dans un champ. Cela s’accumule rapidement. L’extraction IA analyse l’ensemble des documents soumis par le candidat — CV, réponses au formulaire, questionnaires — et remplit automatiquement vos champs de données personnalisés, de sorte que votre équipe ouvre chaque candidature avec les informations clés déjà mises en avant.

Comment ça fonctionne

L’extraction IA se déroule en trois étapes :

  1. Marquer un champ comme extractible par l’IA — sur n’importe quel champ de données personnalisé, activez l’option d’extraction IA
  2. Rédiger un prompt d’extraction — indiquez à l’IA exactement ce qu’elle doit rechercher dans ce champ
  3. L’IA traite à la candidature — lorsqu’un candidat postule, l’extraction s’exécute automatiquement et remplit le champ

La valeur extraite est accompagnée d’un score de confiance, afin que votre équipe sache le degré de certitude de l’IA. Les valeurs à confiance élevée et moyenne apparaissent sur les cartes kanban et dans Slack. Les valeurs à confiance faible sont enregistrées mais signalées pour vérification.

Activer l’extraction IA

Ouvrez une offre d’emploi, accédez à Data Fields et modifiez un champ. Activez AI Extractable. Un champ de prompt apparaîtra — il est obligatoire.

Rédigez un prompt qui indique à l’IA exactement ce qu’elle doit trouver. Le prompt devient l’instruction d’extraction envoyée au modèle.

Exemples de bons prompts :

Champ Bon prompt
Salary Expectation Extract the candidate’s expected salary, compensation range, or rate. Return null if not mentioned.
Availability Extract when the candidate can start or their notice period. Return null if not mentioned.
Location Preference Extract the candidate’s location, city, country, or remote work preference.
Years of Experience Extract total years of professional experience. Return a number. Return null if not clear.
Open to Relocation Return true if the candidate mentions willingness to relocate. Return false if they say they cannot. Return null if not mentioned.
Technical Skills Extract all programming languages, frameworks, and tools mentioned. Return as a list.

Les prompts contenant « Return null if not mentioned » réduisent les faux positifs — l’IA ne devinera pas lorsque l’information n’est pas présente.

Pré-remplissage du CV (extraction en temps réel)

Indépendamment de l’extraction des metafields post-soumission décrite ci-dessus, Kit propose également le pré-remplissage en temps réel du CV sur le formulaire de candidature public. Lorsqu’un candidat téléverse un CV au format PDF, Kit extrait immédiatement les informations de contact (prénom, nom, e-mail, téléphone, URL LinkedIn) et pré-remplit les champs du formulaire en environ 2 secondes.

Différences clés par rapport à l’extraction des metafields :

Pré-remplissage du CV Extraction des metafields
Quand Immédiatement au téléversement du fichier Après la soumission de la candidature
Quoi Informations de contact uniquement (5 champs) Champs de données personnalisés que vous définissez
Niveau IA Economy (le moins coûteux) Standard ou Economy (selon la complexité)
Persistance Aucune (remplissage du formulaire uniquement) Enregistré dans le dossier du candidat
Limite de fichier PDF uniquement, 2 Mo max PDF/DOCX/DOC, 10 Mo max

Le pré-remplissage du CV nécessite que les crédits IA soient activés. Si les crédits sont épuisés ou si le fichier ne peut être analysé, le formulaire fonctionne normalement et les candidats remplissent les champs manuellement.

Ce qui est analysé

L’IA reçoit tout ce que le candidat a soumis, organisé en sections :

Source Ce qui est inclus
Profil du candidat Nom, e-mail, téléphone, identifiant GitHub, URL LinkedIn
CV Texte intégral du CV, parcours professionnel, formation, liste de compétences, résumé de l’expérience
Réponses au formulaire Toutes les réponses soumises via le formulaire de candidature
Réponses au questionnaire Réponses écrites aux étapes de questionnaire terminées par le candidat

L’IA ne reçoit que les éléments soumis par le candidat — rien provenant de vos notes internes ou des évaluations de votre équipe.

Rédiger des prompts efficaces

Le prompt est l’élément le plus important pour la qualité de l’extraction. Adaptez votre prompt au type de champ :

Type de champ Exemple de champ Prompt efficace
Text Salary Expectation “Extract the candidate’s expected salary or compensation range. Include currency if mentioned. Return null if not mentioned.”
Number Years of Experience “Count total years of professional experience from work history. Return a number only. Return null if not determinable.”
Boolean Open to Management “Return true if the candidate has managed a team or expresses interest in management. Return false if they prefer individual contributor work. Return null if not mentioned.”
Tags Technical Skills “Extract all programming languages, frameworks, databases, and tools the candidate mentions. Return as a list of strings.”
Select Seniority Level “Classify the candidate as Junior, Mid, or Senior based on their experience. Return null if not enough information.”
Date Available From “Extract the earliest date or timeframe the candidate can start. Convert to a date if possible. Return null if not mentioned.”

Gardez les prompts centrés sur une seule information. Les prompts composés (« extract salary and notice period ») produisent des résultats incohérents.

Scores de confiance

Chaque valeur extraite par l’IA est accompagnée d’un score de confiance de 0.0 à 1.0, réparti en trois niveaux :

Niveau Plage de score Signification Affiché sur les cartes/Slack
High 0.75 – 1.0 L’IA a trouvé une réponse claire et explicite Oui
Medium 0.50 – 0.74 L’IA a trouvé une réponse probable avec une certaine ambiguïté Oui
Low En dessous de 0.50 L’IA a deviné ou déduit — à vérifier avant d’agir Non

Les valeurs à confiance élevée et moyenne apparaissent sur les cartes kanban et dans les canaux Slack des candidats. Les valeurs à confiance faible sont enregistrées dans le dossier de candidature mais exclues des vues compactes afin d’éviter d’afficher des données peu fiables.

Lors de l’examen d’une candidature, le score de confiance est affiché à côté de chaque champ rempli par l’IA, afin que votre équipe sache d’un coup d’œil s’il faut faire confiance à la valeur ou consulter le document source.

Modification manuelle

Toute valeur extraite par l’IA peut être modifiée en ligne. Cliquez sur la valeur du champ dans la page de candidature pour la modifier. Une fois enregistrée, le champ est marqué comme défini manuellement — l’IA ne l’écrasera pas lors des extractions futures.

La valeur d’origine extraite par l’IA est conservée dans le dossier même après votre modification, afin que vous puissiez toujours voir ce que l’IA avait trouvé avant l’intervention de votre équipe.

Pour forcer une ré-extraction sur un champ modifié manuellement, videz d’abord la valeur, puis lancez la ré-extraction.

Ré-extraction

Automatique : l’extraction s’exécute une fois lorsqu’un candidat postule. Les nouvelles candidatures sont traitées automatiquement — aucune action n’est requise.

Ré-extraction manuelle : ouvrez la candidature, faites défiler jusqu’à la section Data Fields et cliquez sur Re-extract. Cette opération relance l’extraction sur l’ensemble des documents actuels du candidat en utilisant les prompts de champs en vigueur.

La ré-extraction est utile lorsque :

  • Vous ajoutez un nouveau champ extractible par l’IA après la réception de la candidature
  • Vous avez mis à jour le prompt d’un champ et souhaitez des résultats actualisés
  • L’extraction initiale a échoué

La ré-extraction respecte les modifications manuelles — les champs que votre équipe a modifiés ne seront pas écrasés.

Statut de l’extraction

Chaque candidature possède un statut d’extraction visible dans la section Data Fields :

Statut Signification
Pending L’extraction est en file d’attente mais n’a pas encore commencé
Processing L’extraction est en cours
Completed L’extraction est terminée — les résultats sont renseignés
Failed L’extraction a rencontré une erreur — consultez le message d’erreur pour les détails

Les causes d’échec courantes incluent l’absence de documents sources (le candidat n’a rien soumis que l’IA puisse lire) ou l’atteinte de la limite de crédits IA. En cas d’échec de l’extraction, corrigez le problème sous-jacent et utilisez le bouton de ré-extraction manuelle pour réessayer.

Checklist

  • Ajoutez des champs de données personnalisés à l’offre d’emploi
  • Activez AI Extractable sur les champs que vous souhaitez remplir automatiquement
  • Rédigez un prompt d’extraction ciblé pour chaque champ
  • Utilisez « Return null if not mentioned » pour éviter les faux positifs
  • Vérifiez les valeurs à confiance moyenne avant de prendre des décisions
  • Modifiez en ligne toute valeur IA incorrecte — votre modification verrouille le champ contre la ré-extraction
  • Utilisez Re-extract après avoir ajouté de nouveaux champs à des candidatures existantes

Tapez pour rechercher...