Extraction IA des données candidats
Comment l'IA extrait automatiquement les valeurs des champs de données candidats à partir des CV, des réponses aux formulaires et des questionnaires.
Pourquoi c’est important
Examiner des dizaines de candidatures implique de lire manuellement chaque CV, de rechercher les prétentions salariales enfouies dans une lettre de motivation, puis de les saisir dans un champ. Cela s’accumule rapidement. L’extraction IA analyse l’ensemble des documents soumis par le candidat — CV, réponses au formulaire, questionnaires — et remplit automatiquement vos champs de données personnalisés, de sorte que votre équipe ouvre chaque candidature avec les informations clés déjà mises en avant.
Comment ça fonctionne
L’extraction IA se déroule en trois étapes :
- Marquer un champ comme extractible par l’IA — sur n’importe quel champ de données personnalisé, activez l’option d’extraction IA
- Rédiger un prompt d’extraction — indiquez à l’IA exactement ce qu’elle doit rechercher dans ce champ
- L’IA traite à la candidature — lorsqu’un candidat postule, l’extraction s’exécute automatiquement et remplit le champ
La valeur extraite est accompagnée d’un score de confiance, afin que votre équipe sache le degré de certitude de l’IA. Les valeurs à confiance élevée et moyenne apparaissent sur les cartes kanban et dans Slack. Les valeurs à confiance faible sont enregistrées mais signalées pour vérification.
Activer l’extraction IA
Ouvrez une offre d’emploi, accédez à Data Fields et modifiez un champ. Activez AI Extractable. Un champ de prompt apparaîtra — il est obligatoire.
Rédigez un prompt qui indique à l’IA exactement ce qu’elle doit trouver. Le prompt devient l’instruction d’extraction envoyée au modèle.
Exemples de bons prompts :
| Champ | Bon prompt |
|---|---|
| Salary Expectation | Extract the candidate’s expected salary, compensation range, or rate. Return null if not mentioned. |
| Availability | Extract when the candidate can start or their notice period. Return null if not mentioned. |
| Location Preference | Extract the candidate’s location, city, country, or remote work preference. |
| Years of Experience | Extract total years of professional experience. Return a number. Return null if not clear. |
| Open to Relocation | Return true if the candidate mentions willingness to relocate. Return false if they say they cannot. Return null if not mentioned. |
| Technical Skills | Extract all programming languages, frameworks, and tools mentioned. Return as a list. |
Les prompts contenant « Return null if not mentioned » réduisent les faux positifs — l’IA ne devinera pas lorsque l’information n’est pas présente.
Pré-remplissage du CV (extraction en temps réel)
Indépendamment de l’extraction des metafields post-soumission décrite ci-dessus, Kit propose également le pré-remplissage en temps réel du CV sur le formulaire de candidature public. Lorsqu’un candidat téléverse un CV au format PDF, Kit extrait immédiatement les informations de contact (prénom, nom, e-mail, téléphone, URL LinkedIn) et pré-remplit les champs du formulaire en environ 2 secondes.
Différences clés par rapport à l’extraction des metafields :
| Pré-remplissage du CV | Extraction des metafields | |
|---|---|---|
| Quand | Immédiatement au téléversement du fichier | Après la soumission de la candidature |
| Quoi | Informations de contact uniquement (5 champs) | Champs de données personnalisés que vous définissez |
| Niveau IA | Economy (le moins coûteux) | Standard ou Economy (selon la complexité) |
| Persistance | Aucune (remplissage du formulaire uniquement) | Enregistré dans le dossier du candidat |
| Limite de fichier | PDF uniquement, 2 Mo max | PDF/DOCX/DOC, 10 Mo max |
Le pré-remplissage du CV nécessite que les crédits IA soient activés. Si les crédits sont épuisés ou si le fichier ne peut être analysé, le formulaire fonctionne normalement et les candidats remplissent les champs manuellement.
Ce qui est analysé
L’IA reçoit tout ce que le candidat a soumis, organisé en sections :
| Source | Ce qui est inclus |
|---|---|
| Profil du candidat | Nom, e-mail, téléphone, identifiant GitHub, URL LinkedIn |
| CV | Texte intégral du CV, parcours professionnel, formation, liste de compétences, résumé de l’expérience |
| Réponses au formulaire | Toutes les réponses soumises via le formulaire de candidature |
| Réponses au questionnaire | Réponses écrites aux étapes de questionnaire terminées par le candidat |
L’IA ne reçoit que les éléments soumis par le candidat — rien provenant de vos notes internes ou des évaluations de votre équipe.
Rédiger des prompts efficaces
Le prompt est l’élément le plus important pour la qualité de l’extraction. Adaptez votre prompt au type de champ :
| Type de champ | Exemple de champ | Prompt efficace |
|---|---|---|
| Text | Salary Expectation | “Extract the candidate’s expected salary or compensation range. Include currency if mentioned. Return null if not mentioned.” |
| Number | Years of Experience | “Count total years of professional experience from work history. Return a number only. Return null if not determinable.” |
| Boolean | Open to Management | “Return true if the candidate has managed a team or expresses interest in management. Return false if they prefer individual contributor work. Return null if not mentioned.” |
| Tags | Technical Skills | “Extract all programming languages, frameworks, databases, and tools the candidate mentions. Return as a list of strings.” |
| Select | Seniority Level | “Classify the candidate as Junior, Mid, or Senior based on their experience. Return null if not enough information.” |
| Date | Available From | “Extract the earliest date or timeframe the candidate can start. Convert to a date if possible. Return null if not mentioned.” |
Gardez les prompts centrés sur une seule information. Les prompts composés (« extract salary and notice period ») produisent des résultats incohérents.
Scores de confiance
Chaque valeur extraite par l’IA est accompagnée d’un score de confiance de 0.0 à 1.0, réparti en trois niveaux :
| Niveau | Plage de score | Signification | Affiché sur les cartes/Slack |
|---|---|---|---|
| High | 0.75 – 1.0 | L’IA a trouvé une réponse claire et explicite | Oui |
| Medium | 0.50 – 0.74 | L’IA a trouvé une réponse probable avec une certaine ambiguïté | Oui |
| Low | En dessous de 0.50 | L’IA a deviné ou déduit — à vérifier avant d’agir | Non |
Les valeurs à confiance élevée et moyenne apparaissent sur les cartes kanban et dans les canaux Slack des candidats. Les valeurs à confiance faible sont enregistrées dans le dossier de candidature mais exclues des vues compactes afin d’éviter d’afficher des données peu fiables.
Lors de l’examen d’une candidature, le score de confiance est affiché à côté de chaque champ rempli par l’IA, afin que votre équipe sache d’un coup d’œil s’il faut faire confiance à la valeur ou consulter le document source.
Modification manuelle
Toute valeur extraite par l’IA peut être modifiée en ligne. Cliquez sur la valeur du champ dans la page de candidature pour la modifier. Une fois enregistrée, le champ est marqué comme défini manuellement — l’IA ne l’écrasera pas lors des extractions futures.
La valeur d’origine extraite par l’IA est conservée dans le dossier même après votre modification, afin que vous puissiez toujours voir ce que l’IA avait trouvé avant l’intervention de votre équipe.
Pour forcer une ré-extraction sur un champ modifié manuellement, videz d’abord la valeur, puis lancez la ré-extraction.
Ré-extraction
Automatique : l’extraction s’exécute une fois lorsqu’un candidat postule. Les nouvelles candidatures sont traitées automatiquement — aucune action n’est requise.
Ré-extraction manuelle : ouvrez la candidature, faites défiler jusqu’à la section Data Fields et cliquez sur Re-extract. Cette opération relance l’extraction sur l’ensemble des documents actuels du candidat en utilisant les prompts de champs en vigueur.
La ré-extraction est utile lorsque :
- Vous ajoutez un nouveau champ extractible par l’IA après la réception de la candidature
- Vous avez mis à jour le prompt d’un champ et souhaitez des résultats actualisés
- L’extraction initiale a échoué
La ré-extraction respecte les modifications manuelles — les champs que votre équipe a modifiés ne seront pas écrasés.
Statut de l’extraction
Chaque candidature possède un statut d’extraction visible dans la section Data Fields :
| Statut | Signification |
|---|---|
| Pending | L’extraction est en file d’attente mais n’a pas encore commencé |
| Processing | L’extraction est en cours |
| Completed | L’extraction est terminée — les résultats sont renseignés |
| Failed | L’extraction a rencontré une erreur — consultez le message d’erreur pour les détails |
Les causes d’échec courantes incluent l’absence de documents sources (le candidat n’a rien soumis que l’IA puisse lire) ou l’atteinte de la limite de crédits IA. En cas d’échec de l’extraction, corrigez le problème sous-jacent et utilisez le bouton de ré-extraction manuelle pour réessayer.
Checklist
- Ajoutez des champs de données personnalisés à l’offre d’emploi
- Activez AI Extractable sur les champs que vous souhaitez remplir automatiquement
- Rédigez un prompt d’extraction ciblé pour chaque champ
- Utilisez « Return null if not mentioned » pour éviter les faux positifs
- Vérifiez les valeurs à confiance moyenne avant de prendre des décisions
- Modifiez en ligne toute valeur IA incorrecte — votre modification verrouille le champ contre la ré-extraction
- Utilisez Re-extract après avoir ajouté de nouveaux champs à des candidatures existantes