HR-скрининг кандидатов с ИИ

3-стадийный пайплайн оценки кандидатов: извлечение фактов из резюме, персонализированный опросник, подготовка к интервью. Каждый балл подтверждён цитатой из документа — без галлюцинаций и субъективных оценок.

3
Стадии оценки
0-100
Нормализованный скор
2x
Верификация фактов
YAML
Конфигурация критериев

Пайплайн: 3 стадии оценки

Stage 1

Скрининг резюме

Извлечение структурированных фактов из PDF-резюме с двойной верификацией

  • Парсинг PDF (hh.ru формат) с OCR-фоллбэком для сканов
  • LLM извлекает факты в JSON с evidence-цитатами
  • Двойная проверка: локальный quote check + LLM-верификатор
  • Детерминированный скоринг по взвешенным критериям (0-5)
Output

candidates.xlsx — сводный отчёт, per-candidate артефакты

Stage 2

Опросник + ре-скоринг

Персонализированные вопросы по слабым местам, пересчёт после ответов

  • Генерация вопросов по низким баллам и пробелам
  • Таргетинг: must-haves, противоречия, отсутствующие данные
  • Кандидат заполняет answers.json
  • Автоматический ре-скоринг с учётом новых данных
Output

questionnaire.md — персональный опросник

Stage 3

Интервью + финальная оценка

Пакет вопросов для интервью, скоринг транскрипта, кросс-проверка

  • Hard skills + soft skills + мини-кейс для интервью
  • Скоринг транскрипта после интервью
  • Кросс-проверка: резюме vs опросник vs интервью
  • Детекция противоречий между стадиями
Output

final_score.json — нормализованная оценка 0-100

Правила принятия решений

Система автоматически классифицирует кандидатов по комбинации TotalScore, ConfidenceScore и наличия must-have критериев. Низкая уверенность всегда приводит к Hold, а не Reject — защита от ложных отказов.

Score >= 70, Confidence >= 0.70, нет пробелов must-haveInvite
Score 55-70Hold
ExtractConfidence < 0.75 или missing must-haveHold (ручная проверка)
Score < 55, Confidence >= 0.70Reject

Формула ConfidenceScore

Confidence = 0.45 * ExtractConfidence + 0.4 * EvidenceCoverage -0.25 * ContradictionPenalty
0.45
ExtractConfidence

Качество извлечения фактов из PDF

0.40
EvidenceCoverage

Покрытие критериев подтверждёнными данными

-0.25
ContradictionPenalty

Штраф за противоречия между стадиями

Преимущества

Без галлюцинаций

Балл 4-5 выставляется только при наличии верифицированной цитаты из резюме. Двойная проверка: локальный quote check + LLM-верификатор

Evidence-based скоринг

Каждый балл привязан к конкретному факту из документа. ConfidenceScore учитывает качество извлечения, покрытие данных и штраф за противоречия

Настраиваемые критерии

Вакансии и критерии описываются в YAML. Веса, must-haves, дополнительные вопросы — всё конфигурируется под конкретную позицию

Полный аудит-трейл

Каждый кандидат получает папку с артефактами: извлечённый текст, факты, верификация, скор, опросник, транскрипт, финальная оценка

Хотите автоматизировать скрининг?

Настроим пайплайн под ваши вакансии и критерии. Первые результаты — уже на текущем пуле кандидатов.

Частые вопросы

Как система борется с галлюцинациями LLM?

Двойная верификация: после извлечения фактов каждая цитата проверяется локальным поиском в тексте резюме, затем LLM-верификатор подтверждает соответствие. Балл 4-5 невозможен без подтверждённой цитаты.

Какие форматы резюме поддерживаются?

PDF-резюме в формате hh.ru. Система извлекает текст с маркерами страниц, для сканированных документов используется OCR-фоллбэк.

Можно ли добавить свои вакансии и критерии?

Да. Вакансии описываются в criteria.yaml: критерии оценки, веса (сумма = 100), must-haves и дополнительные вопросы для опросника и интервью.

Как рассчитывается ConfidenceScore?

Формула: 0.45 * ExtractConfidence + 0.40 * EvidenceCoverage - 0.25 * ContradictionPenalty. Это показывает, насколько надёжна оценка: высокий confidence значит достаточно данных и нет противоречий.

Связанные материалы