Автоматизируем парсинг зарплатных ожиданий с помощью LLM
Крупные компании активно внедряют ИИ в свои процессы. Особенно популярный сценарий — автоматизация в HR. Мы в Evrone используем собственную ERP, поэтому решили поэкспериментировать и в этой статье расскажем, как облегчили и ускорили работу рекрутеров.
Мысль о внедрении AI в HR звучит соблазнительно: добавляем агентов в процессы, они работают вместо людей и экономят на зарплатах. Но результат будет непредсказуемый: агенты сегодня хоть и умеют выполнять инструкции автономно, все еще ошибаются и галлюцинируют. Для каждой задачи нужна отдельная настройка с учетом ваших данных, fine-tuning модели и безопасная инфраструктура.
Для более предсказуемого результата лучше автоматизировать конкретный и измеримый процесс, где инструкции просты, а их исполнение можно разобрать на простые шаги. Так вы упростите работу людей, а не замените их. Например, рекрутер перестанет тратить часы на рутину и сфокусируется на собеседованиях, а sales-менеджер мгновенно найдет нужную информацию для переговоров.
По данным Gartner доля компаний, использующих генеративный ИИ в HR, выросла до 61 % к январю 2025 года. В России, согласно исследованию Ancor Recruitment, почти 50% компаний применяет искусственный интеллект в HR-подразделениях. Мы в Evrone тоже внедрили LLM в собственную ERP — автоматизировали парсинг зарплатных ожиданий из резюме и Huntflow и снизили обращения в источники данных на 90%.
Проблема — долго очищаем данные из CV и Huntflow вручную
В Evrone ERP хранится вся информация о штате, кандидатах в воронке и преофферах. Данные поступают из Huntflow и карьерных сайтов. В работе с ними возникают две проблемы.
Во-первых, рекрутеру приходится тратить много времени: он открывает резюме, ищет упоминание зарплаты, переключается в Huntflow, копирует комментарии, переводит валюту и приводит всё к единому формату, затем вручную вписывает вилку в карточку. Из-за хаоса между системами на монотонную работу уходит 2–3 часа в день.
Проблема касается не только рекрутеров: менеджеры по продажам и аккаунты используют базу, чтобы подобрать специалиста под проект по бюджету, а без достоверных данных поиск превращается в лотерею.
Во-вторых, данные приходится приводить в единый вид руками. Кандидаты указывают ожидания по-разному: «от 300к net», «$4000–5000», «комфортно от 350», «min 180» или вообще «ваша вилка устраивает». Ручная обработка отнимает время и мотивацию на каждом этапе.
Мы решили, что команда должна тратить время на переговоры и закрытие вакансий, а не на копи-паст, поэтому внедрили ИИ-функции.
Согласно отчётам аналитиков, вы либо уже хотите внедрить ИИ в HR, либо задумаетесь об этом в ближайшие месяцы. Не откладывайте, а мы поможем обогнать конкурентов.
Решение — внедряем Qwen и YandexGPT с тюнингом по нашим данным
Теперь ERP Evrone самостоятельно собирает и приводит зарплатные данные в единый формат. Можно быстро найти карточку сотрудника или кандидата и быстро сопоставить его с возможностями проекта.
Вот как работает это решение.
Парсим резюме и извлекаем ключевые параметры с помощью Qwen
Шаблонные парсеры не подошли из-за того, что все резюме очень разные. Стандартные NER не могли обеспечить привязку к нашим внутренним справочникам (грейдам, профилям позиций).
Поэтому мы выбрали Qwen со structured output — она умеет точно следовать достаточно сложным инструкциям и обрабатывать длинные контексты. Модель обрабатывает целое резюме и возвращает данные строго в соответствии с JSON Schema.
Пайплайн простой — сырое резюме подается в модель, она извлекает категорию (backend, frontend, QA и т.д.), тайм-зону, уровень английского, грейд, гео и зарплату. Дополнительно модель генерирует краткие саммари из комментариев рекрутеров.
Приводим зарплатные ожидания к единому формату с помощью YandexGPT
Тексты в Huntflow полны сокращений: «ком 400», «долл 3000», «min-180», «в валюте» и так далее. Регулярные выражения не справляются с таким количеством вариаций, а специальный промпт к базовой LLM давал нестабильные результаты и много галлюцинаций.
Мы собрали датасет из старых текстов Huntflow (более 10 000 записей), провели инференс базовой модели, оценили результат и выполнили разметку. Из полученных данных собрали обучающий датасет. Затем дообучили нейросеть YandexGPT 5 Lite методом LoRA с фокусом на сумме и валюте.
Базовая модель давала порядка 67% точности и заметную вариативность на одинаковых формулировках. Дообучение LoRA подняло точность до 95%. При этом ключевой фактор - инженерия данных: репрезентативная выборка, нормализация форматов и качественная разметка.
Результатом стала 95% точность парсинга зарплаты. Валюта определяется даже по косвенным признакам с точностью 98,7 % для рублей и 97 % для долларов. Рекрутер видит готовую вилку без необходимости разгадывать сокращения.
Справляемся с галлюцинациями ИИ
К сожалению, даже с учетом адаптации языковой модели пока не существует надежного способа полностью избавиться от галлюцинаций, но мы минимизировали искажения и добавили три уровня защиты:
- В промптах прописано жёсткое правило — если нет чётких данных, модель возвращает пустой JSON и ничего не придумывает.
- Если что-то все равно проскочило, то перед загрузкой в ERP срабатывает автоматическая валидация реалистичности по нашим грейдам и рынку, при ошибке приходит оповещение.
- В интерфейсе все поля, заполненные нейросетью, отмечены иконкой робота, чтобы быстро понять, что странные или нереальные данные спарсил AI-агент и их следует проверить.
В итоге большинство случаев данные верны сразу, а рекрутер вручную исправляет не более 5% случаев. Примерно столько же исправляют при ручной обработке данных.
Результат — на 90% сократили переход в сторонние сервисы
Новый функционал запущен меньше трёх месяцев назад, но уже стал частью рутины. Раньше рекрутеры часами копировали и переводили цифры, а теперь тратят больше времени на общение с кандидатами и закрытие вакансий.
За три месяца переходы в Huntflow и другие источники сократились на 90%. Обучение LLM на своих данных позволило добиться 95% точности данных. Рекрутерам приходится проверять вручную всего 5% случаев, когда информация описана в совсем экзотическом формате.
Как Evrone еще может помочь HR-департаменту?
В планах довести точность парсинга до 99,5% и добавить чат-интерфейс для общения с моделью, чтобы она могла сама предлагать кандидатов из базы. Это очень ускорило бы работу отдела продаж и аккаунтинга.
Работа над собственными продуктами помогает нам предлагать лучшие решения для клиентов. Например, мы сами разрабатываем и поддерживаем Evrone ERP с удобным управлением сотрудниками и аналитикой их удовлетворенности. А клиентам помогаем с самыми разными задачами:
- Для АО «Кама» (производитель электромобилей Атом) создали кастомную HR-систему Атом HR. Коробочные решения им не подходили, поэтому мы сделали кастомный сервис для автоматизации подбора в быстрорастущей команде.
- Для Учи.ру (EdTech) мы за 9 недель автоматизировали сбор обратной связи от сотрудников.
- Для «Пятерочки» запустили новый карьерный сайт с удобными функциями, который помогает искать сотрудников.
- Для TalentTech (HR-tech компания, отмеченная Forbes) мы разработали модуль постановки целей для их платформы.
- И еще много проектов, познакомиться с которыми можно тут.
Мы можем создать для вас аналогичные инструменты или кастомное решение под ваши процессы, обучить LLM и сделать её помощником для ваших сотрудников. Свяжитесь с нами и превратите данные в реальное преимущество.
Как IT-компания мы в Evrone первыми пробуем новые технологии и внедряем лучшие решения своим клиентам, делая их лидерами на своих рынках. Присоединяйтесь к лучшим!

