Контакты
О себе
Сфокусирован на достижении максимального бизнес-эффекта через внедрение передовых NLP-технологий. Имею опыт построения ML-команд с нуля и организации полного жизненного цикла разработки. Автор нескольких публикаций по теме нейронных сетей и активный участник Open Source сообщества. Эксперт по оптимизации стоимости инференса LLM.
Опыт работы
- Спроектировал и внедрил платформу разговорного ИИ для 10 млн+ клиентов, снизив нагрузку на колл-центр на 35%
- Внедрил процесс распределенного обучения (DeepSpeed), что позволило сократить время обучения моделей в 4 раза
- Разработал проприетарную систему фильтрации контента, снизив количество жалоб пользователей на 50%
- Управлял командой из 6 NLP-инженеров и 4 Data Scientists, успешно запустив 3 крупных продукта
- Создал систему автоматической суммаризации новостных потоков на 15 языках
- Оптимизировал потребление памяти моделями в продакшне на 60% через квантование и прунинг
- Построил MLOps пайплайн (DVC, MLFlow), сократив время Time-to-Market новых фич в 2 раза
Навыки
Образование
Языки
- Русский — C2 (Native)
- Английский — C2 (Fluent)
Сертификаты
- Google Cloud Professional ML Engineer · Google, 2022
