Контакты
О себе
Более 7 лет в Data Science и ML Engineering. Специализируюсь на NLP и построении распределенных систем обучения моделей. Имею богатый опыт архитектурного проектирования ML-пайплайнов с нуля до масштабируемого продакшна. Эксперт в области оптимизации производительности нейросетей и внедрения MLOps практик на уровне компании.
Опыт работы
- Спроектировал и возглавил разработку LLM-платформы для внутренних нужд компании, сократив расходы на внешние API на $500k в год
- Внедрил инфраструктуру распределенного обучения на кластере из 100+ GPU, ускорив R&D цикл разработки моделей в 5 раз
- Руководил командой из 8 инженеров, внедрив стандарты код-ревью и тестирования ML-сервисов (Unit, Integration, Drift detection)
- Разработал систему поиска по смыслу (Vector Search) на базе FAISS для каталога из 10 млн товаров с латентностью <50мс
- Разработал архитектуру многопоточной системы рекомендаций в реальном времени, обеспечив рост CTR на 25%
- Внедрил Feature Store, что позволило сократить время вывода новых признаков в продакшн с 2 недель до 2 дней
- Оптимизировал потребление памяти нейросетевыми моделями (Quantization, Pruning), сократив затраты на инфраструктуру на 30%
Навыки
Образование
Языки
- Русский — C2 (Native)
- Английский — C2 (Fluent / Proficiency)
Сертификаты
- Google Cloud Professional Machine Learning Engineer · Google, 2021
