Семён Михайлов - Data Science
Навыки
- A/B тесты
- Agile
- Confluence
- cv2
- Docker
- FastAPI
- Git
- GPU
- Hadoop
- Jira
- Kanban
- LGBM
- OCR
- ONNX
- Pandas
- Power BI
- Python
- Pytorch
- Scikit-learn
- Scrum
- SQL
- TensorFlow
- YOLO
- Дисперсионный анализ
- Управление бюджетом
- Управление командами
Опыт работы
Газпромбанк
Data Science - 10.2021/09.2022— Разрабатывал скоринговую модель для оценки клиентов
— Исследовал внешние данные для использования в скоринговых моделей
— Создал ~6 отчетов в BI для контроля моделей
— Написал автоматизацию на Python для улучшения операционных процессовООО СПУТНИК
Data Science - 09.2022/05.2024Руководил отделом разработки в области CV.
Ключевые проекты и результаты:
✔ Контроль СИЗ (каски и спецремни)
• Технологии: Python, YOLO v8, OpenCV, FastAPI, PostgreSQL
• Дообучение YOLO v8, развертывание в прод, создание интерфейса администратора.
• Результат: Снижение нарушений техники безопасности на 92%.
✔ Обработка PDF-документов (ГОСТ)
• Технологии: Python, TensorFlow, OCR (Tesseract), PostgreSQL, Flask
• Разработка модели классификации таблиц, текста и формул с последующей обработкой.
• Результат: Точность распознавания текста — 99%, таблиц и формул — 97%.
✔ Speech-to-Text
• Технологии: Python, DeepSpeech, NLTK, FastAPI, MongoDB
• Разработка системы распознавания голоса, идентификации спикеров и создания выжимки
текста.
• Результат: Реализовано за 12 дней, успешно внедрено в прод.
✔ Автоматизация документооборота
• Технологии: Python, Django, PostgreSQL, Celery, Docker
• Разработка платформы для автоматического создания, проверки и согласования документов.
• Результат: Сокращение времени на обработку документов на 45%.
✔ Система мониторинга серверов
• Технологии: Python, Prometheus, Grafana, Kubernetes, Machine Learning
• Разработал и внедрил систему предиктивного мониторинга серверного оборудования с ML.
• Результат: Снижение времени простоя серверов на 38%, сокращение аварийных ситуаций на
60%.
✔ Оптимизация бизнес-процессов
• Технологии: Python, Jira, Confluence, Power BI• Внедрение системы учета задач и контроля
исполнения.
• Результат: 0 просроченных дедлайнов за год.
• Повышение КПД сотрудников на 32%.
• Снижение затрат на ИТ-инфраструктуру на 20%.
✔ Предиктивная аналитика продаж
• Технологии: Python, Scikit-learn, XGBoost, Tableau, SQL
• Разработка модели прогнозирования спроса и трендов.
• Результат: Точность предсказания спроса 85%, сокращение издержек на закупки 30%.
✔ Чат-бот для автоматизации клиентского сервиса
• Технологии: Python, Rasa, Dialogflow, Telegram API, FastAPI
• Разработка чат-бота для обработки клиентских запросов и ответов на часто задаваемые
вопросы.
• Результат: Снижение нагрузки на операторов 40%, улучшение времени отклика на 60%.
С коммерческой точки зрения:
1) КПД сотрудников увеличился на 32%
2) Внедрил систему учета выполнения задач для сотрудников — в результате за год было 0
просроченных дедлайновQDSIT
Data Science - 05.2024Руководил IT отделом, в команде:
3 Data Scientists
1 backend
1 frontend
1 devops
За год создали:
1) платформу с видеорегистротором и магазином видеоаналитики.
2) написали и внедрели в платформу такие продукты как:
— учет рабочего времени
— детекция телефонов
— faceid
— подсчет бургеров
— детекция не обслужанного столика
— детекция подносов
— детекция СИЗ
— распознование номеров
— NLP задачи
И многое другое
За основу платформы взяли Fregat
Руководил переводом моделей для TPU, в результате в два раза упали затраты не серверные
мощности
Создали сайт для автоматического конвертирования весов для tpu
Образование
Прикладная математика и информатика
ТПУ2021-2025
Обо мне
Работаю в стартап компании, управляю отделом по разработке ML продуктов как для
коммерческой разработки так и в рамках компании. Увлекаюсь теннисом, шахматами. В
свободное время занимаюсь трейдингом и применением в этой области ML
, а затем