Наиль Сираев - Data Scientist
Навыки
- CV
- Docker
- FastAPI
- HF
- Langchain
- NLP
- Python
- Pytorch
- SQL
Опыт работы
Институт прикладной семиотики академии наук РТ
ML engineer - Май 2023 - Июль 20241)Разработка модели распознавания татарской речи, обучение моделей семейства Whisper. Подготовка датасета, состоящего из 230 часов речи различной природы, фильтрация пустых записей. Тестирование моделей, сбор метри WER/CER. Перевод модели в ONNX формат, выведение в продакшен с помощью Docker, FastApi. Полученные метрики: WER = 0.105б, CER = 0.125
2) Разработка русско-татарского и татарско-русского переводчиков. Изучение различных RNN и Transformer моделей. Подготовка датасета, аугментация некоторых данных. Сбор метрик, выведение в продакшен с помощью Docker, FastApi. Полученные метрики: BLEU = 30.3
— Обернул инференсы моделей в Docker
— Перенес модель ASR в onnx форматГБУ Безопасность дорожного движения
ML engineer - Июнь 2022 - Май 20231) Подбор модели детекции автомобильных номеров и определение скорости потока. Тестирование различных подходов. Улучшение трекинга автомобилей. Улучшение REid
алгоритма — с mAP = 76 до mAp = 78.
2) Подбор методов для REid алгоритма, использующегося для нахождения людей, которые закрывают номера, в базе всех машин. Получение общей базы данных и выявление из нее
автомобилей с закрытыми номерами. Тестирование несколько алгоритмов: REid, энкодер, обученный на автомобилях.
Улучшение mAP на таких автомобилях с 25 до 40
Ускорили работу алгоритма за счет распараллеливания работы методов с 0.8 секунд до 0.25 секунд
Образование
Прикладная математика и информатика
КНИТУ-КАИ2021-2025
Обо мне
Читаю статейки, учавствую в хакатонах, люблю практически любые задачи (classic ML, CV, ASR, TTS, NLP, рекомендательные системы)
КУРСЫ
- Deep Learning School Продвинутый поток
Deep Learning School, Deep Learning - TInkoff Deep Learning
TInkoff, Deep Learning - Основы статистики
Stepik, Основы статистики - Теория вероятностей
Computer Science Center (CS центр)
НАГРАДЫ
- Цифровой прорыв ИИ Межнар 2023- 9th
CV. - Цифровой прорыв ИИ СФО 2023- 3rd
NLP. - Tatar.Бу 2023 — 1st
ASR TTS NLP. - Letai Racing Kazan Digital Week 2023- 1st
CV. - Лидеры цифровой трансформации 2023-5th
Time Series.
, а затем