Ульяна Джумок - Data Scientist, Machine learning engineer
Навыки
- Albumentations
- AlexNet
- Ansible
- Auto-TS
- AutoKeras
- BiteTracker
- Catboost
- CircleCi
- Classification
- Computer vision
- DeepSeek
- Docker
- EasyOCR
- EfficientNet
- FastAPI
- Fine-tuning
- GitLab
- Google Text-to-Speech
- GRU
- Jenkins
- Jiwer
- Kubernetes
- librosa
- Llama
- LLM
- LoRA
- LSTM
- Matplotlib
- Mistral
- MobileNet
- NLP
- Numpy
- Object Detection/Segmentation
- OCR
- OpenCV
- PaddleOCR
- Pandas
- PEFT
- PSPNet
- PyAudio
- Pytorch
- ResNet
- RNN
- SAM
- Scikit-learn
- Seaborn
- SpeechRecognition
- SuryaOCR
- TensorFlow/Keras
- Tesseract
- Timeseries Generator
- torchvision
- Transformers
- U-Net
- Unsloth
- Uvicorn
- VGG
- ViT
- WhisperAI
- XGBoost
- Yandex SpeechKit
- YOLO
Опыт работы
Исследовательский проект
Эксперименты с DeepSeek Janus Pro для мультимодальной обработки изображений, а также их генерации - 04.2025-04.2025— оптимизировала и квантизировала модель Janus Pro с использованием фреймворка Unsloth
— реализовала мультимодальную обработку изображений с генерацией новых изображений по текстовому описанию
— применяла Real-ESRGAN для увеличения размера и разрешения изображений, улучшая их визуальное качество
Стек: Python, PyTorch, Deepseek Janus ProИсследовательский проект
Сравнение эффективности OCR и LLM моделей для задач распознавания русского текста - 04.2025-04.2025— провела исследование и протестировала различные подходы OCR-систем и LLM для обработки текстов на изображениях
— оценила преимущества и ограничения каждого метода в применении к русскому печатному тексту, что позволило выбрать наиболее эффективные решения
Стек: Python, OCR (Tesseract, EasyOCR, PaddleOCR, SuryaOCR), LLM API, UnslothПрототип
Автоматическая транскрипция видеоконференций и их суммаризация с LLM - 01.2025-03.2025Дообучение моделей WhisperAI и DeepSeek R1 для повышения качества транскрипции русской речи и извлечения ключевых моментов из текста с выдачей результата в формате JSON.
— повысила точность транскрипции аудиоданных
— реализовала извлечение ключевых моментов из транскрипции в структурированном виде
Стек: Python, NLP, Hugging Face, Transformers, Unsloth«НМИЦ ТПМ» Минздрава России
Проект «Разработка ИИ-системы, способной анализировать результаты биохимических анализов крови по сканированным документам ФГБУ» - 01.2025 - 03.2025Создала REST API для загрузки изображений и получения текста с помощью различных OCR-систем
Стек: Python, FastAPI, Uvicorn, Flask, OCR, EasyOCR, Tesseract, PaddleOCR, SuryaOCRZinkworks, Ireland
DevOps Engineer - 07.2020 - 08.2023— обслуживала 20 Unix-серверов и поддерживала кодовую базу на Python
— автоматизировала обновление серверов с использованием Ansible, сократив влияние человеческого фактора
— настроила CI/CD пайплайн с Jenkins, снизив объём ручной работы на 80%
— выполняла ручное развертывание с использованием Docker и KubernetesИсследовательский проект
Классификатор вида цветов по изображению - 12.2019-12.2019Обучила модель для распознавания видов цветов
Стек: Python, Torch, Pillow, TorchVisionИсследовательский проект
Классификатор пород собак по изображению - 11.2019-11.2019— построила нейронную сеть для распознавания пород собак на основе моделей ResNet, AlexNet, VGG
— достигла точности классификации на тестовых данных больше 90%
Стек: Python, Torch, Pillow, TorchVisionБКС
Quality Assurance Engineer - 05.2016-03.2020— разработала тестовую архитектуру, стек технологий и рабочие процессы проекта
— реализовала и поддерживала функциональные тесты, автоматизировала тестирование с использованием SoapUI Pro
— проводила нагрузочное тестирование с применением Gatling и JMeter
— тестировала API различных типов: REST, GraphQL, WebSockets и gRPC
Образование
«Data Scientist, нейронные сети, машинное обучение и искусственный интеллект
Университет искусственного интеллекта03/2025Master of Science in,Software design with Cloud computing
Technological University of the Shannon, Ireland2022Программное обеспечение вычислительной техники и автоматизированных систем
Сибирский государственный университет телекоммуникаций и информатики2012Machine Learning A-Z: AI, Python
Udemy2024Statistics for Business Analytics and Data Science A-ZTM
Udemy2024Cloud DevOps Engineer
Udacity2020AI Programming with Python Nanodegree
Udacity2019Автоматизация формирования коммерческого предложения на основе электрических схем
EKF AI Challenge2024Green Cloud Computing: A review of the energy efficiency of deployment technologies
Johnson Controls Tech Challenge2022
Обо мне
Data Scientist с опытом в CV, OCR , NLP и немного LLM. Разрабатываю и дообучаю нейросети для обработки изображений, аудио и текста. Владею PyTorch, TensorFlow, Hugging Face, Unsloth и DevOps-инструментами. Умею
сочетать анализ, исследование и инженерную реализацию для эффективных решений.