Artem Raychuk - Data scientist
Навыки
- Airflow
- Catboost
- FastAPI
- Git
- Langchain
- LlamaIndex
- MongoDB
- MS SQL
- Numpy
- OpenAI
- Pandas
- PostgreSQL
- Power BI
- Python
- Pytorch
- R
- Scikit-learn
- SQL
- Tableau
- Transformers
- XGBoost
Опыт работы
ФСК
Data scientist - май 2023• Разработал пайплайн обработки изображений с использованием InternVL и OCR для планов квартир и зданий, управляемый с помощью Apache Airflow для ETL-процессов и хранения метаданных в MongoDB/PostgreSQL, достигнув точности извлечения сущностей в 95%.
• Создал несколько чат-ботов на различных LLM (OpenAI, Claude, LLaMA, Mistral) для задач QA, Doc QA, NER и определения намерений.
• Реализовал ML-ориентированные REST API на базе FastAPI для задач инференса, включая генерацию изображений (DALL‑E 2), анализ тональности и NER с использованием fuzzy matching.
• Построил гибридную рекомендательную систему для недвижимости, сочетающую векторный поиск и коллаборативную фильтрацию ALS, с динамическим взвешиванием, что позволило достичь CTR в 12%.
Стек: Python, FastAPI, Airflow, Transformers, PyTorch, scikit-learn, MongoDB, PostgreSQLОбъединенная металлургическая компания
Data analyst - Февраль 2022 — Август 2022Я сталкивался и решал такие задачи как:
-оценка потенциальных резервов в разрезе статей чистой прибыли
-оценка годовых бланков целей (проверка исполнения методологии процесса целеполагания
-аналитика по итогам годового цикла (описательная статистика, корреляционный анализ, формулирование выводов)
Образование
Экономика
Московский государственный университет имени М.В.Ломоносова2022
Обо мне
• Разработал пайплайн обработки изображений с использованием InternVL и OCR для планов квартир и зданий, управляемый с помощью Apache Airflow для ETL-процессов и хранения метаданных в MongoDB/PostgreSQL, достигнув точности извлечения сущностей в 95%.
• Создал несколько чат-ботов на различных LLM (OpenAI, Claude, LLaMA, Mistral) для задач QA, Doc QA, NER и определения намерений.
• Реализовал ML-ориентированные REST API на базе FastAPI для задач инференса, включая генерацию изображений (DALL‑E 2), анализ тональности и NER с использованием fuzzy matching.
• Построил гибридную рекомендательную систему для недвижимости, сочетающую векторный поиск и коллаборативную фильтрацию ALS, с динамическим взвешиванием, что позволило достичь CTR в 12%.