Artem Raychuk - Data scientist

  • Middle
  • Испания
  • 2 000 € (евро/мес)
  • Полная занятость
  • Готов(а) к удаленной работе
  • Готов(а) к релокации
  • Обновлено 4 месяца назад
Photo

Навыки

  • Airflow
  • Catboost
  • FastAPI
  • Git
  • Langchain
  • LlamaIndex
  • MongoDB
  • MS SQL
  • Numpy
  • OpenAI
  • Pandas
  • PostgreSQL
  • Power BI
  • Python
  • Pytorch
  • R
  • Scikit-learn
  • SQL
  • Tableau
  • Transformers
  • XGBoost

Опыт работы

ФСК

Data scientist - май 2023

• Разработал пайплайн обработки изображений с использованием InternVL и OCR для планов квартир и зданий, управляемый с помощью Apache Airflow для ETL-процессов и хранения метаданных в MongoDB/PostgreSQL, достигнув точности извлечения сущностей в 95%.
• Создал несколько чат-ботов на различных LLM (OpenAI, Claude, LLaMA, Mistral) для задач QA, Doc QA, NER и определения намерений.
• Реализовал ML-ориентированные REST API на базе FastAPI для задач инференса, включая генерацию изображений (DALL‑E 2), анализ тональности и NER с использованием fuzzy matching.
• Построил гибридную рекомендательную систему для недвижимости, сочетающую векторный поиск и коллаборативную фильтрацию ALS, с динамическим взвешиванием, что позволило достичь CTR в 12%.
Стек: Python, FastAPI, Airflow, Transformers, PyTorch, scikit-learn, MongoDB, PostgreSQL

Объединенная металлургическая компания

Data analyst - Февраль 2022 — Август 2022

Я сталкивался и решал такие задачи как:
-оценка потенциальных резервов в разрезе статей чистой прибыли
-оценка годовых бланков целей (проверка исполнения методологии процесса целеполагания
-аналитика по итогам годового цикла (описательная статистика, корреляционный анализ, формулирование выводов)

Образование

Экономика

Московский государственный университет имени М.В.Ломоносова
2022

Обо мне

• Разработал пайплайн обработки изображений с использованием InternVL и OCR для планов квартир и зданий, управляемый с помощью Apache Airflow для ETL-процессов и хранения метаданных в MongoDB/PostgreSQL, достигнув точности извлечения сущностей в 95%.
• Создал несколько чат-ботов на различных LLM (OpenAI, Claude, LLaMA, Mistral) для задач QA, Doc QA, NER и определения намерений.
• Реализовал ML-ориентированные REST API на базе FastAPI для задач инференса, включая генерацию изображений (DALL‑E 2), анализ тональности и NER с использованием fuzzy matching.
• Построил гибридную рекомендательную систему для недвижимости, сочетающую векторный поиск и коллаборативную фильтрацию ALS, с динамическим взвешиванием, что позволило достичь CTR в 12%.

43 / 0,330 / 54.67mb