Data Engineer (LLM)

  • Junior
  • Middle
  • Senior
  • Team Lead
  • Полная занятость
  • Гибридный режим
  • Релокация
  • Удаленная работа
  • Локация не указана
  • Полная занятость
  • Локация не указана

Вебсайт Softvoya

📌 Задачи:
• Подключаться к источникам бизнеса (ERP/CRM/биллинги/лог-шины/API), консолидировать разрозненные данные.
• Строить и поддерживать надёжные конвейеры (батч/стриминг) с оркестрацией, мониторингом и алертингом.
• Готовить «ML-готовые» датасеты и фичи: схемы, слои, форматы, версионирование.
• Обеспечивать хранение: проектировать DWH/даталейк/лейкхаус, индексацию, партиционирование, компрессию.
• Настраивать data quality/контракты данных (валидации, тесты, SLA)
• Оптимизировать стоимость и производительность: планирование ресурсов, профилирование, кэш/материализация.
• Интегрировать ML/LLM-пайплайны: оффлайн/онлайн фичи, фичастор, подготовка корпусов для RAG, векторные БД.

💻 Требования:
3+ лет в data-инженерии: проектирование и эксплуатация конвейеров данных (батч/стриминг).
Уверенный SQL (аналитический, оконные функции, оптимизация) и Python для пайплайнов/утилит.
Опыт с Airflow (DAG, зависимости, сенсоры, SLA, retries)
Проектирование слоёв данных и форматов, S3-совместимые стораджи
Практика data quality (тесты, профили, контракты)
Понимание ML-пайплайнов на уровне подготовки признаков/датасетов для обучения и сервинга.
Базовая безопасность данных

Фильтры: Junior, Middle, Senior, Team Lead, Гибридный режим, Релокация, Удаленная работа

Прежде чем подать отклик на эту вакансию, вам необходимо создать свое онлайн-резюме. Нажмите на кнопку ниже, чтобы продолжить.

Создать подписку на вакансии в Telegram боте

Категории вакансии

Softvoya

Вакансию опубликовал(а):

Похожие вакансии

Приложение GeekLink

Установить
×
41 / 0,539 / 47.7mb