Data Scientist в Speech Lab

Контур
Контур — экосистема для бизнеса. Наши сервисы помогают каждой третьей компании России делать рабочие процессы проще и эффективнее: вести бухгалтерию, сдавать отчетность в госорганы, обмениваться документами без бумаги, общаться друг с другом на удаленке и многое другое. С нами жизнь 2,5 млн предпринимателей и их сотрудников становится легче.
Центр искусственного интеллекта в Контуре помогает зарабатывать деньги за счет технологий машинного обучения и Big Data. Например, чат-бот Сирена экономит около 25% времени консультантов техподдержки в чатах, а технология распознавания речи обрабатывает миллионы записей каждый год.
В команде центра ИИ работает более 70 человек: специалисты по Data Science, разработчики и аналитики данных, DevOps-инженеры, QA, системные аналитики, product- и project-менеджеры.
Для поддержки и развития инструментов и научной базы в центре ИИ есть лаборатории, каждая из которых специализируется в своей области машинного обучения: CV, Speech/NLP, ML4SE.
Мы ищем опытного коллегу в Speech-лабораторию. Работа будет разнообразной — от проведения исследований до передачи знаний в прикладные команды и публикации статей.
Задачи:
Разработка алгоритмов и моделей распознавания речи (обучение акустических моделей), в том числе для потокового распознавания.
Работа с языковыми моделями.
Cоздание и модификация алгоритмов декодирования, рескоринга.
Создание и сопровождение программных компонентов.
Проведение экспериментальных исследований, написание научных статей.
Создание датасетов для обучения и валидации (для разметки есть своя асессорская служба).
Наши ожидания:
Широкая насмотренность и опыт работы в области обработки речи (ASR/TTS) или обработки естественного языка (NLP).
Знание алгоритмов: динамическое программирование, алгоритмы на графах.
Хорошая базовая математическая подготовка: знание методов статистического анализа данных, построения математических моделей.
Опыт реализации моделей, описанных в научных статьях.
Будет плюсом:
Опыт работы с Triton Inference Server.
Наличие научных публикаций или проектов на GitHub.
Кандидатская диссертация в рассматриваемой или смежных областях.
Мы предлагаем:
- Уровень дохода, который зависит от ваших технических знаний и навыков. Регулярно пересматриваем зарплаты с учетом профессионального роста. Финансовые бонусы тоже есть.
- Заботу о вашем комфорте. Можете работать удаленно, гибридно или в офисе, в любом случае предоставим технику и все необходимое. Если вам по душе работать из офиса — обеспечим удобным местом, зонами отдыха, кухней с полезными перекусами.
- Сильное инженерное комьюнити. Регулярно проводим внутренние технические конференции, обмениваемся опытом между командами, проводим дизайн-ревью с экспертами в разных технологиях. Всегда найдется, с кем посоветоваться.
- Возможность сменить продукт, команду или предметную область внутри компании. Поддерживаем развитие в любом направлении.
- Общение на «ты» и максимум горизонтальных связей в коллективе, чтобы быстрее договариваться и решать рабочие задачи.
- Возможность делиться экспертизой. Помогаем выступить на конференции, поучаствовать в подкасте или видео, написать статью.
- Поддержку профессионального развития. Организуем внутреннее и внешнее обучение.