Senior/Lead SRE

  • Senior
  • Team Lead
  • Full Time
  • Relocation
  • Remote
  • Anywhere
  • Полная занятость
  • Anywhere

NDA

Международная продуктовая iGaming компания ищет Senior/Lead SRE инженера, который возьмет на себя проактивную роль в разработке и улучшении систем и сервисов в одном из подразделений компании.

Вам предстоит участвовать в создании решений, внедрении новых технологий, оптимизации процессов, обеспечении высокой отказоустойчивости и надежности. Ожидается активное участие в разработке, проведении аудита новых решений, выявлении и устранении уязвимостей, а также повышении общей эффективности сервисов. Ваша работа станет важной частью обеспечения стабильности, производительности и масштабируемости наших продуктов.

Основные задачи:

1. Разработка и интеграция:

  • Участие в разработке и внедрении новых систем и сервисов.
  • Создание внутренних инструментов для автоматизации и повышения эффективности работы.
  • Активное участие в процессе проектирования архитектуры и выборе технологий.

2. Надежность и отказоустойчивость:

  • Аудит надежности систем и разработка стратегий повышения устойчивости.
  • Проектирование и внедрение высокоотказоустойчивой архитектуры.
  • Разработка стратегий Disaster Recovery и обеспечения непрерывности бизнеса.
  • Внедрение SLO (Service Level Objectives) и управление Error Budget.

3. Безопасность и соответствие стандартам:

  • Поддержка высокого уровня информационной безопасности систем.
  • Обеспечение соответствия систем нормативным требованиям и стандартам (GDPR, ISO, PCI DSS).

4. Оптимизация и масштабирование:

  • Оптимизация производительности систем и сервисов.
  • Планирование емкости и масштабирование инфраструктуры под потребности бизнеса.
  • Оптимизация затрат на облачные ресурсы.

5. Автоматизация и процессы:

  • Автоматизация процессов с использованием подходов IaC (Terraform, Ansible).
  • Настройка и улучшение CI/CD процессов.
  • Улучшение мониторинга, алертинга и быстрого реагирования на инциденты.

6. Инцидент-менеджмент:

  • Реагирование на инциденты, проведение постмортемов и разработка предложений по улучшению.
  • Участие в on-call дежурствах и оперативное реагирование на инциденты.

7. Взаимодействие и поддержка разработки:

  • Тесное сотрудничество с командами разработки для повышения надежности и эффективности процессов.
  • Интеграция лучших практик разработки в инфраструктурные процессы.
  • Менторство и обучение команды, развитие инженерных практик.
  • Документирование процессов и решений.

Наши ожидания:

  • Глубокие знания AWS и других облачных решений (Azure, Google Cloud, Yandex.Cloud и т.п.).
  • Опыт работы с системами виртуализации и контейнеризации.
  • Опыт работы с Kubernetes: управление, настройка, мониторинг и обеспечение отказоустойчивости приложений.
  • Понимание архитектуры современных распределённых систем и умение применять лучшие практики проектирования.
  • Опыт построения и управления геораспределённой инфраструктурой с использованием нескольких зон доступности (AZ) для
  • Обеспечения отказоустойчивости и высокой доступности.
  • Навыки backend разработки на Node.js и TypeScript.
  • Опыт настройки и оптимизации CI/CD пайплайнов (например, с помощью GitLab CI и/или Argo CD).
  • Умение строить надежные системы мониторинга, логирования и трассировки (Prometheus, Grafana, Jaeger и пр.).
  • Опыт работы с базами данных (PostgreSQL, MySQL, Redis) и навыки их оптимизации.
  • Знание брокеров и очередей сообщений (Kafka, Rabbit MQ, NATS) и опыт их интеграции.
  • Отличное понимание DevOps-подходов и автоматизации инфраструктуры с помощью Terraform, Ansible и других IaC
    инструментов.
  • Навыки устранения проблем в продакшне, участие в инцидент-менеджменте.
  • Опыт планирования восстановления после сбоев и реализации стратегий Disaster Recovery.
  • Опыт в оптимизации производительности систем, снижении затрат и планировании ресурсов.
  • Отличные навыки коммуникации и лидерства, способность работать в команде и менторить младших инженеров.

Будет плюсом:

  • Опыт применения практик и инструментов Chaos Engineering.
  • Знание других языков программирования (Python, PHP, Java, Kotlin, Go и т.д.).
  • Опыт управления инфраструктурой в multicloud и hybrid средах.
  • Опыт работы с serverless-архитектурами (AWS Lambda, API Gateway, S3 и пр.).
  • Знания стандартов и практик соответствия требованиям (GDPR, ISO, PCI DSS).
  • Понимание принципов информационной безопасности, управление доступами и секретами, опыт работы с DevSecOps
    практиками.
  • Опыт миграции легаси-систем на современные технологии.
  • Знания в области оптимизации высоконагруженных приложений.

Для тебя:

  • Дружная команда крутых специалистов и максимально комфортная рабочая атмосфера;
  • Гибкое начало дня (с 9 до 12 по МСК);
  • Полностью оборудованное рабочее место;
  • Возможность полностью удаленной работы;
  • Официальное трудоустройство;
  • ДМС со стоматологией после испытательного срока;
  • Частичная компенсация курсов английского языка и занятий в фитнес-зале;
  • Зоны отдыха с игровыми приставками, настольным теннисом, кикером, самокатами и кухней;
  • Доступ к корпоративной библиотеке;
  • Корпоративы с выездами на природу и призами, тимбилдинги, мастер-классы и тд;
  • Релокационный пакет и возможность получения отсрочки от призыва на мобилизацию.

Tagged as: Senior, Team Lead, Релокация, Удаленная работа

Before applying for this position you need to submit your online resume. Click the button below to continue.

Создать подписку на вакансии в Telegram боте

NDA

The vacancy was posted by:

Related Jobs

65 / 0.445 / 54.48mb