Senior/Lead SRE
NDA
Международная продуктовая iGaming компания ищет Senior/Lead SRE инженера, который возьмет на себя проактивную роль в разработке и улучшении систем и сервисов в одном из подразделений компании.
Вам предстоит участвовать в создании решений, внедрении новых технологий, оптимизации процессов, обеспечении высокой отказоустойчивости и надежности. Ожидается активное участие в разработке, проведении аудита новых решений, выявлении и устранении уязвимостей, а также повышении общей эффективности сервисов. Ваша работа станет важной частью обеспечения стабильности, производительности и масштабируемости наших продуктов.
Основные задачи:
1. Разработка и интеграция:
- Участие в разработке и внедрении новых систем и сервисов.
- Создание внутренних инструментов для автоматизации и повышения эффективности работы.
- Активное участие в процессе проектирования архитектуры и выборе технологий.
2. Надежность и отказоустойчивость:
- Аудит надежности систем и разработка стратегий повышения устойчивости.
- Проектирование и внедрение высокоотказоустойчивой архитектуры.
- Разработка стратегий Disaster Recovery и обеспечения непрерывности бизнеса.
- Внедрение SLO (Service Level Objectives) и управление Error Budget.
3. Безопасность и соответствие стандартам:
- Поддержка высокого уровня информационной безопасности систем.
- Обеспечение соответствия систем нормативным требованиям и стандартам (GDPR, ISO, PCI DSS).
4. Оптимизация и масштабирование:
- Оптимизация производительности систем и сервисов.
- Планирование емкости и масштабирование инфраструктуры под потребности бизнеса.
- Оптимизация затрат на облачные ресурсы.
5. Автоматизация и процессы:
- Автоматизация процессов с использованием подходов IaC (Terraform, Ansible).
- Настройка и улучшение CI/CD процессов.
- Улучшение мониторинга, алертинга и быстрого реагирования на инциденты.
6. Инцидент-менеджмент:
- Реагирование на инциденты, проведение постмортемов и разработка предложений по улучшению.
- Участие в on-call дежурствах и оперативное реагирование на инциденты.
7. Взаимодействие и поддержка разработки:
- Тесное сотрудничество с командами разработки для повышения надежности и эффективности процессов.
- Интеграция лучших практик разработки в инфраструктурные процессы.
- Менторство и обучение команды, развитие инженерных практик.
- Документирование процессов и решений.
Наши ожидания:
- Глубокие знания AWS и других облачных решений (Azure, Google Cloud, Yandex.Cloud и т.п.).
- Опыт работы с системами виртуализации и контейнеризации.
- Опыт работы с Kubernetes: управление, настройка, мониторинг и обеспечение отказоустойчивости приложений.
- Понимание архитектуры современных распределённых систем и умение применять лучшие практики проектирования.
- Опыт построения и управления геораспределённой инфраструктурой с использованием нескольких зон доступности (AZ) для
- Обеспечения отказоустойчивости и высокой доступности.
- Навыки backend разработки на Node.js и TypeScript.
- Опыт настройки и оптимизации CI/CD пайплайнов (например, с помощью GitLab CI и/или Argo CD).
- Умение строить надежные системы мониторинга, логирования и трассировки (Prometheus, Grafana, Jaeger и пр.).
- Опыт работы с базами данных (PostgreSQL, MySQL, Redis) и навыки их оптимизации.
- Знание брокеров и очередей сообщений (Kafka, Rabbit MQ, NATS) и опыт их интеграции.
- Отличное понимание DevOps-подходов и автоматизации инфраструктуры с помощью Terraform, Ansible и других IaC
инструментов. - Навыки устранения проблем в продакшне, участие в инцидент-менеджменте.
- Опыт планирования восстановления после сбоев и реализации стратегий Disaster Recovery.
- Опыт в оптимизации производительности систем, снижении затрат и планировании ресурсов.
- Отличные навыки коммуникации и лидерства, способность работать в команде и менторить младших инженеров.
Будет плюсом:
- Опыт применения практик и инструментов Chaos Engineering.
- Знание других языков программирования (Python, PHP, Java, Kotlin, Go и т.д.).
- Опыт управления инфраструктурой в multicloud и hybrid средах.
- Опыт работы с serverless-архитектурами (AWS Lambda, API Gateway, S3 и пр.).
- Знания стандартов и практик соответствия требованиям (GDPR, ISO, PCI DSS).
- Понимание принципов информационной безопасности, управление доступами и секретами, опыт работы с DevSecOps
практиками. - Опыт миграции легаси-систем на современные технологии.
- Знания в области оптимизации высоконагруженных приложений.
Для тебя:
- Дружная команда крутых специалистов и максимально комфортная рабочая атмосфера;
- Гибкое начало дня (с 9 до 12 по МСК);
- Полностью оборудованное рабочее место;
- Возможность полностью удаленной работы;
- Официальное трудоустройство;
- ДМС со стоматологией после испытательного срока;
- Частичная компенсация курсов английского языка и занятий в фитнес-зале;
- Зоны отдыха с игровыми приставками, настольным теннисом, кикером, самокатами и кухней;
- Доступ к корпоративной библиотеке;
- Корпоративы с выездами на природу и призами, тимбилдинги, мастер-классы и тд;
- Релокационный пакет и возможность получения отсрочки от призыва на мобилизацию.