Продолжаем знакомить вас с деятельностью специалистов разных IT-профессий. На этот раз рассказываем про преимущества и недостатки работы Site Reliability Engineer.
Дмитрий Локтаев, 29 лет, город — Алматы, SRE Engineer в inDrive
Как пришел в профессию
Я начал карьеру системным администратором в небольшой компании, предоставляющей IT-услуги на аутсорс. Одним из ее клиентов была компания inDrive. После расширения офисов inDrive в Москве я получил приглашение на работу. Принял его и стал частью команды, где через некоторое время меня назначили тимлидом офисных администраторов.
После года работы в этой роли я захотел работать с высоконагруженными проектами. Поэтому перешел в команду SRE на должность junior. А спустя семь месяцев работы стал middle-специалистом.
О работе Site Reliability Engineer
SRE-инженер улучшает и поддерживает надежность, наблюдаемость, масштабируемость сервисов. Мы обеспечиваем максимальную доступность. Это важно, потому что простои для высоконагруженных проектов — это большие потери.
В работе я сталкиваюсь с разными задачами, начиная от настройки сервера, заканчивая деплоем — его развертыванием и запуском, а также поддержкой.
SRE-инженер улучшает и поддерживает надежность, наблюдаемость, масштабируемость сервисов
Я занимаюсь настройкой и сопровождением инфраструктуры, мониторингом производительности и безопасности системы, а также устранением инцидентов и проведением их анализа.
О преимуществах и недостатках
К преимуществам работы SRE-инженером могу отнести:
— высококвалифицированную командную работу
— работу с новыми технологиями и инструментами
— возможность автоматизации процессов
— высокую оплату труда.
Есть и недостатки: работа SRE-специалиста связана с нагрузкой и напряжением, так как они должны быстро реагировать на проблемы, иметь глубокие знания в области IT. Мы несем ответственность за надежность, безопасность и производительность сервисов.
Что должен знать и уметь Site Reliability Engineer
Навыки и знания, требуемые для работы SRE-специалистом, зависят от стека конкретной компании. Можно изучить вакансии и посмотреть, что больше всего требуется от кандидатов в них.
Вот что я советую изучать: K8s, Docker, AWS, Prometheus, Grafana, ElasticSearch, Nginx, Ansible, Go, Python.
Советы начинающим
Один из лучших способов для обучения SRE — практика и опыт, который можно получить, работая в этой области.
Есть и другие способы, которые могут помочь в изучении этой профессии. Одна из рекомендаций — книга от Google, которая называется Site Reliability Engineering.
Также важно изучать Linux-системы, сети и языки программирования, такие как Python, Bash и Go.
Полезно учиться работать с инструментами по автоматизации конфигурации, например, с помощью Ansible или SaltStack.
Нужно постоянно отслеживать тенденции в области, изучать новые технологии и методы, принимать участие в мероприятиях и конференциях, посвященных этой теме.