Qual papel de um SRE? Com o foco na confiabilidade do sistema, o objetivo do SRE está em encontrar formas para aprimorar o design e a operação dos sistemas para fazê-los mais escaláveis, confiáveis e mais eficientes. Em geral, uma equipe SRE é responsável pela disponibilidade, latência, desempenho, eficiência, gerenciamento de mudanças, monitoramento, resposta a emergências e planejamento de capacidade dos serviços sob sua supervisão. Isso significa que os SREs precisam ter uma compreensão holística dos sistemas e das conexões entre esses sistemas.
Um Engenheiro de Confiabilidade de Site (SRE) deve gastar até 50% do seu tempo fazendo trabalhos relacionados a operações, como: resolução de problemas, plantão e intervenção manual. Como o sistema de software que um SRE supervisiona deve ser altamente automático e auto-recuperável, o SRE deve gastar os outros 50% de seu tempo em tarefas de desenvolvimento, como novos recursos, dimensionamento ou automação. O candidato SRE ideal é um administrador de sistemas altamente qualificado com conhecimento de desenvolvimento de código e automação. São algumas das vantagens do SRE: - Reduzir os silos dentro da organização;
- O SRE compartilha a responsabilidade com os desenvolvedores, criando uma responsabilidade compartilhada;
- SREs tratam os riscos;
- O SRE incentiva os desenvolvedores e gestores de produtos a se movimentarem rapidamente, reduzindo o custo da falha;
- Alavancam o uso de ferramentas e automação;
- Criam métricas.
|