Telecom & Utilities
Azure Reliability Engineer
A área das telecomunicações está em constante evolução. Se também gostarias de fazer parte deste movimento, este projeto poderá ser do teu interesse, já que aqui terás a possibilidade de contactar com um dos líderes na criação e distribuição de soluções fixas e móveis de televisão, internet, voz e dados a nível nacional.
Procuramos um Azure Reliability Engineer para um projeto em regime de trabalho hibrido para Lisboa (hibrido).
Requisitos Técnicos:
- Experiência comprovada em Microsoft Azure (IaaS, PaaS, Networking, Monitoring, Automation).
- Domínio de Azure DevOps, CI/CD pipelines, e Infraestrutura como Código (Terraform, ARM, Bicep).
- Experiência em monitorização e fiabilidade de sistemas cloud-native (Azure Monitor, Log Analytics, App Insights).
- Conhecimentos sólidos de contenção e orquestração (Docker, Kubernetes, AKS).
- Familiaridade com linguagens de scripting (PowerShell, Python, Bash).
- Capacidade de diagnóstico e resolução de incidentes complexos em ambientes de alta disponibilidade.
Valorizamos:
- Certificações Microsoft (ex.: AZ-104, AZ-400, AZ-305, AZ-500).
- Experiência com práticas SRE, SLI/SLOs, chaos engineering ou performance tuning.
- Conhecimento de ferramentas de observabilidade (Grafana, Prometheus, Elastic Stack).
- Experiência em ambientes híbridos (on-premises + cloud)
Principais Responsabilidades:
- Implementar e manter infraestruturas altamente disponíveis na cloud Azure, com enfoque em resiliência, escalabilidade e segurança.
- Garantir a observabilidade e monitorização contínua dos sistemas através de Azure Monitor, Log Analytics, Application Insights e alertas proactivos.
- Automatizar tarefas operacionais e processos de deploy e configuração utilizando Azure DevOps, Terraform, ARM Templates ou Bicep.
- Colaborar com equipas de desenvolvimento e operações para melhorar a fiabilidade dos serviços, optimizar custos e prevenir falhas.
- Apoiar na gestão de incidentes, root cause analysis e definição de SLOs/SLIs (Service Level Objectives/Indicators).
- Implementar boas práticas de Site Reliability Engineering (SRE) e DevOps, alinhadas com os princípios de automação, observabilidade e melhoria contínua.
- Garantir a conformidade com políticas de segurança, backup, disaster recovery e compliance.
O que oferecemos?
- Seguro de Saúde;
- Plano de formação ajustado e personalizado, com um orçamento para gastares nas formações e livros técnicos que considerares necessários;
- Feedback constante e acompanhamento para que possas crescer profissionalmente;
- Processo de onboarding remoto;
- Eventos de equipa todos os semestres para que possas viver novas aventuras;
- Descontos e ofertas exclusivas nos nossos parceiros;
- Cultura de proximidade e transparência. As tuas ideias e necessidades são ouvidas e valorizadas por nós!