Telecom & Utilities

Azure Reliability Engineer

A área das telecomunicações está em constante evolução. Se também gostarias de fazer parte deste movimento, este projeto poderá ser do teu interesse, já que aqui terás a possibilidade de contactar com um dos líderes na criação e distribuição de soluções fixas e móveis de televisão, internet, voz e dados a nível nacional.

Procuramos um Azure Reliability Engineer para um projeto em regime de trabalho hibrido para Lisboa (hibrido).

Requisitos Técnicos:

  • Experiência comprovada em Microsoft Azure (IaaS, PaaS, Networking, Monitoring, Automation).
  • Domínio de Azure DevOps, CI/CD pipelines, e Infraestrutura como Código (Terraform, ARM, Bicep).
  • Experiência em monitorização e fiabilidade de sistemas cloud-native (Azure Monitor, Log Analytics, App Insights).
  • Conhecimentos sólidos de contenção e orquestração (Docker, Kubernetes, AKS).
  • Familiaridade com linguagens de scripting (PowerShell, Python, Bash).
  • Capacidade de diagnóstico e resolução de incidentes complexos em ambientes de alta disponibilidade.

Valorizamos:

  • Certificações Microsoft (ex.: AZ-104, AZ-400, AZ-305, AZ-500).
  • Experiência com práticas SRE, SLI/SLOs, chaos engineering ou performance tuning.
  • Conhecimento de ferramentas de observabilidade (Grafana, Prometheus, Elastic Stack).
  • Experiência em ambientes híbridos (on-premises + cloud)

Principais Responsabilidades:

  •  Implementar e manter infraestruturas altamente disponíveis na cloud Azure, com enfoque em resiliência, escalabilidade e segurança.
  • Garantir a observabilidade e monitorização contínua dos sistemas através de Azure Monitor, Log Analytics, Application Insights e alertas proactivos.
  • Automatizar tarefas operacionais e processos de deploy e configuração utilizando Azure DevOps, Terraform, ARM Templates ou Bicep.
  • Colaborar com equipas de desenvolvimento e operações para melhorar a fiabilidade dos serviços, optimizar custos e prevenir falhas.
  • Apoiar na gestão de incidentes, root cause analysis e definição de SLOs/SLIs (Service Level Objectives/Indicators).
  • Implementar boas práticas de Site Reliability Engineering (SRE) e DevOps, alinhadas com os princípios de automação, observabilidade e melhoria contínua.
  • Garantir a conformidade com políticas de segurança, backup, disaster recovery e compliance.

O que oferecemos? 

  • Seguro de Saúde; 
  • Plano de formação ajustado e personalizado, com um orçamento para gastares nas formações e livros técnicos que considerares necessários; 
  • Feedback constante e acompanhamento para que possas crescer profissionalmente; 
  • Processo de onboarding remoto; 
  • Eventos de equipa todos os semestres para que possas viver novas aventuras; 
  • Descontos e ofertas exclusivas nos nossos parceiros; 
  • Cultura de proximidade e transparência. As tuas ideias e necessidades são ouvidas e valorizadas por nós!