Gestão de infra-estrutura e plataformas
Processo end-to-end com cloud, on-prem, híbrido, IaC e governance de plataformas
Descarregar pack completoÂmbito e objectivos
Supervisionar a infraestrutura e as plataformas utilizadas pela organização, garantindo que os recursos tecnológicos suportam os serviços de negócio de forma fiável, segura, eficiente e alinhada com a estratégia tecnológica.
Necessidade de nova infraestrutura, ciclo de planeamento de capacidade, alerta de degradação, patch disponível ou revisão periódica da estratégia de infraestrutura.
Desde a estratégia de infraestrutura até à operação e monitorização, incluindo cloud, IaC, plataformas de dados, redes, segurança de infraestrutura e decommissioning.
Desenvolvimento de aplicações (gestão de desenvolvimento de software), resposta a incidentes operacionais em tempo real (gestão de incidentes) e aquisição de hardware (gestão de fornecedores).
Estratégia de infraestrutura aprovada, plano de capacidade, relatório de conformidade de patches, cobertura IaC e relatório de incidentes por plataforma com tendências.
Diagrama do processo
Diagrama BPMN simplificado do processo de gestão de infraestrutura e plataformas (3 swimlanes). Percorra horizontalmente em dispositivos móveis.
Actividades macro
| # | Actividade | Responsável | Input | Output |
|---|---|---|---|---|
| 1 | Estratégia de infraestrutura | Infrastructure manager | Estratégia organizacional, roadmap arquitectural | Estratégia de infraestrutura e cloud governance aprovada |
| 2 | Planeamento de capacidade e performance | DevOps/Ops / Capacity manager | Dados de utilização, previsões de crescimento | Plano de capacidade e acções de optimização |
| 3 | Governance cloud | Infrastructure manager | Políticas de cloud, custos actuais | Políticas de cloud aplicadas, relatório de custo por serviço |
| 4 | Gestão de IaC | DevOps/Ops | Repositório IaC, requisitos de infraestrutura | Infraestrutura provisionada via código, cobertura IaC aumentada |
| 5 | Monitorização e operações | DevOps/Ops | Alertas, métricas de plataforma, SLAs | Dashboard de saúde de infraestrutura, alertas tratados |
| 6 | Gestão de patches e actualizações | DevOps/Ops | Boletins de segurança, patches disponíveis | Patches aplicados, conformidade de patches reportada |
| 7 | Decommissioning | Infrastructure manager / Service owner | Componentes obsoletos ou em fim de vida | Componentes retirados, custos reduzidos, CMDB actualizada |
| 8 | Revisão e melhoria | Infrastructure manager | Métricas de operação, incidentes por plataforma | Processo e estratégia de infraestrutura actualizados |
Descrição detalhada das actividades
O infrastructure manager define a estratégia de infraestrutura com base nos objectivos de negócio, no roadmap arquitectural e nas tendências de mercado. A estratégia inclui decisões sobre cloud, on-premises, híbrido, e os princípios de governance que orientam todas as decisões de infraestrutura.
Passos chave
- Analisar necessidades de negócio e roadmap tecnológico
- Definir modelo cloud (public, private, hybrid, multi-cloud)
- Estabelecer políticas de cloud governance e FinOps
- Aprovar estratégia com o CTO e os service owners
A equipa DevOps/Ops analisa a utilização actual e prevista da infraestrutura para garantir que a capacidade está dimensionada correctamente, evitando tanto a sub-provisão (indisponibilidade) como o sobre-provisionamento (desperdício de custos).
Passos chave
- Analisar tendências de utilização dos últimos 3 a 12 meses
- Projectar necessidades de crescimento por plataforma
- Identificar gargalos de performance actuais e potenciais
- Recomendar acções de expansão, optimização ou redimensionamento
O infrastructure manager assegura que o uso de cloud é feito de forma controlada, segura e eficiente em custos. A governance cloud inclui políticas de aprovisionamento, tagging, gestão de custos (FinOps) e conformidade de segurança.
Passos chave
- Definir e aplicar políticas de tagging e naming conventions
- Monitorizar custos por serviço, equipa e ambiente
- Identificar e eliminar recursos não utilizados ou sub-utilizados
- Assegurar conformidade com políticas de segurança cloud
- Reportar custo por serviço aos service owners mensalmente
A infra-as-code (IaC) é a abordagem preferencial para provisionar e gerir infraestrutura de forma repetível, auditável e sujeita a controlo de versão. A equipa DevOps/Ops mantém os repositórios IaC, assegurando que o ambiente real corresponde sempre ao código declarado.
Passos chave
- Manter repositório IaC com código revisto e aprovado
- Provisionar novas infraestruturas exclusivamente via IaC
- Realizar drift detection para identificar desvios manuais
- Aumentar progressivamente a cobertura IaC para componentes legados
A equipa DevOps/Ops opera continuamente a infraestrutura, respondendo a alertas, ajustando recursos e garantindo que as plataformas funcionam dentro dos parâmetros definidos. A monitorização é proactiva: os problemas devem ser identificados antes de afectarem os serviços.
Passos chave
- Manter dashboards de saúde de todas as plataformas críticas
- Responder a alertas dentro dos SLAs definidos
- Ajustar recursos de forma dinâmica (auto-scaling, optimização)
- Documentar eventos relevantes e escalação quando necessário
A gestão de patches é uma actividade crítica de segurança e estabilidade. A equipa DevOps/Ops aplica patches de forma planeada, minimizando o impacto nos serviços e respeitando as janelas de manutenção acordadas com os service owners.
Passos chave
- Monitorizar boletins de segurança e patches disponíveis
- Avaliar criticidade e urgência de cada patch
- Planear e comunicar janelas de manutenção
- Aplicar patches em ambiente de teste antes de produção
- Documentar patches aplicados e actualizar conformidade
O decommissioning planeado de componentes de infraestrutura obsoletos ou substituídos reduz a superfície de ataque, os custos e a complexidade operacional. O infrastructure manager coordena o processo com os service owners para garantir que não há dependências activas no momento da retirada.
Passos chave
- Identificar componentes em fim de vida ou substituídos
- Verificar ausência de dependências activas com os service owners
- Planear e executar o decommissioning com janela de manutenção
- Actualizar a CMDB e documentar a retirada
- Garantir a eliminação segura de dados
O infrastructure manager revê periodicamente o processo e as métricas de infraestrutura, identificando oportunidades de optimização técnica, redução de custos e melhoria da resiliência. As melhorias são incorporadas na estratégia e no roadmap.
Passos chave
- Rever métricas de uptime, custos, incidentes por plataforma e conformidade
- Identificar padrões de incidentes recorrentes relacionados com infraestrutura
- Avaliar novas tecnologias e padrões de infraestrutura relevantes
- Actualizar estratégia e roadmap de infraestrutura
Modelo RACI
| Actividade | Infra manager (IM) |
DevOps/Ops (DO) |
Segurança (SEC) |
Capacity manager (CM) |
Service owner (SO) |
|---|---|---|---|---|---|
| Estratégia de infraestrutura | A | R | C | C | I |
| Planeamento de capacidade | A | R | - | R | C |
| Governance cloud | A | R | C | - | I |
| Gestão de IaC | A | R | C | - | - |
| Monitorização e operações | A | R | C | I | I |
| Gestão de patches | A | R | R | - | I |
| Decommissioning | R | R | C | - | A |
| Revisão e melhoria | A | R | C | C | I |
Métricas e KPIs
| Métrica | Descrição | Target sugerido |
|---|---|---|
| Uptime | Disponibilidade média das plataformas críticas, calculada mensalmente por plataforma | > 99,9% |
| Conformidade de patches | Percentagem de sistemas com todos os patches críticos aplicados dentro do prazo definido | > 95% |
| Custo cloud por serviço | Custo médio mensal de cloud alocado a cada serviço activo, com tendência mensal | Tendência decrescente |
| Cobertura IaC | Percentagem de componentes de infraestrutura provisionados e geridos exclusivamente via IaC | > 80% |
| Incidentes por plataforma | Número de incidentes de serviço com causa raiz em infraestrutura, por plataforma e mês | Tendência decrescente |
Interfaces com outros processos
Gestão de arquitectura
O roadmap arquitectural e os standards tecnológicos definem as evoluções de infraestrutura necessárias e as tecnologias aprovadas para uso.
Monitorização e eventos
A infraestrutura operacional gera os alertas e eventos que alimentam o processo de monitorização e, quando necessário, criam incidentes automaticamente.
Change enablement
As alterações à infraestrutura (patches, actualizações, novos componentes) passam pelo processo de change enablement para controlo e aprovação.
Gestão de configuração (CMDB)
Todos os componentes de infraestrutura são registados na CMDB, com relações e dependências actualizadas após cada mudança ou decommissioning.
Gestão de desenvolvimento de software
Os pipelines CI/CD e os requisitos de infraestrutura das aplicações são coordenados entre as equipas de desenvolvimento e de infraestrutura.
Gestão de fornecedores
Os contratos com fornecedores de cloud, hardware e software de infraestrutura são geridos pela gestão de fornecedores e influenciam as opções disponíveis.
Descarregar o pack completo
Inclui o processo documentado, template de plano de capacidade, relatório de compliance de patches, modelo RACI em Excel e guia de cloud governance.