Processo ITSM Alinhado com ITIL

Gestão de infra-estrutura e plataformas

Processo end-to-end com cloud, on-prem, híbrido, IaC e governance de plataformas

Descarregar pack completo

Âmbito e objectivos

Objectivo

Supervisionar a infraestrutura e as plataformas utilizadas pela organização, garantindo que os recursos tecnológicos suportam os serviços de negócio de forma fiável, segura, eficiente e alinhada com a estratégia tecnológica.

Trigger

Necessidade de nova infraestrutura, ciclo de planeamento de capacidade, alerta de degradação, patch disponível ou revisão periódica da estratégia de infraestrutura.

Âmbito

Desde a estratégia de infraestrutura até à operação e monitorização, incluindo cloud, IaC, plataformas de dados, redes, segurança de infraestrutura e decommissioning.

Fora do âmbito

Desenvolvimento de aplicações (gestão de desenvolvimento de software), resposta a incidentes operacionais em tempo real (gestão de incidentes) e aquisição de hardware (gestão de fornecedores).

Output

Estratégia de infraestrutura aprovada, plano de capacidade, relatório de conformidade de patches, cobertura IaC e relatório de incidentes por plataforma com tendências.

Diagrama do processo

Diagrama BPMN simplificado do processo de gestão de infraestrutura e plataformas (3 swimlanes). Percorra horizontalmente em dispositivos móveis.

Actividades macro

# Actividade Responsável Input Output
1 Estratégia de infraestrutura Infrastructure manager Estratégia organizacional, roadmap arquitectural Estratégia de infraestrutura e cloud governance aprovada
2 Planeamento de capacidade e performance DevOps/Ops / Capacity manager Dados de utilização, previsões de crescimento Plano de capacidade e acções de optimização
3 Governance cloud Infrastructure manager Políticas de cloud, custos actuais Políticas de cloud aplicadas, relatório de custo por serviço
4 Gestão de IaC DevOps/Ops Repositório IaC, requisitos de infraestrutura Infraestrutura provisionada via código, cobertura IaC aumentada
5 Monitorização e operações DevOps/Ops Alertas, métricas de plataforma, SLAs Dashboard de saúde de infraestrutura, alertas tratados
6 Gestão de patches e actualizações DevOps/Ops Boletins de segurança, patches disponíveis Patches aplicados, conformidade de patches reportada
7 Decommissioning Infrastructure manager / Service owner Componentes obsoletos ou em fim de vida Componentes retirados, custos reduzidos, CMDB actualizada
8 Revisão e melhoria Infrastructure manager Métricas de operação, incidentes por plataforma Processo e estratégia de infraestrutura actualizados

Descrição detalhada das actividades

O infrastructure manager define a estratégia de infraestrutura com base nos objectivos de negócio, no roadmap arquitectural e nas tendências de mercado. A estratégia inclui decisões sobre cloud, on-premises, híbrido, e os princípios de governance que orientam todas as decisões de infraestrutura.

Passos chave

  • Analisar necessidades de negócio e roadmap tecnológico
  • Definir modelo cloud (public, private, hybrid, multi-cloud)
  • Estabelecer políticas de cloud governance e FinOps
  • Aprovar estratégia com o CTO e os service owners
Critério de saída: estratégia de infraestrutura aprovada com modelo cloud, políticas de governance e roadmap de evolução.

A equipa DevOps/Ops analisa a utilização actual e prevista da infraestrutura para garantir que a capacidade está dimensionada correctamente, evitando tanto a sub-provisão (indisponibilidade) como o sobre-provisionamento (desperdício de custos).

Passos chave

  • Analisar tendências de utilização dos últimos 3 a 12 meses
  • Projectar necessidades de crescimento por plataforma
  • Identificar gargalos de performance actuais e potenciais
  • Recomendar acções de expansão, optimização ou redimensionamento
Critério de saída: plano de capacidade aprovado com acções concretas de optimização e cronograma de implementação.

O infrastructure manager assegura que o uso de cloud é feito de forma controlada, segura e eficiente em custos. A governance cloud inclui políticas de aprovisionamento, tagging, gestão de custos (FinOps) e conformidade de segurança.

Passos chave

  • Definir e aplicar políticas de tagging e naming conventions
  • Monitorizar custos por serviço, equipa e ambiente
  • Identificar e eliminar recursos não utilizados ou sub-utilizados
  • Assegurar conformidade com políticas de segurança cloud
  • Reportar custo por serviço aos service owners mensalmente
Critério de saída: relatório mensal de custo cloud por serviço distribuído, políticas aplicadas e desvios documentados.

A infra-as-code (IaC) é a abordagem preferencial para provisionar e gerir infraestrutura de forma repetível, auditável e sujeita a controlo de versão. A equipa DevOps/Ops mantém os repositórios IaC, assegurando que o ambiente real corresponde sempre ao código declarado.

Passos chave

  • Manter repositório IaC com código revisto e aprovado
  • Provisionar novas infraestruturas exclusivamente via IaC
  • Realizar drift detection para identificar desvios manuais
  • Aumentar progressivamente a cobertura IaC para componentes legados
Critério de saída: cobertura IaC aumentada, drift detection sem desvios críticos e repositório actualizado.

A equipa DevOps/Ops opera continuamente a infraestrutura, respondendo a alertas, ajustando recursos e garantindo que as plataformas funcionam dentro dos parâmetros definidos. A monitorização é proactiva: os problemas devem ser identificados antes de afectarem os serviços.

Passos chave

  • Manter dashboards de saúde de todas as plataformas críticas
  • Responder a alertas dentro dos SLAs definidos
  • Ajustar recursos de forma dinâmica (auto-scaling, optimização)
  • Documentar eventos relevantes e escalação quando necessário
Critério de saída: dashboards actualizados, alertas tratados dentro de SLA e relatório de uptime por plataforma produzido.

A gestão de patches é uma actividade crítica de segurança e estabilidade. A equipa DevOps/Ops aplica patches de forma planeada, minimizando o impacto nos serviços e respeitando as janelas de manutenção acordadas com os service owners.

Passos chave

  • Monitorizar boletins de segurança e patches disponíveis
  • Avaliar criticidade e urgência de cada patch
  • Planear e comunicar janelas de manutenção
  • Aplicar patches em ambiente de teste antes de produção
  • Documentar patches aplicados e actualizar conformidade
Critério de saída: patches críticos aplicados dentro do prazo definido e relatório de conformidade actualizado.

O decommissioning planeado de componentes de infraestrutura obsoletos ou substituídos reduz a superfície de ataque, os custos e a complexidade operacional. O infrastructure manager coordena o processo com os service owners para garantir que não há dependências activas no momento da retirada.

Passos chave

  • Identificar componentes em fim de vida ou substituídos
  • Verificar ausência de dependências activas com os service owners
  • Planear e executar o decommissioning com janela de manutenção
  • Actualizar a CMDB e documentar a retirada
  • Garantir a eliminação segura de dados
Critério de saída: componente retirado, CMDB actualizada, custos reduzidos e dados eliminados de forma segura.

O infrastructure manager revê periodicamente o processo e as métricas de infraestrutura, identificando oportunidades de optimização técnica, redução de custos e melhoria da resiliência. As melhorias são incorporadas na estratégia e no roadmap.

Passos chave

  • Rever métricas de uptime, custos, incidentes por plataforma e conformidade
  • Identificar padrões de incidentes recorrentes relacionados com infraestrutura
  • Avaliar novas tecnologias e padrões de infraestrutura relevantes
  • Actualizar estratégia e roadmap de infraestrutura
Critério de saída: processo e estratégia de infraestrutura actualizados, com melhorias documentadas e aprovadas.

Modelo RACI

Actividade Infra manager
(IM)
DevOps/Ops
(DO)
Segurança
(SEC)
Capacity manager
(CM)
Service owner
(SO)
Estratégia de infraestrutura A R C C I
Planeamento de capacidade A R - R C
Governance cloud A R C - I
Gestão de IaC A R C - -
Monitorização e operações A R C I I
Gestão de patches A R R - I
Decommissioning R R C - A
Revisão e melhoria A R C C I
R Responsible - executa a actividade A Accountable - responde pelo resultado C Consulted - é consultado I Informed - é informado

Métricas e KPIs

Métrica Descrição Target sugerido
Uptime Disponibilidade média das plataformas críticas, calculada mensalmente por plataforma > 99,9%
Conformidade de patches Percentagem de sistemas com todos os patches críticos aplicados dentro do prazo definido > 95%
Custo cloud por serviço Custo médio mensal de cloud alocado a cada serviço activo, com tendência mensal Tendência decrescente
Cobertura IaC Percentagem de componentes de infraestrutura provisionados e geridos exclusivamente via IaC > 80%
Incidentes por plataforma Número de incidentes de serviço com causa raiz em infraestrutura, por plataforma e mês Tendência decrescente

Interfaces com outros processos

Entrada

Gestão de arquitectura

O roadmap arquitectural e os standards tecnológicos definem as evoluções de infraestrutura necessárias e as tecnologias aprovadas para uso.

Saida

Monitorização e eventos

A infraestrutura operacional gera os alertas e eventos que alimentam o processo de monitorização e, quando necessário, criam incidentes automaticamente.

Saida

Change enablement

As alterações à infraestrutura (patches, actualizações, novos componentes) passam pelo processo de change enablement para controlo e aprovação.

Saida

Gestão de configuração (CMDB)

Todos os componentes de infraestrutura são registados na CMDB, com relações e dependências actualizadas após cada mudança ou decommissioning.

Saida / Entrada

Gestão de desenvolvimento de software

Os pipelines CI/CD e os requisitos de infraestrutura das aplicações são coordenados entre as equipas de desenvolvimento e de infraestrutura.

Entrada

Gestão de fornecedores

Os contratos com fornecedores de cloud, hardware e software de infraestrutura são geridos pela gestão de fornecedores e influenciam as opções disponíveis.

Descarregar o pack completo

Inclui o processo documentado, template de plano de capacidade, relatório de compliance de patches, modelo RACI em Excel e guia de cloud governance.