Tribunal de Justiça do Distrito Federal e dos Territórios

GERINC - Políticas do Processo

Políticas do Processo

última modificação: 02/10/2024 21h27

Nesta página são divulgadas as diretivas a serem observadas no processo de gerenciamento de incidentes.

Políticas são intenções e/ou expectativas gerenciais documentadas formalmente. São utilizadas para direcionar decisões e para garantir o desenvolvimento e a implantação consistente de processos, papéis e atividades, refutando a execução de atividades não planejadas.

A seguir são documentadas as políticas que orientam a execução do processo de Gerenciamento de Incidentes no âmbito do TJDFT:

Política 01: Identificação de Incidentes

Descrição

A identificação de um incidente é caracterizada pela interrupção não planejada de um serviço de TI ou uma redução na qualidade desse serviço.

A identificação de incidentes tem natureza reativa e deve fazer parte do cotidiano de toda a operação de serviços.

Os incidentes podem ser identificados pelos seguintes meios listados:

  1. Ferramentas de monitoração Zabbix;
  2. Checklist da Ronda no Datacenter;
  3. Grupo de Incidentes no Teams;
  4. Grupo de Incidentes no WhatsApp;
  5. Central de Serviços.

 Razão

  1. Quanto mais rápido for identificado um incidente, menor será o tempo de agressão ao serviço e consequentemente, menor o impacto negocial.
  2. Objetiva evitar perda de incidentes não identificados e consequentemente não registrados.

Benefícios

  • Aumento da disponibilidade dos serviços e IC’s do órgão;
  • Aumento na eficiência na resolução dos incidentes, com a correta categorização e escalonamento a equipe correta;
  • Diminuição do Tempo Médio de Resolução de incidentes;
  • Evolução da gestão do conhecimento.

Política 02: Categorização dos Incidentes

Descrição

Os incidentes deverão ser categorizados conforme impacto e urgências definidos pela alta gestão do TJDFT, buscando tratar os mesmos conforme a avaliação do negócio de forma clara e objetiva visando utilizar os recursos de forma efetiva e conforme riscos e impactos dos mesmos.

Os incidentes são categorizados em 04 (quatro) Severidades no Zabbix:

  1. Incidentes Severidade Desastre;
  2. Incidentes Severidade Alta;
  3. Incidentes Severidade Média;
  4. Incidentes Severidade Atenção;
  5. Informação;
  6. Não Classificado.

 Razão

  1. O tratamento de incidentes conforme avaliação do impacto e urgência auxilia o Tribunal a focar os recursos de forma otimizada evitando dispêndio de mão de obra e recursos em incidentes que podem ser tratados com menos criticidade.
  2. Melhorar a inclusão de novas triggers, fazendo a diferenciação conforme impacto melhorando a ferramenta de monitoramento e os alertas.
  3. O objetivo é medir a forma de atuação dos envolvidos no processo de acordo com a criticidade do incidente.

Benefícios

•    Melhor utilização dos recursos humanos;
•    Melhora no tratamento dos incidentes;
•    Diminuição do tempo de resolução de incidentes.

Política 03: Priorização de incidentes

Descrição

A priorização dos incidentes pode ocorrer por três diferentes meios:

  1. Acordo de Nível de Serviço, de acordo com o Portfólio de Serviços;
  2. Intervenção do Gerente do Processo;
  3. Matriz entre impacto e urgência.
     

É importante frisar que incidentes graves demandam a alocação de recursos e procedimentos excepcionais, portanto, a declaração de gravidade de um incidente não deve ser automática, exceto nos casos de monitoramento de serviços classificados como críticos no Portfólio de Serviços.
 

Na ferramenta de monitoramento a classificação é dividida em: Desastre, Alta, Média, Atenção, Informação e Não Classificado

 Razão

Padronizar a utilização das categorias empregadas no Gerenciamento de Incidentes.

Benefícios

  • Dar o atendimento prioritário adequado aos incidentes;
  • Verificar se os critérios de qualidade foram atendidos de acordo com os requisitos do serviço.

Política 04: Implementação de Novos Monitoramentos

Descrição

A ferramenta de monitoramento em uso no TJDFT é o Zabbix, customizado com todos os alertas, triggers, templates, hosts e mapeamentos pela própria equipe da unidade responsável pelo cadastramento.

Atualmente o processo de implementação de novos hosts e serviços na ferramenta dar-se através do seguinte processo:

  1. Solicitante acessa oferta por meio do Portal de Serviços, de acordo com a sua necessidade, ele escolhe a mais adequada, preenchendo com as informações requisitadas para cada situação em específico;
  2. A oferta é analisada e se aceita é confirmada como uma Solicitação pela Central de Serviços e repassada a unidade responsável pela execução;
  3. Avaliação pela unidade responsável, e execução se cabível.;
  4. Implementação na Ferramenta;
  5. Comunicação ao time de Monitoramento (NOC);
  6. Retorno ao solicitante com as informações necessárias por meio do encerramento da solicitação.

 Razão

  1. Padronização do processo de inclusão de novos alertas e hosts na ferramenta;
  2. Criar a regra para facilitar novas inclusões.

Benefícios

  • Melhorar a qualidade dos novos alarmes e alertas;
  • Melhorar o processo de inclusão;
  • Auxiliar no desenvolvimento e no tempo de para novas inclusões.

Política 05: Registro de incidentes

Descrição

Todos incidentes devem ser registrados na ferramenta de ITSM SMAX. Esses registros devem conter informações precisas e detalhadas em relação ao incidente ocorrido. As informações presentes no registro do incidente estão listadas no documento. 
Nos incidentes, é obrigatório o registro das informações relevantes que auxiliarão durante as atividades de resolução dos incidentes. 
Eventos de alerta e informações serão tratados como solicitação de serviço (técnico).

 Razão

Possuir um registro formal dos incidentes, visando o controle durante o seu ciclo de vida. Assim, o processo pode ser auditado, medido e melhorado sempre que necessário.

Benefícios

  • Acompanhamento da solução dos incidentes;
  • Análise das medidas tomadas na solução;
  • A classificação e priorização são critérios para ordem de atendimento e escalonamento;
  • Permite uma previsão de solução visando não agredir o Acordo de Nível de Serviço do Serviço afetado.

Política 06: Medição do tempo de atendimento

Descrição

Deve ser criado um incidente para cada serviço de TIC impactado ou degradado, de acordo com o Catálogo de Serviços, considerando os serviços negociais e técnicos (e seus relacionamentos). Isso permitirá a medição eficiente do tempo de atendimento de cada incidente independentemente da quantidade de empresas envolvidas no atendimento da demanda inicial do solicitante.

Portanto, dentro do escopo deste processo, os níveis de serviço contratados ou acordados entre equipes do TJDFT serão considerados como Acordos de Nível Operacionais, ainda que contratualmente sejam definidos ou descritos como Acordo de Nível de Serviço.

O tempo de atendimento não será interrompido em momento algum do ciclo de vida do incidente. Todos os incidentes que agredirem o respectivo acordo deverão ser justificados.

 Razão

Permitir uma visão global dos contratos e Acordos de Nível de Serviço envolvidos no tratamento de incidentes, sendo possível monitorar e avaliar a qualidade dos serviços prestados pelas diversas equipes técnicas da casa ou contratadas. A não interrupção do tempo de atendimento auxiliará a identificar acordos de níveis operacionais e contratos de apoio que não correspondem à necessidade de negócio.

Benefícios

  • Garantir a correta medição do tempo decorrido no atendimento do incidente; 
  • Evidenciar em qual ponto do atendimento houve atrasos e as razões para o ocorrido;
  • Realizar o monitoramento correto do TMR dos Incidentes desde o seu registro;
  • Subsidiar os gestores com dados e informações para a tomada correta de decisões que estão causando impacto no ambiente, gerando descontinuidade nos serviços prestados aos usuários do TJDFT.

Política 07: Diagnóstico Inicial

Descrição

Avaliação por parte da equipe de monitoramento de Nível 1, dos alertas exibidos na ferramenta de monitoramento do ambiente com diagnóstico rápido dos serviços ou IC’s afetados e/ou ambientes impactados.

 Razão

Verificar os alertas no Zabbix, fazendo a confirmação positiva do impacto do incidente e quais serviços de TIC foram afetados.

Benefícios

Resolver os incidentes o mais rápido possível, restaurando a operação normal do serviço e minimizando os impactos adversos nos processos de negócio.

Política 08: Uso da base de dados de erros conhecidos (BDEC)

Descrição

A BDEC é fundamental e nasce com o processo de Gerenciamento de Problemas. Ela é obrigatória para execução de procedimentos de solução de incidentes.

Ela deve ser usada como referência de conhecimento na busca de soluções de contorno ou definitivas nos primeiros níveis de atendimento, garantindo os Acordos de Nível de Serviço dos serviços de TI afetados.

 Razão

Vários serviços de TI podem ser restabelecidos com a execução dos procedimentos registrados nessa base de conhecimento do processo de Gerenciamento de Problemas.

Benefícios

  • Promove atuações rápidas do primeiro nível de atendimento no qual há profissionais de custo operacional inferior; 
  • Permite o restabelecimento de um serviço de forma rápida e baixo risco e impacto de insucesso na execução do procedimento de solução.

Política 09: Procedimentos gerais de escalação e alerta

Descrição

De maneira a garantir que os prazos acordados sejam respeitados, é necessário acompanhar ativamente o tratamento dos incidentes. A escalação assegura que o atendimento seja eficiente. Estes procedimentos só podem ser interrompidos com autorização do Gerente de Incidentes. 
Os cenários de escalação e alerta poderão ser configurados de acordo com a necessidade dos gestores de cada nível de atendimento. 
A escalação para níveis superiores deve ser seguida de monitoramento por parte da equipe de setor responsável, com diligencias específicas para cada tipo de incidente, onde em geral o escalonamento se dá por meio da abertura do incidente na ferramenta ITSM e, como complemento o repasse também é feito por meio do MS Teams e telefone, bem como, todo incidente aberto que é classificado como alto ou desastre é informado à supervisão e gerência de incidentes, no grupo no MS Teams (Incidentes) visando não deixar incidentes sem tratamento ou que sejam escalonados para grupos especializados incorretos.

 Razão

Devido às diferentes prioridades e diversos incidentes em tratamento ao mesmo tempo, é preciso estar atento para evitar que o prazo de atendimento acordado seja ameaçado por um esquecimento ou falha de comunicação.

Benefícios

  • Reduz o risco de violação dos prazos acordados; 
  • Intervém ativamente no atendimento dos incidentes para garantir a sua celeridade.

Política 10: Resolução de incidentes

Descrição

A solução dos incidentes pode ser promovida em duas situações: 
1. Desistência ou confirmação de solução do incidente com a confirmação do reestabelecimento dos serviços de TIC; 
2. O Gerente de Incidentes pode considerar o incidente improcedente encerrando o mesmo com o devido parecer.

 Razão

Os incidentes devem ser acompanhados até a sua resolução, que pode ser uma solução definitiva ou uma solução de contorno, sendo necessário abrir um chamado para a gestão de “Problemas” buscando uma solução definitiva para o incidente apresentado.

Benefícios

Garante o encerramento do ciclo de vida do incidente evitando novos incidentes e gerando documentação para a BDEC.

Política 11: Reabertura de incidentes

Descrição

Incidentes podem ser reabertos sempre que o usuário ou gestor apontar falhas no serviço.

Como prerrogativa, o incidente só pode ser reaberto pelo mesmo usuário solicitante ou afetado que apontou a falha inicialmente, ou pelos gestores.

 Razão

Incidentes fechados indevidamente devem ser auditados e tratados com celeridade no seu atendimento.

Benefícios

  • Garante a solução mais rápida possível para incidentes recorrentes; 
  • Evita o desgaste da imagem do fornecedor de serviços; 
  • Audita os procedimentos utilizados para identificação da solução que não causou o efeito desejado.

Política 12: Política de Comunicação de Incidentes

Descrição

Os incidentes abertos devem ter em seu ciclo de vida diversas tratativas visando a solução de contorno ou definitiva de forma rápida e eficaz, mas em alguns casos esse processo pode demorar mais do que o esperado.
Uma comunicação efetiva pode auxiliar na diminuição do impacto ou na maior satisfação dos usuários de TIC do Tribunal, por esse motivo, é importante que sejam definidos marcos temporais e/ou criticidade para o escalonamento hierárquico dos incidentes, deixando as autoridades a par da abertura, andamento e encerramento dos incidentes.

 Razão

Os incidentes causam um impacto que pode ser crítico para o órgão, com um plano de comunicação é possível mitigar as insatisfações e auxiliar na expectativa e na retirada de empecilhos na resolução dos incidentes.

Benefícios

  • Mitigar insatisfações; 
  • Sinalizar aos usuários de TIC as interrupções nos serviços; 
  • Evitar o desgaste da TI do órgão, com o acompanhamento pelos envolvidos de forma clara e concisa.

Unidade responsável: Núcleo de Gestão de Serviços de Tecnologia da Informação - NUSETI
Contato: (61) 3103 - 7000; nuseti@tjdft.jus.br
Fonte da informação: Sistema de gerenciamento de serviços de TIC (ITSM) - SMAX

A sua opinião é muito importante para nós!
O que você achou do conteúdo disponibilizado nessa página?  Registre a sua avaliação.
Caso queira apresentar reclamações, dúvidas ou sugestões sobre os serviços prestados pelo Tribunal, por gentileza, entre em contato com a Ouvidoria.