São Paulo e Rio de Janeiro
Comercial 21 99828-2435
comercial@masterremote.com.br

Monitorando a Saúde do Armazenamento

Monitoramento do armazenamento de dados

A confiabilidade é uma pedra angular nos sistemas de armazenamento digital. Uma única falha em um disco rígido pode resultar em perda irreparável de dados e descontinuidade nas operações críticas, seja em um servidor ou em uma estação estratégica. Para enfrentar esse desafio, os fabricantes de hardware desenvolveram o S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology, ou Tecnologia de Autovigilância, Análise e Relatórios), uma inovação que oferece informações cruciais sobre a saúde e o desempenho de discos rígidos. Essa tecnologia é integrada ao Master Control, proporcionando uma camada adicional de segurança e prevenção de falhas, que em sua versão 5.20.25.283 tornou o Smart nativo, extraído de sua posição original no monitoramento de hardware.

O que é o S.M.A.R.T.?

O S.M.A.R.T. é um conjunto de atributos e algoritmos incorporados em discos rígidos que permitem a monitoração contínua de vários aspectos do seu funcionamento. Esses atributos incluem a contagem de setores reatribuídos, o tempo de resposta do disco, a temperatura de operação, entre outros. Cada atributo possui um valor que indica o seu estado atual, permitindo a detecção precoce de problemas potenciais.

Teste de 7 Dias

Baixe gratuitamente, teste por 7 dias e tire todas as suas dúvidas, com nosso suporte.
.

Vantagens do Monitoramento S.M.A.R.T.

Detecção Antecipada de Falhas: O monitoramento contínuo dos atributos S.M.A.R.T. possibilita a detecção antecipada de falhas iminentes. Por exemplo, um aumento na contagem de setores reatribuídos pode indicar uma degradação física do disco, permitindo a substituição preventiva antes que ocorra uma falha catastrófica.

Planejamento de Manutenção: Com acesso às informações do S.M.A.R.T., os administradores de sistemas podem planejar a manutenção de forma proativa. Ao identificar discos rígidos que se aproximam do fim de sua vida útil esperada, é possível substituí-los durante períodos de baixa atividade, minimizando o impacto nas operações.

Otimização do Desempenho: Além de prevenir falhas, o S.M.A.R.T. também pode ajudar a otimizar o desempenho do sistema. Por exemplo, identificar discos com altos tempos de resposta pode indicar a necessidade de desfragmentação ou substituição por unidades mais rápidas.

Redução de Custos: Ao evitar falhas não planejadas e maximizar a vida útil dos discos rígidos, o monitoramento S.M.A.R.T. pode reduzir os custos associados à substituição de hardware e à recuperação de dados perdidos.

Alertas de Extrapolação de Limites S.M.A.R.T.

Além de simplesmente monitorar os atributos S.M.A.R.T., é essencial possuir alertas para índices que extrapolam os limites estabelecidos. E no caso do Master Control, esses alertas notificam aos operadores quando um atributo atinge um valor crítico, indicando a necessidade de intervenção imediata.

O Master Control possui dois alertas. O amarelo para casos onde seja necessária a atenção e planejamento para substituição do armazenamento e vermelho, onde se indica a substituição imediata.

Em resumo, o S.M.A.R.T. é uma ferramenta poderosa para monitorar a saúde e o desempenho dos discos rígidos. Ao aproveitar os dados fornecidos por essa tecnologia o Master Control consegue utilizar alertas adequados, os administradores de sistemas podem minimizar o risco de falhas, otimizar o desempenho e garantir a integridade dos dados armazenados.

Estes são os 5 índices de erros considerados críticos e analisados para emitir alertas no Master Control.

SEEK ERROR RATE – Este é um dos índices que costuma gerar a chamada “lentidão fantasma”, que é quando o computador fica lento e não se consegue identificar qual elemento está provocando a lentidão, apenas utilizando o gerenciador de tarefas.  Representa a quantidade de erros nos eventos de busca de dados gravados. Cada vez que é ordenado ao disco buscar um dado e ocorre uma falha no posicionamento da cabeça para leitura, o valor para Seek Error Rate aumenta, indicando problemas no sistema mecânico. 

SPIN RETRY COUNT – Representa quantas vezes o motor do disco rígido já falhou ao tentar sair de 0 rpm até sua velocidade operacional, indicando problemas no motor ou no sistema mecânico.

REALLOCATED SECTORS COUNT – Representa a quantidade de setores de reserva (spare sectors) já utilizados para substituir setores defeituosos. Quanto maior o valor, pior pode ser considerado o estado da superfície do disco.

REPORTED UNCORRECTABLE ERRORS – Contagem de erros de setores que não puderam ser recuperados usando o ECC de hardware, arquivos foram corrompidos devido ao estado da superfície do disco.

UNCORRECTABLE SECTOR COUNT – Contagem de erros incorrigíveis ao ler / gravar um setor. Há defeitos na superfície do disco e / ou problemas no subsistema mecânico.

Baixe Gratuitamente

Baixe gratuitamente, teste por 7 dias e tire todas as suas dúvidas, com nosso suporte.
.

Quando o Master Remote identificar a extrapolação de qualquer desses índices, será apresentado no seu Master Control um alerta na área específica de alertas representada na figura ao lado.

Caso tenha dúvidas sobre que ícone representa que alerta, é possível a qualquer momento consultar a legenda de ícones no símbolo de interrogação.

 

Ao todo, são 21 alarmes, em 6 grupos, para lhe manter atualizado sobre a saúde do seu parque instalado. Todos os alarmes possuem detalhes, sejam gráficos ou em texto, além do ícone que surge na área de alarmes.

Para analisar melhor.

Todos os alarmes possuem detalhes, sejam gráficos ou em texto, além do ícone que surge na área de alarmes. Dê dois cliques no alerta e o Master Control o levará ao cadastro do cliente que está apresentando o erro.

Especificamente no caso de alertas de S.M.A.R.T., na área de informações do cliente, irá lhe informar se a unidade esta saudável ou em alerta.  As informações S.M.A.R.T. de um cliente, também podem ser verificadas a qualquer momento no item S.M.A.R.T. do menu de informações na área central.

Caso deseje se aprofundar na análise do problema, acesse os detalhes da análise do armazenamento no ícone ferramentas, localizado na parte superior direita da tela do acesso remoto (Remote)opção: visualizador do S.M.A.R.T. 

 

Você pode ainda, alternar para o a área de monitoramento e verificar a utilização e temperatura do disco, juntamente com outras métricas deste computador para realizar uma análise abrangente. Se desejar se aprofundar no assunto, consulte aqui a Wikipedia para obter a lista completa de códigos S.M.A.R.T. 

Teste de 7 Dias

Baixe gratuitamente, teste por 7 dias e tire todas as suas dúvidas, com nosso suporte.
.

Se não desejar receber mais o alerta.

Se você não deseja mais receber o alerta, ou se já informou ao responsável sobre a situação, a sua responsabilidade é encerrada. No quadro de informações do S.M.A.R.T., na seção de informações do cliente, você pode desmarcar o alerta específico para esse cliente, deixando de recebê-los.

Gostou do artigo? Compartilhe com seus amigos, visite nosso SITE e siga a Master Remote no Linkedin, Instagram e no Facebook, ou ainda pesquise ai ao lado outros artigos, e fique assim a par das novidades sobre tecnologia para negócios e dicas de ampliação das vendas.

Está precisando impulsionar sua empresa? Sugerimos o livro Vendendo Tecnologia na Amazon, que aborda as nuances da venda consultiva, direcionada às negociações técnicas.

Até a próxima e sucesso.

 

Um comentário

  1. […] AQUI, mais informações sobre monitoramento de […]

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *