Ir al contenido principal

Monitor de Latencia de Disco

Alert when read and write latency on a device's drives climbs above a threshold and stays there. Covers drive targeting, thresholds, breach duration, remediation, and notifications.

Introducción

Alerta cuando una unidad comienza a responder lentamente. El monitor de latencia de disco rastrea la latencia total de lectura y escritura en las unidades de un dispositivo y crea una alerta cuando la latencia supera el umbral definido durante un período sostenido.

Los discos lentos son una de las causas más comunes de tickets de «mi computadora es lenta», y son fáciles de pasar por alto porque la unidad sigue funcionando. Este monitor detecta la degradación antes de que se convierta en un fallo o una avalancha de quejas.


Cómo funciona el Monitor de Latencia de Disco

El agente de Level muestrea los contadores de actividad de disco del dispositivo y calcula la latencia total de lectura y escritura para cada unidad supervisada. Cuando la latencia supera el umbral definido y se mantiene así durante toda la duración de la infracción, Level crea una alerta.

El requisito de duración de infracción filtra las ralentizaciones momentáneas. Una unidad que se detiene brevemente durante una ráfaga de escrituras no activará ninguna alerta. Una unidad que mantiene una latencia alta durante varios minutos está señalando un problema real: un disco defectuoso, un controlador de almacenamiento saturado o una carga de trabajo que el hardware no puede gestionar.

ℹ️ NOTA: El monitor lee los propios contadores de disco del sistema operativo. Es pasivo y no genera tráfico de disco por sí mismo, por lo que no contribuirá a la carga que está midiendo.

🖥️ NOTA DE PLATAFORMA:

  • Windows: La latencia se lee desde contadores de rendimiento nativos.

  • macOS: La latencia se lee a través de las estadísticas de disco de IOKit.

  • Linux: La latencia se lee desde las estadísticas del dispositivo de bloque del kernel.


Configuración del Monitor de Latencia de Disco

Abra la política de monitor de destino y luego haga clic en + Agregar nuevo monitor (o haga clic en un monitor de latencia de disco existente para editarlo). Se abre el panel de configuración del monitor.

Disk Latency Monitor

Nombre y Tipo

  1. Introduzca un nombre en el campo Nombre campo. «Servidores - Latencia de Disco» o «Estaciones de Trabajo - Disco Lento» se lee mejor en una lista de alertas que «Latencia de Disco».

  2. Configure Tipo a Latencia de disco.

Gravedad

Configure Gravedad para indicar la urgencia del almacenamiento lento en este contexto:

  • Información

  • Advertencia

  • Crítico

  • Emergencia

💡 CONSEJO: Advertencia es un valor predeterminado razonable para estaciones de trabajo. Para servidores que alojan bases de datos o recursos compartidos de archivos, donde la latencia de almacenamiento degrada directamente cada servicio dependiente, considere usar Crítico.

Unidades

Unidades controla qué unidades evalúa el monitor:

  • Cualquier unidad: Supervisar todas las unidades del dispositivo.

  • Disco del sistema: Supervisar solo la unidad del sistema principal del dispositivo.

💡 CONSEJO: Disco del sistema es útil cuando las unidades secundarias tienen una E/S intensa esperada, como destinos de copia de seguridad o volúmenes temporales, y solo le importa la unidad donde reside el sistema operativo.

Umbral

Umbral establece el valor de latencia, en milisegundos, por encima del cual el monitor comienza a contar una infracción. Ajuste usando el campo o las flechas arriba/abajo.

Para entornos mixtos, 50 ms es un punto de partida razonable, combinado con una duración de infracción de 5 minutos. Ajuste desde ahí según lo que realmente se dispare.

💡 CONSEJO: Los SSD saludables suelen estar en milisegundos de un solo dígito. Los discos giratorios funcionan más alto, a menudo entre 10 y 20 ms bajo carga. Un umbral de alrededor de 50 ms detecta almacenamiento genuinamente degradado en la mayoría del hardware sin alertar sobre el comportamiento normal de los HDD. Ajuste por clase de dispositivo: lo que es alarmante para un servidor NVMe es rutinario para el disco duro de un portátil antiguo.

Duración de la Infracción

Duración de la infracción establece cuánto tiempo debe permanecer la latencia por encima del umbral antes de que se cree una alerta. Ajuste usando el campo o el control deslizante. El rango es de 1 a 120 minutos.

💡 CONSEJO: De 5 a 10 minutos es un punto de partida razonable. Las copias de seguridad, los análisis antivirus y las copias de archivos grandes producen picos de latencia breves que no justifican una alerta. Si recibe ruido durante las ventanas de mantenimiento nocturno, alargue la duración de la infracción antes de aumentar el umbral.

Corrección

Corrección ejecuta automatizaciones cuando se activa esta alerta. Adjunte una automatización que recopile diagnósticos, reinicie un servicio con uso intensivo de E/S o notifique a su equipo.

  1. Haga clic en Seleccionar una automatización y elija una.

  2. Use el ícono de enlace para abrir la automatización seleccionada, o el × para borrarla.

Notificar Destinatarios

Notificar destinatarios envía correos electrónicos a los destinatarios de la política cuando ocurren estos eventos:

  • Al crear la alerta

  • Al resolver la alerta

Los destinatarios se gestionan a nivel de política de monitor, en la sección Destinatarios sección.

Resolución Automática

Resolver alerta automáticamente cuando las condiciones se normalizan cierra la alerta automáticamente una vez que la latencia vuelve a caer por debajo del umbral. Desactívelo si desea que las alertas persistan hasta que un técnico las revise y resuelva manualmente.

⚠️ ADVERTENCIA: Si resuelve manualmente una alerta de latencia mientras la unidad sigue siendo lenta, Level no la recreará de inmediato. Una nueva alerta se activa solo cuando la condición se normaliza y luego vuelve a superar el umbral. Resuelva manualmente solo después de confirmar que el problema subyacente ha sido atendido.


Interpretación de las Alertas de Latencia

Cuando el monitor se activa, la carga útil de la alerta captura las lecturas de latencia que la desencadenaron. La carga útil permanece activa y sincronizada mientras la alerta está abierta, y luego se congela al resolverse para preservar el último estado deficiente.

Para clasificar alertas en todos los dispositivos, use la Alertas vista global. Para un solo dispositivo, abra el dispositivo y revise su Alertas pestaña.

💡 CONSEJO: La latencia sostenida en un dispositivo específico generalmente indica un problema de hardware. Combine este monitor con el monitor de Salud SMART en la misma política: si ambos se activan en el mismo dispositivo, probablemente esté ante un disco que falla, y es momento de planificar un reemplazo en lugar de buscar causas de software.


Preguntas Frecuentes

  • ¿Qué se mide exactamente? La latencia total de lectura y escritura en las unidades seleccionadas, muestreada desde los propios contadores de disco del sistema operativo. Refleja cuánto tiempo están tardando realmente las operaciones de disco, independientemente de qué esté causando la ralentización.

  • ¿En qué se diferencia del monitor de Uso de Disco? El monitor de Uso de Disco supervisa el espacio libre. El monitor de Latencia de Disco supervisa la capacidad de respuesta. Una unidad puede estar casi vacía y aun así ser dolorosamente lenta, y una unidad llena puede responder rápidamente. La mayoría de los entornos quieren ambos monitores en la misma política.

  • Mi alerta se activa todas las noches durante las copias de seguridad. ¿Cómo puedo evitarlo? Alargue la duración de la infracción para que la alerta solo se active cuando la latencia alta supere la ventana de copia de seguridad, o aumente el umbral para ese grupo de dispositivos. Si las copias de seguridad se ejecutan en una unidad secundaria, cambiar el monitor a Disco del sistema también funciona.

  • ¿El monitor ralentiza el disco que está supervisando? No. Lee contadores que el sistema operativo ya mantiene y no genera tráfico de disco por sí mismo.

  • ¿Puedo establecer umbrales diferentes para servidores y estaciones de trabajo? Sí. Cree políticas de monitor separadas por clase de dispositivo y configure cada una con su propio umbral y duración de infracción.

  • ¿Qué sucede con las alertas abiertas si elimino el monitor? Las alertas existentes permanecen en su lugar. Eliminar un monitor no cierra las alertas que ya creó, por lo que deberá resolverlas manualmente.

¿Ha quedado contestada tu pregunta?