Introducción

Genera una alerta cuando las operaciones de entrada/salida por segundo de una unidad superan un umbral y se mantienen en ese nivel. El monitor de IOPS de disco detecta el thrashing sostenido del disco, el tipo que hace que una máquina se sienta lenta incluso cuando la CPU y la memoria parecen estar bien.

Es uno de los cinco monitores de IO de disco, junto con el rendimiento, la latencia, el tiempo activo y la longitud de la cola. Cada uno mide una dimensión diferente de la actividad del disco. El IOPS cuenta cuántas operaciones de lectura y escritura gestiona la unidad por segundo, independientemente del tamaño de cada operación.

Cómo funciona el monitor de IOPS de disco

Level mide el total de operaciones de lectura y escritura por segundo en las unidades seleccionadas. Cuando el IOPS supera el umbral establecido y se mantiene durante toda la duración de la infracción, Level crea una alerta.

La duración de la infracción filtra los picos normales. Una unidad que tiene un pico durante una copia de archivo o una actualización no es un problema. Una unidad fijada en IOPS alto durante 10 minutos normalmente significa que algo está sobrecargando el disco: un trabajo de copia de seguridad, un análisis antivirus, una consulta de base de datos desbocada o un proceso con mal comportamiento.

ℹ️ NOTA: El monitor se evalúa en el propio dispositivo, no en el backend de Level. El dispositivo debe estar en línea para que se active la alerta. Los monitores nuevos o editados llegan a los dispositivos en línea casi de inmediato; los dispositivos sin conexión recogen el cambio cuando se vuelven a conectar.

Configuración del monitor de IOPS de disco

Abra la política de monitor de destino y haga clic en Agregar monitor. El Agregar nuevo monitor se abre el cuadro de diálogo.

Nombre y tipo

Introduzca un nombre en el Nombre campo. «Servidores - Thrashing de disco» o «Hosts SQL - IOPS alto» se lee mejor en una lista de alertas que «IOPS de disco».
Establezca Tipo a IOPS de disco. El cuadro de diálogo muestra la descripción del monitor: genera alertas cuando el total de operaciones de entrada/salida por segundo en las unidades seleccionadas supera el umbral durante la duración configurada.

Gravedad

Establezca Gravedad para indicar la urgencia de un IOPS alto sostenido en este contexto:

Información
Advertencia
Crítico
Emergencia

💡 CONSEJO: Advertencia es un valor predeterminado razonable. Un IOPS alto suele ser un síntoma que vale la pena investigar en lugar de una interrupción. Reserve Crítico para los hosts donde la contención de disco degrada directamente un servicio en producción, como servidores de bases de datos o de archivos.

Unidades

Unidades controla qué unidades evalúa el monitor:

Cualquier unidad: supervisar cada unidad del dispositivo
Disco del sistema: supervisar solo la unidad del sistema principal del dispositivo

💡 CONSEJO: Disco del sistema es útil cuando se espera que las unidades secundarias funcionen a alta intensidad, como destinos de copia de seguridad o volúmenes de trabajo temporal. Solo recibirá alertas cuando la propia unidad del sistema operativo esté saturada.

Umbral

Umbral establece el valor de operaciones por segundo que debe superarse para activar el monitor. Ajuste con las flechas arriba/abajo o escriba un valor directamente. La unidad es ops/seg. Introduzca un valor adecuado para el hardware que está supervisando.

💡 CONSEJO: Puntos de partida que funcionan en la práctica: 150 ops/seg para dispositivos con discos duros giratorios (HDD) (los HDD alcanzan físicamente un máximo de alrededor de 100 a 200 IOPS, por lo que una actividad sostenida a ese nivel significa que la unidad está saturada), 5.000 ops/seg para estaciones de trabajo respaldadas por SSD (un IOPS sostenido tan alto en una estación de trabajo normalmente indica un proceso desbocado, un análisis antivirus o un cliente de sincronización con mal comportamiento), y 20.000 ops/seg para servidores SSD o NVMe que ejecuten bases de datos o recursos compartidos de archivos. Luego ajuste: si se activa durante la carga normal, auméntelo; si un evento de thrashing conocido no lo dispara, redúzcalo.

ℹ️ NOTA: Un umbral adecuado para un servidor de archivos con HDD nunca se activará en una estación de trabajo NVMe, y viceversa. Divida el hardware mixto en políticas separadas (o monitores separados con distintas gravedades) en lugar de buscar un único número que cubra ambos.

Duración de la infracción

Duración de la infracción establece cuánto tiempo debe mantenerse el IOPS por encima del umbral antes de que se active una alerta. Ajuste con el control deslizante o las flechas arriba/abajo. El rango es de 1 a 120 minutos.

💡 CONSEJO: De 5 a 10 minutos filtra los picos rutinarios como transferencias de archivos e instalaciones de actualizaciones, al tiempo que detecta la contención sostenida. Las duraciones más cortas tienen sentido en hosts sensibles a la latencia, donde incluso unos pocos minutos de saturación son perjudiciales.

Corrección

Adjunte una automatización para que se ejecute cuando se active esta alerta: reiniciar un servicio, capturar diagnósticos o notificar a su equipo.

Haga clic en el Corrección y seleccione una automatización. Esto es opcional.
Use el icono de enlace para abrir la automatización seleccionada, el icono de ojo para previsualizarla y el × para eliminarlo.

Una vez adjunta, abra la automatización para asignar la carga útil del monitor a una variable de automatización si desea pasar el contexto de la alerta a la lógica de la automatización.

Notificar destinatarios

Notificar destinatarios envía correos electrónicos a los destinatarios de la política cuando ocurren los eventos seleccionados:

Al crear la alerta
Al resolver la alerta

Resolución automática

Resolver automáticamente la alerta cuando las condiciones se normalizan cierra la alerta automáticamente una vez que el IOPS vuelve a bajar por debajo del umbral. Desactívelo si desea que las alertas persistan para una revisión manual.

ℹ️ NOTA: Resolver manualmente una alerta mientras el dispositivo todavía supera el umbral no la recreará. La alerta solo se vuelve a activar cuando el IOPS cae por debajo del umbral y luego lo vuelve a superar.

Preguntas frecuentes

¿Cuál es un umbral de IOPS razonable para empezar? Depende de la unidad. Comience con 150 ops/seg para HDD, 5.000 para estaciones de trabajo SSD y 20.000 para servidores SSD/NVMe, y luego ajuste desde ahí. Si no está seguro de lo que es normal para un dispositivo, observe primero su IOPS base durante las horas típicas y establezca el umbral cómodamente por encima de ese valor.
¿Cuál es la diferencia entre IOPS y rendimiento? El IOPS cuenta operaciones por segundo independientemente del tamaño. El rendimiento mide el volumen de datos transferidos. Una unidad que realiza miles de lecturas aleatorias pequeñas puede tener un IOPS alto con un rendimiento bajo, y una sola copia de archivo grande puede ocurrir lo contrario. Supervise el que corresponda al modo de fallo que le interesa, o utilice ambos.
Mi alerta de IOPS se activa todas las noches a la misma hora. ¿Qué está pasando? Casi con toda seguridad se trata de un trabajo programado: copias de seguridad, análisis antivirus o indexación. Puede aumentar el umbral, extender la duración de la infracción más allá del tiempo de ejecución del trabajo, o aceptar la alerta como confirmación de que el trabajo se ejecutó. Si el dispositivo está en modo de mantenimiento durante esa ventana, las alertas del monitor se suprimen por completo.
Con la opción Cualquier unidad seleccionada, ¿el umbral se aplica por unidad o al total de todas las unidades combinadas? Por unidad. Cada unidad se evalúa frente al umbral de forma independiente, y cualquiera de ellas que supere el umbral durante la duración completa genera la alerta.
¿Puedo establecer umbrales diferentes para mis servidores de bases de datos y mis estaciones de trabajo? Sí. Cree políticas de monitor separadas dirigidas a diferentes etiquetas y configure los umbrales de forma independiente. También puede agregar múltiples monitores de IOPS de disco a una política con diferentes umbrales y gravedades.
¿Qué ocurre con las alertas abiertas si elimino el monitor? Las alertas existentes permanecen. Eliminar un monitor no cierra las alertas que ya creó. Resuélvalas manualmente.

Monitor de IOPS de disco