Introduction
Déclenchez une alerte lorsque le nombre d'opérations disque en attente dépasse un seuil et y reste. Une file d'attente disque croissante signifie que le périphérique de stockage ne parvient pas à traiter les opérations d'E/S qui lui sont soumises, ce qui se traduit pour les utilisateurs par des chargements d'applications lents, des opérations sur les fichiers laborieuses et une lenteur générale même lorsque le processeur et la mémoire semblent normaux.
Le moniteur de longueur de file d'attente disque se déclenche une fois que la condition a persisté pendant la durée de dépassement que vous avez configurée, de sorte qu'un seul pic d'E/S ne génère pas de bruit.
Fonctionnement du moniteur de longueur de file d'attente disque
Level échantillonne l'activité disque sur les appareils couverts et calcule le nombre moyen de requêtes en attente sur le disque. Lorsque cette valeur dépasse votre seuil pendant toute la durée de dépassement, Level crée une alerte.
ℹ️ REMARQUE : La longueur de la file d'attente est rapportée sous forme d'un total unique pour le disque. Elle n'est pas divisée en valeurs distinctes de lecture et d'écriture.
Chaque relevé est un instantané bref de l'activité disque au moment de l'interrogation, d'environ 100 millisecondes, plutôt qu'une moyenne sur l'ensemble de l'intervalle d'interrogation. Un bref pic d'E/S peut produire un relevé élevé même sur un disque sain. C'est l'exigence de durée de dépassement qui filtre ces cas : une file d'attente qui reste longue sur plusieurs relevés consécutifs est un véritable goulot d'étranglement, pas une anomalie passagère.
🖥️ REMARQUE SUR LA PLATEFORME :
Windows: Lit le Avg. Disk Queue Length Compteur de performances PhysicalDisk, une véritable mesure de file d'attente au niveau du système d'exploitation.
macOS: macOS n'expose pas une profondeur de file d'attente réelle, Level l'estime donc à partir du temps de service d'E/S cumulatif rapporté par IOKit. Les volumes synthétisés APFS virtuels sont ignorés. Les valeurs macOS sont susceptibles de différer de celles de Windows et Linux pour des charges de travail comparables.
Linux: Dérive la profondeur de file d'attente à partir des statistiques d'E/S du noyau dans
/proc/diskstats, également une vraie mesure de file d'attente. Les périphériques loop, les disques RAM, les entrées device-mapper et les partitions individuelles sont exclus lors de la surveillance de tous les lecteurs.
Configuration du moniteur de longueur de file d'attente disque
Ouvrez la politique de moniteur cible et cliquez sur + Ajouter un nouveau moniteur. La boîte de dialogue Ajouter un nouveau moniteur s'ouvre.
Nom et type
Saisissez un nom dans le champ Nom . « Serveurs - File d'attente disque profonde » vous en dit plus dans une liste d'alertes que « Longueur de file d'attente disque ».
Définissez Type à Longueur de file d'attente disque.
Gravité
Définissez Gravité pour correspondre au degré d'urgence d'un disque saturé dans ce contexte :
Information
Avertissement
Critique
Urgence
💡 CONSEIL : Pour les serveurs de bases de données, les serveurs de fichiers et les hôtes hyperviseurs, une profondeur de file d'attente soutenue mérite généralement le niveau Critique. Les charges de travail sur ces machines se dégradent rapidement lorsque le stockage prend du retard.
Lecteurs
Lecteurs contrôle quels disques le moniteur évalue :
N'importe quel lecteur — surveiller chaque lecteur de l'appareil
Disque système — surveiller uniquement le lecteur système principal de l'appareil
💡 CONSEIL : Le disque système est la valeur par défaut la plus sûre pour les postes de travail. Les lecteurs secondaires effectuant des sauvegardes ou des copies de fichiers volumineux mettront légitimement en file d'attente des opérations d'E/S, et cela ne vaut généralement pas une alerte.
Seuil
Seuil définit le nombre d'opérations en attente qui doit être dépassé pour déclencher le moniteur. Ajustez à l'aide des flèches haut/bas ou saisissez une valeur directement.
💡 CONSEIL : Si une politique couvre du matériel hétérogène, divisez-la. Une politique « Serveurs - HDD » à 2 et une politique « Serveurs - NVMe » à 25 seront toutes deux plus silencieuses et plus précises qu'un seuil de compromis unique pour tout. Les étiquettes facilitent cela : étiquetez les appareils par type de stockage et ciblez chaque politique en conséquence.
Choisir un seuil
Le bon seuil dépend presque entièrement du matériel de stockage. Une profondeur de file d'attente signifiant qu'un disque mécanique est débordé est une situation normale pour un lecteur NVMe.
Type de stockage | Seuil de départ | Durée de départ | Pourquoi |
Disque mécanique (HDD) | 2 | 10 min | Une tête, une opération à la fois. Une file d'attente soutenue au-dessus de 2 signifie que les requêtes s'accumulent plus vite que le disque ne peut les traiter. Le faible seuil est franchi lors des sauvegardes et analyses de routine, d'où la durée plus longue pour les filtrer. |
SSD SATA | 10 | 5 min | Le NCQ de SATA est limité à une profondeur de file d'attente de 32. Une profondeur soutenue autour de 10 ou plus signifie que le lecteur travaille intensément ; approcher 32 signifie qu'il est saturé. |
SSD NVMe | 25 | 3–5 min | NVMe gère des profondeurs de file d'attente de plusieurs milliers par conception. Choisissez un nombre anormal pour votre charge de travail plutôt qu'une limite matérielle. Une profondeur soutenue à quelques dizaines sur un serveur typique pointe généralement vers un processus incontrôlé, non vers la capacité du lecteur. Le seuil filtre déjà les pics ordinaires, la durée peut donc être plus courte. |
Baie RAID (mécanique) | 2 × nombre de disques | 10 min | La règle perfmon classique se met à l'échelle par broche. Une baie de 8 disques gère confortablement des profondeurs qu'un seul disque ne peut pas atteindre, donc un seuil autour de 16 est le signal équivalent. |
Disque virtuel / adossé à un SAN | Établir d'abord une référence | 10–15 min | La profondeur de file d'attente reflète ici l'hyperviseur et le backend de stockage, et non un périphérique physique. La contention transitoire d'autres machines virtuelles est normale, utilisez donc la durée la plus longue. Observez les valeurs normales pendant une semaine, puis fixez le seuil au-dessus du pic observé. |
ℹ️ REMARQUE : Ce sont des seuils d'alerte, pas des plafonds de performance. L'objectif est de détecter un comportement anormal soutenu pour cette classe de matériel, pas de mesurer ce que le lecteur peut théoriquement supporter.
Durée de dépassement
Durée de dépassement définit la durée pendant laquelle la file d'attente doit rester au-dessus du seuil avant qu'une alerte se déclenche. Ajustez à l'aide du curseur ou des flèches haut/bas. La plage est de 1 à 120 minutes.
ℹ️ REMARQUE : Étant donné que chaque relevé est un instantané bref plutôt qu'une moyenne sur un intervalle, la durée de dépassement fait ici l'essentiel du travail. Maintenez-la à plusieurs minutes, sauf si vous avez une raison précise d'alerter plus rapidement. Une durée d'1 minute sur un seuil bas détectera les pics d'E/S ordinaires comme les analyses antivirus et les sauvegardes.
Contrairement au seuil, la durée ne varie pas beaucoup selon le matériel. Elle existe pour filtrer le bruit des charges de travail, et les sauvegardes et analyses se ressemblent quel que soit le disque sous-jacent. Le schéma est légèrement inversé : plus votre seuil est bas, plus votre durée doit être longue. Voir les durées de départ dans le tableau sous Choisir un seuil.
Remédiation
Associez une ou plusieurs automatisations à exécuter lorsque cette alerte se déclenche : capturez la liste des processus pour identifier ce qui sollicite intensément le disque, redémarrez un service défaillant ou notifiez votre équipe.
Cliquez sur le champ Sélectionner une automatisation et choisissez une automatisation.
Utilisez l'icône de lien pour ouvrir l'automatisation sélectionnée, l'icône d'œil pour la prévisualiser, ou le × pour la supprimer.
Destinataires des notifications
Envoie des e-mails aux destinataires de la politique lorsque ces événements se produisent :
À la création de l'alerte
À la résolution de l'alerte
Les destinataires sont gérés au niveau de la politique de moniteur, dans la section Destinataires .
Résolution automatique
Le bouton Résoudre automatiquement l'alerte quand les conditions sont rétablies ferme automatiquement l'alerte lorsque la profondeur de file d'attente redescend en dessous du seuil. Activez-le si vous souhaitez des alertes à auto-résolution ; laissez-le désactivé si vous souhaitez que chaque événement de file d'attente persiste pour un examen manuel.
FAQ
Quel est un bon seuil de départ ? Cela dépend du matériel : environ 2 pour un disque mécanique, 10 pour un SSD SATA, 25 pour NVMe, et 2 par broche pour les baies RAID mécaniques. Associez les seuils les plus bas à des durées de dépassement plus longues (10 minutes pour les HDD) et les plus élevés à des durées plus courtes (3 à 5 minutes pour NVMe). Voir le tableau dans Choisir un seuil ci-dessus.
File d'attente disque vs. utilisation disque : quel moniteur choisir ? L'utilisation du disque surveille l'espace libre. La longueur de file d'attente disque surveille les performances. Un lecteur peut être vide à 90 % et être saturé d'E/S, et un lecteur presque plein peut très bien fonctionner. Exécutez les deux si les deux vous importent.
Pourquoi mon alerte s'est-elle déclenchée pendant une fenêtre de sauvegarde ? Les sauvegardes, les analyses antivirus et les copies de fichiers volumineux mettent légitimement en file d'attente des E/S disque. Soit augmentez la durée de dépassement au-delà de la durée de ces tâches, soit augmentez le seuil, soit utilisez le mode maintenance sur les appareils lors des périodes d'E/S intensive planifiées.
Mes appareils macOS rapportent des valeurs de file d'attente différentes de mes appareils Windows sous une charge similaire. Pourquoi ? macOS n'expose pas une vraie file d'attente disque, Level estime donc la profondeur de file d'attente à partir du temps d'occupation des E/S. Windows et Linux lisent les véritables compteurs de file d'attente du système d'exploitation. La valeur macOS est une approximation proche mais ne correspondra pas exactement aux autres plateformes. Ajustez les seuils par plateforme si nécessaire.
Le moniteur rapporte-t-il les lectures et les écritures séparément ? Non. La longueur de la file d'attente est un total unique. Si vous avez besoin de la répartition lecture/écriture, les moniteurs de débit disque, d'IOPS disque et de latence disque les incluent dans la charge utile de l'alerte.
Que se passe-t-il si Level ne peut pas lire la métrique disque ? Chaque relevé a un délai d'expiration de 30 secondes. Si la lecture échoue, le moniteur signale une erreur sous la forme «Impossible de lire la métrique d'E/S disque» plutôt que de rapporter silencieusement zéro.
Qui peut créer et modifier des moniteurs ? Les techniciens ayant accès à la politique de moniteur concernée. Les paramètres d'autorisation sont gérés dans Espace de travail → Autorisations.
Que se passe-t-il avec les alertes ouvertes si je supprime le moniteur ? Les alertes existantes restent en place. La suppression d'un moniteur ne ferme pas les alertes qu'il a déjà créées. Résolvez-les manuellement.

