Zum Hauptinhalt springen

Monitor für Festplatten-Warteschlangenlänge

Alert when a disk's queue of pending I/O operations stays above a threshold. Covers configuration, how Level reads queue depth on Windows, macOS, and Linux, and threshold guidance.

Einführung

Warnung ausgeben, wenn die Anzahl ausstehender Festplattenoperationen einen Schwellenwert überschreitet und dort verbleibt. Eine wachsende Festplatten-Warteschlange bedeutet, dass das Speichergerät mit den eingehenden E/A-Anfragen nicht mithalten kann – für Benutzer äußert sich das als langsame Anwendungsstarts, träge Dateioperationen und allgemeine Verlangsamung, selbst wenn CPU und Arbeitsspeicher unauffällig aussehen.

Der Monitor für Festplatten-Warteschlangenlänge löst erst aus, wenn die Bedingung für die konfigurierte Überschreitungsdauer anhält, sodass ein einzelner E/A-Spitzenwert keinen überflüssigen Alarm erzeugt.


Funktionsweise des Monitors für Festplatten-Warteschlangenlänge

Level erfasst die Festplattenaktivität auf überwachten Geräten und berechnet die durchschnittliche Anzahl von Anfragen, die auf die Festplatte warten. Übersteigt dieser Wert für die gesamte Überschreitungsdauer Ihren Schwellenwert, erstellt Level eine Warnung.

ℹ️ HINWEIS: Die Warteschlangenlänge wird als Gesamtwert für die Festplatte gemeldet. Sie wird nicht in separate Lese- und Schreibwerte aufgeteilt.

Jede Messung ist eine kurze Momentaufnahme der Festplattenaktivität zum Abfragezeitpunkt – etwa 100 Millisekunden –, kein Durchschnitt über das gesamte Abfrageintervall. Ein kurzer E/A-Spitzenwert kann auch bei einer gesunden Festplatte zu einem hohen Messwert führen. Die Anforderung einer Überschreitungsdauer filtert solche Ausreißer heraus: Eine Warteschlange, die über mehrere aufeinanderfolgende Messungen hinweg lang bleibt, ist ein echter Engpass – kein kurzes Aufflackern.

🖥️ PLATTFORMHINWEIS:

  • Windows: Liest den Avg. Disk Queue Length PhysicalDisk-Leistungsindikator, eine echte Warteschlangenmessung auf Betriebssystemebene.

  • macOS: macOS stellt keine echte Warteschlangentiefe bereit, daher schätzt Level sie anhand der kumulativen E/A-Servicezeit, die von IOKit gemeldet wird. Virtuelle, von APFS synthetisierte Volumes werden übersprungen. Es ist zu erwarten, dass macOS-Werte bei vergleichbaren Arbeitslasten von Windows- und Linux-Werten abweichen.

  • Linux: Leitet die Warteschlangentiefe aus Kernel-E/A-Statistiken ab in /proc/diskstats, ebenfalls eine echte Warteschlangenmessung. Loop-Geräte, RAM-Disks, Device-Mapper-Einträge und einzelne Partitionen werden bei der Überwachung aller Laufwerke ausgeschlossen.


Monitor für Festplatten-Warteschlangenlänge konfigurieren

Öffnen Sie die Ziel-Überwachungsrichtlinie und klicken Sie auf + Neuen Monitor hinzufügen. Das Neuen Monitor hinzufügen Dialogfeld wird geöffnet.

Disk Queue Length Monitor

Name und Typ

  1. Geben Sie einen Namen in das Feld Name Feld. „Server – Tiefe Festplatten-Warteschlange" sagt Ihnen in einer Warnungsliste mehr als „Festplatten-Warteschlangenlänge".

  2. Stellen Sie Typ auf Festplatten-Warteschlangenlänge.

Schweregrad

Stellen Sie Schweregrad ein, der angibt, wie dringend eine gesättigte Festplatte in diesem Kontext ist:

  • Information

  • Warnung

  • Kritisch

  • Notfall

💡 TIPP: Bei Datenbankservern, Dateiservern und Hypervisor-Hosts verdient eine anhaltende Warteschlangentiefe in der Regel den Schweregrad „Kritisch". Arbeitslasten auf diesen Maschinen verschlechtern sich schnell, wenn der Speicher ins Hintertreffen gerät.

Laufwerke

Laufwerke legt fest, welche Festplatten der Monitor auswertet:

  • Beliebiges Laufwerk — jedes Laufwerk auf dem Gerät überwachen

  • Systemfestplatte — nur das primäre Systemlaufwerk des Geräts überwachen

💡 TIPP: „Systemfestplatte" ist der sicherere Standard für Arbeitsstationen. Sekundäre Laufwerke, die Sicherungen oder große Dateikopien durchführen, werden legitim E/A in die Warteschlange einreihen – das ist normalerweise keine Warnung wert.

Schwellenwert

Schwellenwert legt die Anzahl ausstehender Operationen fest, die überschritten werden muss, um den Monitor auszulösen. Anpassen mit den Aufwärts-/Abwärtspfeilen oder durch direkte Eingabe eines Werts.

💡 TIPP: Wenn eine Richtlinie gemischte Hardware abdeckt, teilen Sie sie auf. Eine Richtlinie „Server – HDD" bei 2 und eine Richtlinie „Server – NVMe" bei 25 sind beide ruhiger und genauer als ein Kompromiss-Schwellenwert für alles. Tags machen das einfach: Markieren Sie Geräte nach Speichertyp und richten Sie jede Richtlinie entsprechend aus.

Einen Schwellenwert wählen

Der richtige Schwellenwert hängt fast ausschließlich von der Speicherhardware ab. Eine Warteschlangentiefe, die bedeutet, dass eine rotierende Festplatte überlastet ist, ist für ein NVMe-Laufwerk ein ganz normaler Dienstag.

Speichertyp

Ausgangs-Schwellenwert

Ausgangsdauer

Warum

Rotierende Festplatte (HDD)

2

10 min

Ein Schreib-/Lesekopf, eine Operation zur gleichen Zeit. Eine anhaltende Warteschlange über 2 bedeutet, dass Anfragen sich schneller anhäufen, als die Festplatte sie abarbeiten kann. Der niedrige Schwellenwert wird bei routinemäßigen Sicherungen und Scans überschritten – die längere Dauer filtert diese heraus.

SATA SSD

10

5 min

SATAs NCQ erreicht bei einer Warteschlangentiefe von 32 seine Obergrenze. Eine anhaltende Tiefe von etwa 10 oder mehr bedeutet, dass das Laufwerk stark ausgelastet ist; eine Annäherung an 32 bedeutet Sättigung.

NVMe SSD

25

3–5 min

NVMe verarbeitet konstruktionsbedingt Warteschlangentiefen im Tausenderbereich. Wählen Sie einen Wert, der für Ihre Arbeitslast ungewöhnlich ist, und keine Hardware-Grenze. Eine anhaltende Tiefe im zweistelligen Bereich auf einem typischen Server deutet üblicherweise auf einen außer Kontrolle geratenen Prozess hin, nicht auf die Laufwerkskapazität. Der Schwellenwert filtert bereits gewöhnliche Spitzenwerte heraus, sodass die Dauer kürzer sein kann.

RAID-Array (rotierend)

2 × Festplattenanzahl

10 min

Die klassische Perfmon-Regel skaliert pro Spindel. Ein 8-Festplatten-Array verarbeitet Warteschlangentiefen komfortabel, die eine einzelne Festplatte nicht kann – ein Schwellenwert von etwa 16 ist das äquivalente Signal.

Virtuelle Festplatte / SAN-gestützt

Zuerst Baseline ermitteln

10–15 min

Die Warteschlangentiefe spiegelt hier den Hypervisor und das Speicher-Backend wider, kein physisches Gerät. Vorübergehende Konflikte durch andere Gäste sind normal – verwenden Sie daher die längste Dauer. Beobachten Sie normale Werte eine Woche lang und setzen Sie dann den Schwellenwert oberhalb Ihres beobachteten Spitzenwerts.

ℹ️ HINWEIS: Dies sind Warnschwellenwerte, keine Leistungsobergrenzen. Das Ziel ist, anhaltend abnormales Verhalten für diese Hardwareklasse zu erkennen, nicht zu messen, was das Laufwerk theoretisch leisten kann.

Überschreitungsdauer

Überschreitungsdauer legt fest, wie lange die Warteschlange den Schwellenwert überschreiten muss, bevor eine Warnung ausgelöst wird. Anpassen mit dem Schieberegler oder den Aufwärts-/Abwärtspfeilen. Der Bereich liegt zwischen 1 und 120 Minuten.

ℹ️ HINWEIS: Da jede Messung eine kurze Momentaufnahme und kein Intervalldurchschnitt ist, übernimmt die Überschreitungsdauer hier die Hauptarbeit. Halten Sie sie bei mehreren Minuten, sofern Sie keinen besonderen Grund haben, schneller zu warnen. Eine 1-minütige Dauer bei einem niedrigen Schwellenwert erfasst gewöhnliche E/A-Spitzenwerte wie Antivirenscans und Sicherungen.

Im Gegensatz zum Schwellenwert variiert die Dauer kaum nach Hardware. Sie dient dazu, Arbeitslastrauschen zu filtern, und Sicherungen sowie Scans sehen unabhängig von der darunterliegenden Festplatte gleich aus. Das Muster ist leicht umgekehrt: Je niedriger Ihr Schwellenwert, desto länger sollte Ihre Dauer sein. Sehen Sie die Ausgangsdauern in der Tabelle unter Einen Schwellenwert wählen.

Abhilfe

Fügen Sie eine oder mehrere Automatisierungen hinzu, die ausgeführt werden, wenn diese Warnung ausgelöst wird: Erfassen Sie eine Prozessliste, um herauszufinden, was die Festplatte belastet, starten Sie einen fehlerhaften Dienst neu oder benachrichtigen Sie Ihr Team.

  1. Klicken Sie auf das Automatisierung auswählen Feld und wählen Sie eine Automatisierung aus.

  2. Verwenden Sie das Link-Symbol, um die ausgewählte Automatisierung zu öffnen, das Augensymbol zur Vorschau, oder das × um sie zu entfernen.

Empfänger benachrichtigen

Sendet E-Mails an die Empfänger der Richtlinie, wenn diese Ereignisse eintreten:

  • Bei Warnungserstellung

  • Bei Warnungsauflösung

Empfänger werden auf Ebene der Überwachungsrichtlinie verwaltet, im Empfänger Abschnitt.

Automatische Auflösung

Der Warnung automatisch auflösen, wenn Bedingungen nicht mehr erfüllt sind Umschalter schließt die Warnung automatisch, wenn die Warteschlangentiefe wieder unter den Schwellenwert fällt. Aktivieren Sie ihn, wenn Sie selbst auflösende Warnungen wünschen; lassen Sie ihn deaktiviert, wenn jedes Warteschlangenereignis zur manuellen Überprüfung erhalten bleiben soll.


Häufig gestellte Fragen

  • Welchen Schwellenwert sollte ich als Ausgangswert verwenden? Das hängt von der Hardware ab: grob gesagt 2 für eine rotierende Festplatte, 10 für eine SATA SSD, 25 für NVMe und 2 pro Spindel für rotierende RAID-Arrays. Kombinieren Sie die niedrigeren Schwellenwerte mit längeren Überschreitungsdauern (10 Minuten für HDDs) und die höheren mit kürzeren Dauern (3 bis 5 Minuten für NVMe). Sehen Sie die Tabelle unter Einen Schwellenwert wählen oben.

  • Festplatten-Warteschlange vs. Festplattennutzung: Welchen Monitor brauche ich? Festplattennutzung überwacht den freien Speicherplatz. Festplatten-Warteschlangenlänge überwacht die Leistung. Ein Laufwerk kann zu 90 % leer und trotzdem mit E/A gesättigt sein, und ein fast volles Laufwerk kann einwandfrei funktionieren. Führen Sie beide aus, wenn Ihnen beides wichtig ist.

  • Warum hat meine Warnung während eines Sicherungsfensters ausgelöst? Sicherungen, Antiviren-Scans und große Dateikopien reihen legitim Festplatten-E/A in die Warteschlange ein. Erhöhen Sie entweder die Überschreitungsdauer über die Länge dieser Aufgaben hinaus, erhöhen Sie den Schwellenwert, oder verwenden Sie den Wartungsmodus auf Geräten während geplanter intensiver E/A-Phasen.

  • Meine macOS-Geräte melden andere Warteschlangenwerte als meine Windows-Geräte bei ähnlicher Last. Warum? macOS stellt keine echte Festplatten-Warteschlange bereit, daher schätzt Level die Warteschlangentiefe anhand der E/A-Auslastungszeit. Windows und Linux lesen tatsächliche Warteschlangenzähler des Betriebssystems aus. Der macOS-Wert ist eine gute Annäherung, stimmt aber nicht exakt mit den anderen Plattformen überein. Passen Sie Schwellenwerte bei Bedarf pro Plattform an.

  • Meldet der Monitor Lese- und Schreibvorgänge separat? Nein. Die Warteschlangenlänge ist ein Gesamtwert. Wenn Sie Aufschlüsselungen nach Lesen/Schreiben benötigen, enthalten die Monitore für Festplatten-Durchsatz, Festplatten-IOPS und Festplatten-Latenz diese in der Warnungsnutzlast.

  • Was passiert, wenn Level die Festplattenmetrik nicht lesen kann? Jede Messung hat ein Timeout von 30 Sekunden. Schlägt das Lesen fehl, meldet der Monitor einen Fehler in der Form „Could not read disk IO metric" – anstatt stillschweigend null zu melden.

  • Wer kann Monitore erstellen und bearbeiten? Techniker mit Zugriff auf die entsprechende Überwachungsrichtlinie. Berechtigungseinstellungen werden verwaltet in Arbeitsbereich → Berechtigungen.

  • Was passiert mit offenen Warnungen, wenn ich den Monitor lösche? Bestehende Warnungen bleiben bestehen. Das Löschen eines Monitors schließt keine bereits erstellten Warnungen. Lösen Sie diese manuell auf.

Hat dies deine Frage beantwortet?