Sqlserver
 sql >> Datenbank >  >> RDS >> Sqlserver

Einführung von Playback – Neue Point-in-Time-Diagnose für Spotlight Cloud

Heute werde ich durch eine aufregende neue Funktion namens "Wiedergabe" gehen, die wir zu Spotlight Cloud hinzugefügt haben.

Mit der Wiedergabe können Sie Probleme diagnostizieren, die in der Vergangenheit mit SQL Server aufgetreten sind. Mit der Weboberfläche von Spotlight Cloud können Sie einen Zeitpunkt in der Vergangenheit auswählen, an dem bei Ihrem SQL Server Leistungsprobleme aufgetreten sind, und „abspielen“, was zu diesem bestimmten Zeitpunkt passiert ist, um Ihnen bei der Identifizierung der Ursache zu helfen.

Vorteile historischer Daten bei der Überwachung der Datenbankleistung

Wir alle kennen die Frustration, wenn ein Benutzer ein Problem meldet, das er am Vortag hatte, nur um bei der Untersuchung des Problems festzustellen, dass alles einwandfrei funktioniert.

Warum ist dieses Problem aufgetreten? Wenn sie es mir nur zu dem Zeitpunkt gesagt hätten, als es passiert ist, hätte ich etwas dagegen tun können. Wenn ich nur zurückgehen und sehen könnte, was genau zu dieser Zeit passiert ist.

Nun, jetzt können Sie.

Mit der Wiedergabe können Sie bis zu einem Jahr zurückspulen und zu dem Zeitpunkt gehen, an dem ein Problem aufgetreten ist, und sehen, was auf dem Server passiert ist.

Beispielsweise berichteten Benutzer über eine langsame Leistung beim Erstellen von Berichten am 6. März. Wenn ich mir die aktuellen Daten anschaue, kann ich nicht genau verstehen, was das Problem ist. Ich muss zurückspulen und sehen, wie der Server an diesem Tag funktioniert hat.

Zeitraumauswahl zur Eingrenzung von Datenbankproblemen

Mit der Zeitraumauswahl oben rechts auf dem Bildschirm (siehe unten) wähle ich das Datum und die Uhrzeit aus, zu der das Problem aufgetreten ist, und drücke auf Anwenden.

Der Übersichtsbildschirm wird neu geladen und zeigt den Status von SQL Server am 6. März an.
Ich kann die fünf wichtigsten Alarme anzeigen, die zu diesem Zeitpunkt aufgetreten sind, und sehen, dass Sitzung 76 um 13:32 Uhr für 112 Sekunden blockiert war.

Dies hätte zu einer langsameren Serverleistung geführt. Ich habe jetzt also mindestens einen der Gründe für das vom Endbenutzer gemeldete Problem gefunden – aber was hat die blockierte Sitzung zu diesem Zeitpunkt verursacht?

Workload Analyzer-Drilldown für aussagekräftige Einblicke

Wenn ich auf „Diagnose“ und dann auf „Blockierte Sitzung“ klicke, kann ich den Drilldown von Workload Analyzer anzeigen und die blockierten Sitzungen sehen, die zu diesem Zeitpunkt aufgetreten sind. Oben rechts auf dem Bildschirm können Sie sehen, dass der Zeitbereich derselbe ist wie der, den ich zuvor auf der Übersichtsseite ausgewählt habe. Ich weiß also, dass ich mir die blockierten Sitzungen ansehe, die zu dem Zeitpunkt aufgetreten sind, als das Problem gemeldet wurde.

Workload Analyzer Drilldown zeigt die blockierte Sitzung und was sie blockiert.

Von hier aus kann ich die Details der blockierten Sitzung und deren Ursache anzeigen. Ich kann mir auch gesperrte Objekte ansehen und nachvollziehen, welches Objekt die längste Sperrzeit hatte.

Ich kann sogar noch einen Schritt weiter gehen und einen Drilldown durchführen, um die Dauer der Blockierung, die Maschine, das Programm und den Benutzer anzuzeigen, die die Blockierung verursacht haben.

Workload Analyzer Drilldown, der zeigt, welches gesperrte Objekt die meisten „Sperren warten“ verursacht

Wenn ich den Mauszeiger über das Diagramm mit der Aufschlüsselung der Ressourcen (unten) bewege, sehe ich die Sperrwartezeit während des Zeitraums, in dem der Benutzer das Auftreten des Problems gemeldet hat. Diese Möglichkeit, zurückzugehen und die Ursache des Problems zu identifizieren, macht diese neue Wiedergabefunktion so spannend.

Drilldown von Workload Analyzer, der die „Lock Wait Rate“ für ein gesperrtes Objekt zeigt

Nachdem wir dieses Beispiel beendet haben, möchte ich darauf eingehen, wie Sie tatsächlich einen Zeitbereich und ein Intervall in Spotlight Cloud auswählen. Bei der Auswahl des Zeitpunkts oder Zeitbereichs für die Wiedergabe können Sie die Steuerelemente oben rechts verwenden, um die Anzeige der Wiedergabe an Ihre Bedürfnisse anzupassen.

SQL Server-Übersichts-Drilldown mit Anzeige der Auswahl „Zeitraum“.

Im Moment betrachte ich den Zeitbereich vom 4. März um 23:59 Uhr. bis 6. März um 23:59 Uhr Wenn ich auf diese Schaltfläche zum Zurückspulen klicke, sehen Sie, dass sich der Zeitbereich um eine Minute auf 23:58 Uhr verringert.

Wenn ich in größeren Zeitschritten als einer Minute zurückgehen möchte, kann ich das Dropdown-Menü verwenden, um das Zeitintervall auf fünf Minuten, 30 Minuten, eine Stunde oder bis zu 30 Tage zu ändern. Ich habe 30 Minuten ausgewählt und Sie können sehen, dass die Endzeit des Zeitraums um 30 Minuten auf 23:28 Uhr zurückgegangen ist.

Überblick über SQL Server mit auf 30 Minuten festgelegtem Zeitintervall

Wenn ich auf die Optionen „Zeitraum“ klicke, kann ich den Datumsbereich mithilfe der voreingestellten Optionen Letzte Stunde, Letzter Tag, Letzte 3 Tage auswählen. Oder indem ich auf „Mehr“ klicke, kann ich die letzten sieben, 30 oder 90 Tage auswählen.

Wenn ich, wie in meinem vorherigen Beispiel, den Zeitraum kenne, den ich betrachten möchte, kann ich den Kalender verwenden, um die Daten auszuwählen und dann eine bestimmte Zeit von dort auszuwählen.

Wenn ich fertig bin oder aus irgendeinem Grund einfach in die Gegenwart zurückwechseln muss, kann ich auf „Zurücksetzen“ klicken und alles kehrt in seinen ursprünglichen Zustand zurück.

Zurückspulen oder vorspulen für Drilldowns

Ein weiterer Punkt, den ich ansprechen sollte, ist, dass jeder Drilldown ein bestimmtes Standardzeitintervall für das Zurückspulen und schnelle Vorspulen hat. Sie variieren, weil es bei bestimmten Drilldowns sinnvoll ist, um ein kürzeres oder längeres Intervall zu springen. Ein Beispiel wären Sitzungen, in denen viel Aktivität stattfindet, und es ist sinnvoll, eine Minute vor- oder zurückzuspulen, um zu sehen, was sich jede Minute geändert hat. Bei Workload Analyzer, wo das Ziel darin besteht, Probleme zu untersuchen und zu identifizieren, ist es jedoch nützlich, Trends zu sehen, und daher ist das Zurück- oder Vorspulen um eine Minute nicht so nützlich. Aus diesem Grund hat Workload Analyzer ein 30-minütiges Standardzeitintervall für das Zurück- und Vorspulen.

Außerdem ist es wichtig zu beachten, dass einige angezeigte Metriken für den jüngsten Zeitpunkt in diesem Zeitraum gelten, wenn Sie einen Zeitbereich mit Playback auswählen. Wenn wir uns zum Beispiel den obigen Screenshot ansehen, beträgt die Metrik „Page Life Expectancy“ 20 Sekunden. Dieser Messwert gibt die Lebenserwartung einer Seite am 6. März um 23:28 Uhr wieder.

Andere Metriken wie „Durchschnittliche Wartezeit pro E/A“ im Drilldown „E/A nach Datei“ (siehe unten) zeigen jedoch einen aggregierten Wert an, da es keinen Sinn macht, diese Daten so anzuzeigen ein Durchschnitt von einem einzelnen Zeitpunkt.


E/A nach Datei-Drilldown

Diese Wiedergabefunktion ist für alle Drilldowns für SQL Server verfügbar, mit Ausnahme von Heatmap und Health Check. Die Wiedergabe ist auch in den Übersichts- und Alarm-Drilldowns für Windows, Hyper-V, VMWare und Unix verfügbar.

Unix-Übersichts-Drilldown