Wenn Ihre Datenbankarbeitslast überlastet ist, sollten Sie sich zuerst ansehen, welche Abfragen ausgeführt werden, um das Muster der Abfrage zu erkennen. Ist es schwer zu schreiben? Schwer lesen? Wo ist der Engpass?
Identifizieren von Abfrageproblemen
Um dies herauszufinden, können Sie das allgemeine Protokoll oder das langsame Protokoll aktivieren, um zu versuchen, die laufenden Abfragen zu erfassen und in die Datei zu schreiben. Sie können auch aus dem Binärlog lesen (da das Binärlog alle Änderungen in der Datenbank erfasst) und Lesevorgänge direkt aus der laufenden Prozessliste in der Datenbank anzeigen. Sie können die Abfrage sogar aus der Netzwerkperspektive erfassen, indem Sie tcpdump durchsehen.
Was ist als nächstes zu tun? Sie können die Abfrage analysieren, die in die allgemeine Protokolldatei, die langsame Protokolldatei und das Binärprotokoll geschrieben wird, um zu überprüfen, ob etwas Interessantes vor sich geht (z. B. ein Engpass in der Abfrage).
Percona hat ein Tool namens pt-query-digest, um diese Art von Abfragen zu analysieren. Es ist enthalten, wenn Sie das Percona Toolkit installieren, eine Sammlung von Dienstprogrammen, die DBA bei der Verwaltung ihrer Datenbanken unterstützen. In diesem Blog werfen wir einen Blick auf dieses Tool und wie es im Vergleich zu den Abfrageverwaltungsfunktionen von ClusterControl abschneidet.
Installationsverfahren
Percona-Repositories unterstützen zwei Pakete der Linux-Distribution für die Einrichtung, die eine Debian-basierte und eine RPM-basierte Paketverteilung ist. Die Installation ist einfach, wie unten gezeigt:
Debian-basiertes Paket (Ubuntu, Debian)
Konfigurieren Sie Percona-Paket-Repositorys, indem Sie das Paket herunterladen
wget https://repo.percona.com/apt/percona-release_latest.generic_all.deb
Und dann das heruntergeladene Paket mit dpkg installieren
sudo dpkg -i percona-release_latest.generic_all.deb
Führen Sie danach einfach die Installation über den Paketmanager aus
sudo apt-get install percona-toolkit
RPM-basiertes Paket (RHEL, CentOS, Oracle Enterprise Linux, Amazon AMI)
Konfigurieren Sie Percona-Paket-Repositories, indem Sie das RPM-Paket direkt installieren.
sudo yum install https://repo.percona.com/yum/percona-release-latest.noarch.rpm
Führen Sie danach einfach die Installation über den Paketmanager aus
sudo apt-get install percona-toolkit
Die Percona-Dienstprogramme werden auf Ihrem Computer installiert und Sie müssen sie nur noch verwenden.
Workload-Analyse abfragen
Es gibt mehrere Möglichkeiten, die Statistiken aus der Abfragearbeitslast mit pt-query-digest zu generieren, unten ist der Befehl, wie man es mit einer langsamen Abfragedatei, einer allgemeinen Datei, einer Prozessliste in der Datenbank anzeigen und Durchlesen des Binärlogs.
Erzeuge aus Show-Prozesslisten-Datenbank
pt-query-digest --processlist h=localhost,D=sbt,u=sbtest,p=12qwaszx --output slowlog > /tmp/slow_query.log
Generiere aus den langsamen Abfragedateien / allgemeinen Abfragedateien
pt-query-digest mysql-slow.log > /tmp/slow_query.log
Aus Binärlog generieren. Bevor Sie pt-query-digest ausführen, müssen Sie das Binärlog mit mysqlbinlog in ein lesbares Format extrahieren. Vergessen Sie nicht, die Option --type hinzuzufügen und binlog als Quelle einzugeben.
pt-query-digest --type binlog mysql-bin.000001.txt > slow_query.log
Nach Abschluss der Generierung der Datei sehen Sie den unten gezeigten Bericht:
# 12s user time, 170ms system time, 27.44M rss, 221.79M vsz
# Current date: Sun May 10 21:40:47 2020
# Hostname: n2
# Files: mysql-1
# Overall: 94.92k total, 47 unique, 2.79k QPS, 27.90x concurrency ________
# Time range: 2020-05-10 21:39:37 to 21:40:11
# Attribute total min max avg 95% stddev median
# ============ ======= ======= ======= ======= ======= ======= =======
# Exec time 949s 6us 1s 10ms 42ms 42ms 2ms
# Lock time 31s 0 1s 327us 80us 11ms 22us
# Rows sent 69.36k 0 490 0.75 0.99 11.30 0
# Rows examine 196.34k 0 490 2.12 0.99 21.03 0.99
# Rows affecte 55.28k 0 15 0.60 0.99 1.26 0
# Bytes sent 13.12M 11 6.08k 144.93 299.03 219.02 51.63
# Query size 15.11M 5 922 166.86 258.32 83.13 174.84
# Profile
# Rank Query ID Response time Calls R/Call V/M Ite
# ==== ============================= ============== ===== ====== ===== ===
# 1 0xCE367F5CFFCAF46E816F682E... 162.6485 17.1% 199 0.8173 0.03 SELECT order_line? stock?
# 2 0x360F872745C81781F8F75EDE... 107.4898 11.3% 14837 0.0072 0.02 SELECT stock?
# 3 0xE0CE1933D0392DA3A42FAA7C... 102.2281 10.8% 14866 0.0069 0.03 SELECT item?
# 4 0x492B86BCB2B1AE1278147F95... 98.7658 10.4% 14854 0.0066 0.04 INSERT order_line?
# 5 0x9D086C2B787DC3A308043A0F... 93.8240 9.9% 14865 0.0063 0.02 UPDATE stock?
# 6 0x5812BF2C6ED2B9DAACA5D21B... 53.9681 5.7% 1289 0.0419 0.05 UPDATE customer?
# 7 0x51C0DD7AF0A6D908579C28C0... 44.3869 4.7% 864 0.0514 0.03 SELECT customer?
# 8 0xFFFCA4D67EA0A788813031B8... 41.2123 4.3% 3250 0.0127 0.01 COMMIT
# 9 0xFDDEE3813C59881488D9C47F... 36.0707 3.8% 1180 0.0306 0.02 UPDATE customer?
# 10 0x8FBBE0AFA061755CCC1C27AB... 31.6417 3.3% 1305 0.0242 0.03 UPDATE orders?
# 11 0x8AA6EB56551923DB9A49E40A... 23.3281 2.5% 1522 0.0153 0.04 SELECT customer? warehouse?
# 12 0xF34C10B3DA8DB048A630D4C7... 21.1662 2.2% 1305 0.0162 0.03 UPDATE order_line?
# 13 0x59DBA67188951C532AFC2598... 20.8006 2.2% 1503 0.0138 0.33 INSERT new_orders?
# 14 0xDADBEB0FBFA537F5D8722F42... 17.2802 1.8% 1290 0.0134 0.03 SELECT customer?
# 15 0x597A805ADA793440507F3334... 16.4394 1.7% 1516 0.0108 0.03 INSERT orders?
# 16 0x1B1EA568857A6AAC6544B44A... 13.9560 1.5% 1309 0.0107 0.05 SELECT new_orders?
# 17 0xCE3EDD98779478DE17154DCE... 12.1470 1.3% 1322 0.0092 0.05 INSERT history?
# 18 0x9DFD75E88091AA333A777668... 11.6842 1.2% 1311 0.0089 0.05 SELECT orders?
# MISC 0xMISC 39.6393 4.2% 16334 0.0024 0.0 <29 ITEMS>
# Query 1: 6.03 QPS, 4.93x concurrency, ID 0xCE367F5CFFCAF46E816F682E53C0CF03 at byte 30449473
# This item is included in the report because it matches --limit.
# Scores: V/M = 0.03
# Time range: 2020-05-10 21:39:37 to 21:40:10
# Attribute pct total min max avg 95% stddev median
# ============ === ======= ======= ======= ======= ======= ======= =======
# Count 0 199
# Exec time 17 163s 302ms 1s 817ms 992ms 164ms 816ms
# Lock time 0 9ms 30us 114us 44us 84us 18us 36us
# Rows sent 0 199 1 1 1 1 0 1
# Rows examine 39 76.91k 306 468 395.75 441.81 27.41 381.65
# Rows affecte 0 0 0 0 0 0 0 0
# Bytes sent 0 15.54k 79 80 79.96 76.28 0 76.28
# Query size 0 74.30k 382 384 382.35 381.65 0 381.65
# String:
# Databases sbt
# Hosts localhost
# Last errno 0
# Users sbtest
# Query_time distribution
# 1us
# 10us
# 100us
# 1ms
# 10ms
# 100ms ################################################################
# 1s ####
# 10s+
# Tables
# SHOW TABLE STATUS FROM `sbt` LIKE 'order_line6'\G
# SHOW CREATE TABLE `sbt`.`order_line6`\G
# SHOW TABLE STATUS FROM `sbt` LIKE 'stock6'\G
# SHOW CREATE TABLE `sbt`.`stock6`\G
# EXPLAIN /*!50100 PARTITIONS*/
SELECT COUNT(DISTINCT (s_i_id))
FROM order_line6, stock6
WHERE ol_w_id = 1
AND ol_d_id = 1
AND ol_o_id < 3050
AND ol_o_id >= 3030
AND s_w_id= 1
AND s_i_id=ol_i_id
AND s_quantity < 18\G
# Query 2: 436.38 QPS, 3.16x concurrency, ID 0x360F872745C81781F8F75EDE9DD44246 at byte 30021546
# This item is included in the report because it matches --limit.
# Scores: V/M = 0.02
# Time range: 2020-05-10 21:39:37 to 21:40:11
# Attribute pct total min max avg 95% stddev median
# ============ === ======= ======= ======= ======= ======= ======= =======
# Count 15 14837
# Exec time 11 107s 44us 233ms 7ms 33ms 13ms 3ms
# Lock time 1 522ms 15us 496us 35us 84us 28us 23us
# Rows sent 20 14.49k 1 1 1 1 0 1
# Rows examine 7 14.49k 1 1 1 1 0 1
# Rows affecte 0 0 0 0 0 0 0 0
# Bytes sent 28 3.74M 252 282 264.46 271.23 8.65 258.32
# Query size 19 3.01M 209 215 213.05 212.52 2.85 212.52
# String:
# Databases sbt
# Hosts localhost
# Last errno 0
# Users sbtest
# Query_time distribution
# 1us
# 10us #
# 100us ##
# 1ms ################################################################
# 10ms #############
# 100ms #
# 1s
# 10s+
# Tables
# SHOW TABLE STATUS FROM `sbt` LIKE 'stock9'\G
# SHOW CREATE TABLE `sbt`.`stock9`\G
# EXPLAIN /*!50100 PARTITIONS*/
SELECT s_quantity, s_data, s_dist_01 s_dist
FROM stock9
WHERE s_i_id = 60407 AND s_w_id= 2 FOR UPDATE\G
Wie Sie auf dem obigen pt-query-digest Berichtsergebnis sehen können, können wir in 3 Teile geteilt werden.
Zusammenfassender Bericht
Der zusammenfassende Bericht enthält viele Informationen, beginnend mit dem Hostnamenserver, dem Datum, an dem Sie den Befehl ausgeführt haben, Informationen im Zusammenhang mit der protokollierten Abfrage, QPS und Zeitrahmenerfassung. Daneben können Sie auch Statistiken zum Timing für jedes Attribut sehen.
# 12s user time, 170ms system time, 27.44M rss, 221.79M vsz
# Current date: Sun May 10 21:40:47 2020
# Hostname: n2
# Files: mysql-1
# Overall: 94.92k total, 47 unique, 2.79k QPS, 27.90x concurrency ________
# Time range: 2020-05-10 21:39:37 to 21:40:11
# Attribute total min max avg 95% stddev median
# ============ ======= ======= ======= ======= ======= ======= =======
# Exec time 949s 6us 1s 10ms 42ms 42ms 2ms
# Lock time 31s 0 1s 327us 80us 11ms 22us
# Rows sent 69.36k 0 490 0.75 0.99 11.30 0
# Rows examine 196.34k 0 490 2.12 0.99 21.03 0.99
# Rows affecte 55.28k 0 15 0.60 0.99 1.26 0
# Bytes sent 13.12M 11 6.08k 144.93 299.03 219.02 51.63
# Query size 15.11M 5 922 166.86 258.32 83.13 174.84
Suchprofil basierend auf Rang
Sie können nützliche Informationen in der Profilerstellungsabfrage sehen.
# Profile
# Rank Query ID Response time Calls R/Call V/M Ite
# ==== ============================= ============== ===== ====== ===== ===
# 1 0xCE367F5CFFCAF46E816F682E... 162.6485 17.1% 199 0.8173 0.03 SELECT order_line? stock?
# 2 0x360F872745C81781F8F75EDE... 107.4898 11.3% 14837 0.0072 0.02 SELECT stock?
Es gibt viele Informationen wie die laufenden Abfragen, die Antwortzeit der Abfrage (einschließlich der prozentualen Berechnung), wie viele Aufrufe die Abfrage macht und Lesevorgänge pro Aufruf.
Abfrageverteilung
Statistiken zur Abfrageverteilung beschreiben detaillierte Informationen basierend auf dem Rang der Abfrageprofilerstellung. Sie können die QPS-Parallelität und statistische Informationen in Bezug auf das Abfrageattribut sehen.
# Query 1: 6.03 QPS, 4.93x concurrency, ID 0xCE367F5CFFCAF46E816F682E53C0CF03 at byte 30449473
# This item is included in the report because it matches --limit.
# Scores: V/M = 0.03
# Time range: 2020-05-10 21:39:37 to 21:40:10
# Attribute pct total min max avg 95% stddev median
# ============ === ======= ======= ======= ======= ======= ======= =======
# Count 0 199
# Exec time 17 163s 302ms 1s 817ms 992ms 164ms 816ms
# Lock time 0 9ms 30us 114us 44us 84us 18us 36us
# Rows sent 0 199 1 1 1 1 0 1
# Rows examine 39 76.91k 306 468 395.75 441.81 27.41 381.65
# Rows affecte 0 0 0 0 0 0 0 0
# Bytes sent 0 15.54k 79 80 79.96 76.28 0 76.28
# Query size 0 74.30k 382 384 382.35 381.65 0 381.65
# String:
# Databases sbt
# Hosts localhost
# Last errno 0
# Users sbtest
# Query_time distribution
# 1us
# 10us
# 100us
# 1ms
# 10ms
# 100ms ################################################################
# 1s ####
# 10s+
# Tables
# SHOW TABLE STATUS FROM `sbt` LIKE 'order_line6'\G
# SHOW CREATE TABLE `sbt`.`order_line6`\G
# SHOW TABLE STATUS FROM `sbt` LIKE 'stock6'\G
# SHOW CREATE TABLE `sbt`.`stock6`\G
# EXPLAIN /*!50100 PARTITIONS*/
SELECT COUNT(DISTINCT (s_i_id))
FROM order_line6, stock6
WHERE ol_w_id = 1
AND ol_d_id = 1
AND ol_o_id < 3050
AND ol_o_id >= 3030
AND s_w_id= 1
AND s_i_id=ol_i_id
AND s_quantity < 18\G
Es gibt auch Informationen über die Verteilung der Abfragezeit, Host, Benutzer und Datenbank.
Abfrageüberwachung mit ClusterControl
ClusterControl verfügt über eine Abfrageüberwachungsfunktion, die Sie auf der Registerkarte "Abfrageüberwachung" finden, wie unten gezeigt.
Sie können Informationen zu der Abfrage sehen, die in der Datenbank ausgeführt wird, einschließlich statistischer Informationen und Ausführungszeit. Sie können auch die Abfrageüberwachungseinstellung konfigurieren, die sich immer noch auf derselben Seite befindet. Es gibt eine Option, um die langsame Abfrage und Abfragen, die keinen Index verwenden, zu aktivieren, indem Sie auf Einstellungen klicken
Sie müssen nur die lange Abfragezeit festlegen, die den Schwellenwert darstellt die Abfrage, die basierend auf der Ausführungszeit für lange kategorisiert. Außerdem gibt es eine Option zum Aktivieren der Abfrage, die keine Indizes verwendet.
Fazit
Das Überwachen und Analysieren der Abfragearbeitslast kann von Vorteil sein, damit Sie Ihre Datenbankarbeitslast kennen und verstehen. Sowohl pt-query-digest als auch der ClusterControl-Abfragemonitor stellen Informationen zu der in der Datenbank ausgeführten Abfrage bereit, um Ihnen dabei zu helfen, dieses Verständnis zu erlangen.