mysql_explain_log
上传用户:romrleung
上传日期:2022-05-23
资源大小:18897k
文件大小:10k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. #!/usr/bin/perl -w
  2. use strict;
  3. use DBI;
  4. use Getopt::Long;
  5. $Getopt::Long::ignorecase=0;
  6. print "explain_log provided by http://www.mobile.den";
  7. print "=========== ================================n";
  8. my $Param={};
  9. $Param->{host}='';
  10. $Param->{user}='';
  11. $Param->{password}='';
  12. $Param->{PrintError}=0;
  13. $Param->{socket}='';
  14. if (!GetOptions ('date|d:i' => $Param->{ViewDate},
  15.  'host|h:s' => $Param->{host},
  16.  'user|u:s' => $Param->{user},
  17.  'password|p:s' => $Param->{password},
  18.  'printerror|e:s' => $Param->{PrintError},
  19.  'socket|s:s' => $Param->{socket},
  20. )) {
  21.   ShowOptions();
  22. }
  23. else {
  24.   $Param->{UpdateCount} = 0;
  25.   $Param->{SelectCount} = 0;
  26.   $Param->{IdxUseCount} = 0;
  27.   $Param->{LineCount} = 0;
  28.   $Param->{Init} = 0;
  29.   $Param->{Field} = 0;
  30.   $Param->{Refresh} = 0;
  31.   $Param->{QueryCount} = 0;
  32.   $Param->{Statistics} =0;
  33.   $Param->{Query} = undef;
  34.   $Param->{ALL} = undef ;
  35.   $Param->{Comment} = undef ;
  36.   @{$Param->{Rows}} = (qw|possible_keys key type|);
  37.   if ($Param->{ViewDate}) {
  38.     $Param->{View} = 0;
  39.   }
  40.   else {
  41.     $Param->{View} = 1;
  42.   }
  43.   #print "Date=$Param->{ViewDate}, host=$Param->{host}, user=$Param->{user}, password=$Param->{password}n";
  44.   $Param->{dbh}=DBI->connect("DBI:mysql:host=$Param->{host}".($Param->{socket}?";mysql_socket=$Param->{socket}":""),$Param->{user},$Param->{password},{PrintError=>0});
  45.   if (DBI::err()) {
  46.     print "Error: " . DBI::errstr() . "n";
  47.   }
  48.   else {
  49.     $Param->{Start} = time;
  50.     while(<STDIN>) {
  51.       $Param->{LineCount} ++ ;
  52.       if ($Param->{ViewDate} ) {
  53. if (m/^(d{6})s+d{1,2}:dd:dds.*$/) { # get date
  54.   #print "# $1 #n";
  55.   if ($1 == $Param->{ViewDate}) {
  56.     $Param->{View} = 1;
  57.   }
  58.   else {
  59.     $Param->{View} = 0;
  60.   }
  61. }
  62.       }
  63.       if ($Param->{View} ) {
  64. #print "->>>$_";
  65. if (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Connect.+s+ons+(.*)$/i) { # get connection ID($2) and database($3)
  66.   #print "C-$1--$2--$3------n";
  67.   RunQuery($Param);
  68.   if (defined $3) {
  69.     $Param->{CID}->{$2} = $3 ;
  70.     #print "DB:$Param->{CID}->{$2} .. $2 .. $3 n";
  71.   }
  72. }
  73. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Connect.+$/i) { # get connection ID($2) and database($3)
  74.   #print "n <<<<<<<<<<<<<<<<<<----------------------------<<<<<<<<<<<<<<<< n";
  75.   #print "Connect n";
  76.   RunQuery($Param);
  77. }
  78. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Change user .*s+ons+(.*)$/i) { # get connection ID($2) and database($3)
  79.   #print "C-$1--$2--$3------n";
  80.   RunQuery($Param);
  81.   if (defined $3) {
  82.     $Param->{CID}->{$2} = $3 ;
  83.     #print "DB:$Param->{CID}->{$2} .. $2 .. $3 n";
  84.   }
  85. }
  86. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Quits+$/i) { # remove connection ID($2) and querystring
  87.   #print "Q-$1--$2--------n";
  88.   RunQuery($Param);
  89.   delete $Param->{CID}->{$2} ;
  90. }
  91. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Querys+(select.+)$/i) { # get connection ID($2) and querystring
  92.   #print "S1-$1--$2--$3------n";
  93.   RunQuery($Param);
  94.   unless ($Param->{CID}->{$2}) {
  95.     #print "Error: No Database for Handle: $2 foundn";
  96.   }
  97.   else {
  98.     $Param->{DB}=$Param->{CID}->{$2};
  99.     my $s = "$3";
  100.     $s =~ s/froms/from $Param->{DB}./i;
  101.     $Param->{Query}="EXPLAIN $s";
  102.     #$s =~ m/froms+(w+[.]w+)/i;
  103.     #$Param->{tab} =$1;
  104.     #print "-- $Param->{tab} -- $s --n";
  105.   }
  106. }
  107. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Querys+(update.+)$/i) { # get connection ID($2) and querystring
  108.   #print "S2--$1--$2--$3------n";
  109.   RunQuery($Param);
  110.   unless ($Param->{CID}->{$2}) {
  111.     #print "Error: No Database for Handle: $2 foundn";
  112.   }
  113.   else {
  114.     $Param->{DB}=$Param->{CID}->{$2};
  115.     my $ud = $3;
  116.     $ud =~ m/^updates+(w+).+(where.+)$/i;
  117.     $Param->{Query} ="EXPLAIN SELECT * FROM $1 $2";
  118.     $Param->{Query} =~ s/froms/from $Param->{DB}./i;
  119.     #$Param->{Query} =~ m/froms+(w+[.]w+)/i;
  120.     #$Param->{tab} =$1;
  121.   }
  122. }
  123. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Statisticss+(.*)$/i) { # get connection ID($2) and info?
  124.   $Param->{Statistics} ++;
  125.   #print "Statistics--$1--$2--$3------n";
  126.   RunQuery($Param);
  127. }
  128. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Querys+(.+)$/i) { # get connection ID($2)
  129.   $Param->{QueryCount} ++;
  130.   #print "Query-NULL $3n";
  131.   RunQuery($Param);
  132. }
  133. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Refreshs+(.+)$/i) { # get connection ID($2)
  134.   $Param->{Refresh} ++;
  135.   #print "Refreshn";
  136.   RunQuery($Param);
  137. }
  138. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Inits+(.+)$/i) { # get connection ID($2)
  139.   $Param->{Init} ++;
  140.   #print "Init $3n";
  141.   RunQuery($Param);
  142. }
  143. elsif (m/^(d{6}s+d{1,2}:dd:dds+|s+)(d+)s+Fields+(.+)$/i) { # get connection ID($2)
  144.   $Param->{Field} ++;
  145.   #print "Field $3n";
  146.   RunQuery($Param);
  147. }
  148. elsif (m/^s+(.+)$/ ) { # command could be some lines ...
  149.   #print "multi-lined ($1)n";
  150.   my ($A)=$1;
  151.     chomp $A;
  152.   $Param->{Query} .= " $1";
  153.   #print "multi-lined ($1)<<$Param->{Query}>>n";
  154. }
  155.       }
  156.     }
  157.     $Param->{dbh}->disconnect();
  158.     if (1 == 0) {
  159.       print "nunclosed handles----------------------------------------n";
  160.       my $count=0;
  161.       foreach (sort keys %{$Param->{CID}}) {
  162. print "$count | $_ : $Param->{CID}->{$_} n";
  163. $count ++;
  164.       }
  165.     }
  166.     print "nIndex usage ------------------------------------n";
  167.     foreach my $t (sort keys %{$Param->{Data}}) {
  168.       print "nTablet$t: ---n";
  169.       foreach my $k (sort keys %{$Param->{Data}->{$t}}) {
  170. print " countt$k:n";
  171. my %h = %{$Param->{Data}->{$t}->{$k}};
  172.   foreach (sort {$h{$a} <=> $h{$b}} keys %h) {
  173.   print "  $Param->{Data}->{$t}->{$k}->{$_}t$_n";
  174. }
  175.       }
  176.     }
  177.     $Param->{AllCount}=0;
  178.     print "nQueries causing table scans -------------------nn";
  179.     foreach (@{$Param->{ALL}}) {
  180.       $Param->{AllCount} ++;
  181.       print "$_n";
  182.     }
  183.     print "Sum: $Param->{AllCount} table scansn";
  184.     print "nSummary ---------------------------------------nn";
  185.     print "Select: t$Param->{SelectCount} queriesn";
  186.     print "Update: t$Param->{UpdateCount} queriesn";
  187.     print "n";
  188.     print "Init:   t$Param->{Init} timesn";
  189.     print "Field:  t$Param->{Field} timesn";
  190.     print "Refresh: t$Param->{Refresh} timesn";
  191.     print "Query:  t$Param->{QueryCount} timesn";
  192.     print "Statistics:t$Param->{Statistics} timesn";
  193.     print "n";
  194.     print "Logfile: t$Param->{LineCount} linesn";
  195.     print "Started:  t".localtime($Param->{Start})."n";
  196.     print "Finished:   t".localtime(time)."n";
  197.   }
  198. }
  199. ###########################################################################
  200. #
  201. #
  202. #
  203. sub RunQuery {
  204.   my $Param = shift ;
  205.   if (defined $Param->{Query}) {
  206.     if (defined $Param->{DB} ) {
  207.       $Param->{Query} =~ m/froms+(w+[.]w+|w+)/i;
  208.       $Param->{tab} =$1;
  209.       #print "||$Param->{tab} -- $Param->{Query}n";
  210.       my $sth=$Param->{dbh}->prepare("USE $Param->{DB}");
  211.       if (DBI::err()) {
  212. if ($Param->{PrintError}) {print "Error: ".DBI::errstr()."n";}
  213.       }
  214.       else {
  215. $sth->execute();
  216. if (DBI::err()) {
  217.   if ($Param->{PrintError}) {print "Error: ".DBI::errstr()."n";}
  218. }
  219. else {
  220.   $sth->finish();
  221.   $sth=$Param->{dbh}->prepare($Param->{Query});
  222.   if (DBI::err()) {
  223.     if ($Param->{PrintError}) {print "Error: ".DBI::errstr()."n";}
  224.   }
  225.   else {
  226.     #print "$Param->{Query}n";
  227.     $sth->execute();
  228.     if (DBI::err()) {
  229.       if ($Param->{PrintError}) {print "[$Param->{LineCount}]<<$Param->{Query}>>n";}
  230.       if ($Param->{PrintError}) {print "Error: ".DBI::errstr()."n";}
  231.     }
  232.     else {
  233.       my $row = undef;
  234.       while ($row = $sth->fetchrow_hashref()) {
  235. $Param->{SelectCount} ++;
  236. if (defined $row->{Comment}) {
  237.   push (@{$Param->{Comment}}, "$row->{Comment}; $_; $Param->{DB}; $Param->{Query}");
  238. }
  239. foreach (@{$Param->{Rows}}) {
  240.   if (defined $row->{$_}) {
  241.     #if (($_ eq 'type' ) and ($row->{$_} eq 'ALL')) {
  242.     if ($row->{type} eq 'ALL') {
  243.       push (@{$Param->{ALL}}, "$Param->{Query}");
  244.       #print ">> $row->{$_} $_ $Param->{DB} $Param->{Query}n";
  245.     }
  246.     $Param->{IdxUseCount} ++;
  247.     $Param->{Data}->{$Param->{tab}}->{$_}->{$row->{$_}} ++;
  248.   }
  249. }
  250.       }
  251.     }
  252.   }
  253. }
  254.       }
  255.       $sth->finish();
  256.     }
  257.     $Param->{Query} = undef ;
  258.   }
  259. }
  260. ###########################################################################
  261. #
  262. #
  263. #
  264. sub ShowOptions {
  265.   print <<EOF;
  266. Usage: $0 [OPTIONS] < LOGFILE
  267. --date=YYMMDD       select only entrys of date
  268. -d=YYMMDD
  269. --host=HOSTNAME     db-host to ask
  270. -h=HOSTNAME
  271. --user=USERNAME     db-user
  272. -u=USERNAME
  273. --password=PASSWORD password of db-user
  274. -p=PASSWORD
  275. --socket=SOCKET     mysqld socket file to connect
  276. -s=SOCKET
  277. Read logfile from STDIN an try to EXPLAIN all SELECT statements. All UPDATE statements are rewritten to an EXPLAIN SELECT statement. The results of the EXPLAIN statement are collected and counted. All results with type=ALL are collected in an separete list. Results are printed to STDOUT.
  278. EOF
  279. }
  280. 1;
  281. __END__
  282. =pod
  283. =head1 NAME
  284. explain_log.pl
  285. Feed a mysqld general logfile (created with mysqld --log) back into mysql
  286. and collect statistics about index usage with EXPLAIN.
  287. =head1 DISCUSSION
  288. To optimize your indices, you have to know which ones are actually
  289. used and what kind of queries are causing table scans. Especially
  290. if you are generating your queries dynamically and you have a huge
  291. amount of queries going on, this isn't easy.
  292. Use this tool to take a look at the effects of your real life queries.
  293. Then add indices to avoid table scans and remove those which aren't used.
  294. =head1 USAGE
  295. explain_log.pl [--date=YYMMDD] --host=dbhost] [--user=dbuser] [--password=dbpw] [--socket=/path/to/socket] < logfile
  296. --date=YYMMDD       select only entrys of date
  297. -d=YYMMDD
  298. --host=HOSTNAME     db-host to ask
  299. -h=HOSTNAME
  300. --user=USERNAME     db-user
  301. -u=USERNAME
  302. --password=PASSWORD password of db-user
  303. -p=PASSWORD
  304. --socket=SOCKET     change path to the socket
  305. -s=SOCKET
  306. =head1 EXAMPLE
  307. explain_log.pl --host=localhost --user=foo --password=bar < /var/lib/mysql/mobile.log
  308. =head1 AUTHORS
  309.   Stefan Nitz
  310.   Jan Willamowius <jan@mobile.de>, http://www.mobile.de
  311.   Dennis Haney <davh@davh.dk> (Added socket support)
  312. =head1 RECRUITING
  313. If you are looking for a MySQL or Perl job, take a look at http://www.mobile.de
  314. and send me an email with your resume (you must be speaking German!).
  315. =head1 SEE ALSO
  316. mysql documentation
  317. =cut