会经常发现开发人员查一下没用索引的语句或者没有limit n的语句,这些没语句会对数据库造成很大的影响,例如一个几千万条记录的大表要全部扫描,或者是不停的做filesort,对数据库和服务器造成io影响等。这是镜像库上面的情况。
而到了线上库,除了出现没有索引的语句,没有用limit的语句,还多了一个情况,mysql连接数过多的问题。说到这里,先来看看以前我们的监控做法
1. 部署zabbix等开源分布式监控系统,获取每天的数据库的io,cpu,连接数
2. 部署每周性能统计,包含数据增加量,iostat,vmstat,datasize的情况
3. mysql slowlog收集,列出top 10
以前以为做了这些监控已经是很完美了,现在部署了mysql节点进程监控之后,才发现很多弊端
第一种做法的弊端: zabbix太庞大,而且不是在mysql内部做的监控,很多数据不是非常准备,现在一般都是用来查阅历史的数据情况
第二种做法的弊端:因为是每周只跑一次,很多情况没法发现和报警
第三种做法的弊端: 当节点的slowlog非常多的时候,top10就变得没意义了,而且很多时候会给出那些是一定要跑的定期任务语句给你。。参考的价值不大
那么我们怎么来解决和查询这些问题呢
对于排查问题找出性能瓶颈来说,最容易发现并解决的问题就是mysql的慢查询以及没有得用索引的查询。
ok,开始找出mysql中执行起来不“爽”的sql语句吧。
方法一: 这个方法我正在用,呵呵,比较喜欢这种即时性的。
01mysql5.0以上的版本可以支持将执行比较慢的sql语句记录下来。
02mysql> show variables like 'long%'; 注:这个long_query_time是用来定义慢于多少秒的才算“慢查询”
03+-----------------+-----------+
04| variable_name | value |
05+-----------------+-----------+
06| long_query_time | 10.000000 |
07+-----------------+-----------+
081 row in set (0.00 sec)
09mysql> set long_query_time=1; 注: 我设置了1, 也就是执行时间超过1秒的都算慢查询。
10query ok, 0 rows affected (0.00 sec)
11mysql> show variables like 'slow%';
12+---------------------+---------------+
13| variable_name | value |
14+---------------------+---------------+
15| slow_launch_time | 2 |
16| slow_query_log | on | 注:是否打开日志记录
17| slow_query_log_file | /tmp/slow.log | 注: 设置到什么位置
18+---------------------+---------------+
193 rows in set (0.00 sec)
20mysql> set global slow_query_log='on' 注:打开日志记录
21一旦slow_query_log变量被设置为on,mysql会立即开始记录。
22/etc/my.cnf 里面可以设置上面mysql全局变量的初始值。
23long_query_time=1
24slow_query_log_file=/tmp/slow.log
方法二:mysqldumpslow命令
01/path/mysqldumpslow -s c -t 10 /tmp/slow-log
02这会输出记录次数最多的10条sql语句,其中:
03-s, 是表示按照何种方式排序,c、t、l、r分别是按照记录次数、时间、查询时间、返回的记录数来排序,ac、at、al、ar,表示相应的倒叙;
04-t, 是top n的意思,即为返回前面多少条的数据;
05-g, 后边可以写一个正则匹配模式,大小写不敏感的;
06比如
07/path/mysqldumpslow -s r -t 10 /tmp/slow-log
08得到返回记录集最多的10个查询。
09/path/mysqldumpslow -s t -t 10 -g “left join” /tmp/slow-log
10得到按照时间排序的前10条里面含有左连接的查询语句。
最后总结一下节点监控的好处
1. 轻量级的监控,而且是实时的,还可以根据实际的情况来定制和修改
2. 设置了过滤程序,可以对那些一定要跑的语句进行过滤
3. 及时发现那些没有用索引,或者是不合法的查询,虽然这很耗时去处理那些慢语句,但这样可以避免数据库挂掉,还是值得的
4. 在数据库出现连接数过多的时候,程序会自动保存当前数据库的processlist,dba进行原因查找的时候这可是利器
5. 使用mysqlbinlog 来分析的时候,可以得到明确的数据库状态异常的时间段
有些人会建义我们来做mysql配置文件设置
调节tmp_table_size 的时候发现另外一些参数
qcache_queries_in_cache 在缓存中已注册的查询数目
qcache_inserts 被加入到缓存中的查询数目
qcache_hits 缓存采样数数目
qcache_lowmem_prunes 因为缺少内存而被从缓存中删除的查询数目
qcache_not_cached 没有被缓存的查询数目 (不能被缓存的,或由于 query_cache_type)
qcache_free_memory 查询缓存的空闲内存总数
qcache_free_blocks 查询缓存中的空闲内存块的数目
qcache_total_blocks 查询缓存中的块的总数目
qcache_free_memory 可以缓存一些常用的查询,如果是常用的sql会被装载到内存。那样会增加数据库访问速度。
中国足彩网信息请查看IT技术专栏
2025国考·省考课程试听报名