数据仓库与分析自动增长配置不合理导致的性能抖动

钜形不锈钢水箱 发表于 2023-1-5 23:34:16

自动增长配置不合理导致的性能抖动

背景客户收到了SQL专家云告警邮件，在凌晨2点到3点之间带有资源等待的会话数暴增，请我们协助分析。
现象

登录SQL专家云，进入活动会话的趋势分析页面，下钻到2点钟一个小时内的数据，看到每分钟的等待数都在100左右，2点15分时达到200。https://img2023.cnblogs.com/blog/980582/202301/980582-20230105205745484-309901278.png转到活动会话原始数据页面，看到大量会话都在等待，等待类型是LATCH_EX，等待资源是LOG_MANAGER，数据库都是MIIS****。SQL语句是INSERT、UPDATE、DELETE等写入的语句。
https://img2023.cnblogs.com/blog/980582/202301/980582-20230105205834304-360850125.png 等待资源是LOG_MANAGER，说明数据库MIIS****的日志文件在发生变化。转到数据库空间页面，发现日志文件从2点钟开始增长，2点20时增长到90GB，3点时降到初始值（因为3点有自动收缩日志文件的计划任务）。
https://img2023.cnblogs.com/blog/980582/202301/980582-20230105205924558-445512221.png分析

首先要分析的是什么语句导致数据库日志文件的暴增。进入慢语句汇总页面，汇总2点钟一个小时内的慢语句，根据执行时间、CPU消耗、读次数、写次数等指标排序，找到一个非常大的SQL语句，2点开始执行，2点18分结束。这是迁移历史数据的作业，把当前时间一年前数据迁移到历史表（插入到历史表，然后从当前表中删除），作业很久以前被停止了，昨天才开启，因为要迁移的数据很多，导致了日志文件的暴增。
https://img2023.cnblogs.com/blog/980582/202301/980582-20230105210024575-163344999.png接下来分析LOG_MANAGER的等待，日志文件空间不够时就会触发自动增长，文件增长时，写入数据的会话必须等待，此时会看到Latch等待类型，增长花费的时间越长，等待的时间越长，造成的性能抖动越严重。
从2点钟开始日志文件频繁自动增长，日志文件的自动增长增量设置为10%，随着日志文件的空间越来越大，每次增加会达到几GB甚至更多，基于磁盘的性能，最少造成十几秒的性能抖动。
https://img2023.cnblogs.com/blog/980582/202301/980582-20230105210050931-2136465559.png解决

[*]修改数据文件和日志文件的自动增长为200MB。每次自动增长很快就能完成，基本不会有性能抖动。
[*]调整自动收缩日志文件的维护计划，每次收缩的时候预留10GB的空间，避免频繁的自动增长。
[*]定期检查数据文件的空间，一次性增长一定的空间，避免频繁的自动增长。
其它

除非磁盘空间严重不足，否则不要收缩数据文件，详细请参考：数据库自动收缩造成的阻塞。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

页: [1]

ToB企服应用市场:ToB评测及商务社交产业平台's Archiver

自动增长配置不合理导致的性能抖动