首页 > 技术文章 > PG 更新统计信息

jenvid 2018-08-20 17:39 原文

http://blog.chinaunix.net/uid-24774106-id-3802225.html

一.vacuum的效果:

  • 1.1释放,再利用 更新/删除的行所占据的磁盘空间.
    第一点的原因是PostgreSQL数据的插入,更新,删除操作并不是真正放到数据库空间.如果不定期释放空间的话,由于数据太多,查询速度会巨降.
  • 1.2更新POSTGRESQL查询计划中使用的统计数据
    第二点的原因是PostgreSQL在做查询处理的时候,为了是查询速度提高,会根据统计数据来确定执行计划.如果不及时更新的话,查询的效果可能不如预期.
  • 1.3防止因事务ID的重置而使非常老的数据丢失。
    第三点的原因是PostgreSQL中每一个事务都会产生一个事务ID,但这个数字是有上限的. 当事务ID达到最大值后,会重新从最小值开始循环.这样如果不及时把以前的数据释放掉的话,原来的老数据会因为事务ID的丢失而丢失掉.

二.哪个表需要做vacuum

SELECT relname, age(relfrozenxid) as xid_age, pg_size_pretty(pg_table_size(oid)) as table_size FROM pg_class WHERE relkind = 'r' and pg_table_size(oid) > 1073741824 ORDER BY age(relfrozenxid) DESC LIMIT 20;

三.查看自动、手动更新vacumm的时间

select schemaname, relname,last_autoanalyze as 上次自动更新时间,last_analyze as 上次手动更新时间 from pg_stat_user_tables;

四.查看具体哪张表的统计信息

select * from pg_stats where tablename='test' and attname='pos';   
# attname是列字段
  • 从库不能执行vacuum
xxxxxx=# vacuum analyze t1;
ERROR:  cannot execute VACUUM during recovery

推荐阅读