【Cost】全表扫描时cost的计算（非工作量模式下-noworkload）

时间：2014-03-07 04:30:47 阅读：616 评论：0 收藏：0 [点我收藏+]

一、理论基础

CBO生成执行计划时需要估算cost值（成本计算），而这种估算是利用对象和系统统计信息，使用特定的公式算法来计算得出的。我们看看使用非工作量统计信息（noworkload）进行全表扫时，CBO是如何计算的。

1. 在接下来的讨论中，我们将会用到以下参数和字段名，这里需要知道：

参数：

db_file_multiblock_read_count ：定义在全表扫时一次可以最多读取的数据块数，在OLTP系统中建议在4-16，太大并没有益处。

db_block_size：数据库块的大小

字段名（来自aux_stats$表）：

1）Noworkload Statistics Stored in the Data Dictionary

Name Description

CPUSPEEDNW The number of operations per second (in millions) that one CPU is able to process.

IOSEEKTIM Average time (in milliseconds) needed to locate data on the disk. The default value is 10.

IOTFRSPEED Average number of bytes per millisecond that can be transferred from the disk. The default value is 4,096.

2） Workload Statistics Stored in the Data Dictionary

Name Description

CPUSPEED The number of operations per second (in millions) that one CPU is able to process

SREADTIM Average time (in milliseconds) needed to perform a single-block read operation

MREADTIM Average time (in milliseconds) needed to perform a multiblock read operation

MBRC Average number of blocks read during a multiblock read operation

MAXTHR Maximum I/O throughput (in bytes per second) for the whole system

SLAVETHR Average I/O throughput (in bytes per second) for a parallel processing slave

统计信息有什么用：例如记录IO的寻道时间、IO传送数据的速度、CPU处理速度这些信息可以用于CBO预估执行计划所做的消耗，进而确定执行计划。

3）其它：

#SRds - number of single block reads
#MRds - number of multi block reads

2. 总cost≈io_cost+ cpu_cost/（cpuspeednw*sreadtim*1000）

CBO计算cost（成本）时需要用IO的开销加上CPU的开销，这样的加法是符合我们的逻辑的，但二者的计算单位不同，不能直接相加得出总的cost。这需要将cpu_cost转换为每秒钟可以执行的单块读的数量（这种转换是等价的），"cpu_cost/（cpuspeednw sreadtim*1000）”式子中的分母就是用来实现这样的一个转换（每个字符串的含义在1.中有解释）。接下来我们逐步公式中分析每一个分子式是如何计算得出的。

note：上述算法是使用非工作量统计信息时的值，如果使用工作量的统计信息时需要用cpuspeed替代cpuspeednw。

3. io_cost

io_cost=#SRds+(#MRds*mreadtim) / sreadtim

io_cost开销按照正常的逻辑思考应为：单块读的次数（#SRds）+多块读的次数（#MRds），但多块读的代价显然和单块读的代价不同，所以查询优化器通常根据单块读来换算开销。因此我们需要将多块读转换为单块读（这种转换同样应该是等价的）：(#MRds*mreadtim) / sreadtim：

所以，io_cost=#SRds+(#MRds*mreadtim) / sreadtim

#SRds：以单块读方式读到的数据块数就是单块读的次数，这个值由CBO来决定。

#MRds ：

1）使用非工作量系统统计信息时：

#MRds=Blocks/db_file_multiblock_read_count(即多块读的次数除以每次读的数据块数量)

2）使用工作量统计信息时：

#MRds=Blocks/mbrc （mbrc：多块读时平均每次读的数据块的数量，因为不可能每次多块读的数量都是db_file_multiblock_read_count参数定义的值。但使用非工作量统计信息时，aux_stats$表中mbrc字段值为空，所以只能使用db_file_multiblock_read_count参数替代）

sreadtim:

1）使用非工作量系统统计信息时：

sreadtim=ioseektim+db_block_size/iotfrspeed

2）使用工作量统计信息时：

在aud_stats$表中sreadtime字段的值

mreadtim：

1）使用非工作量系统统计信息时：

mreadtim=ioseektim+（db_file_multiblock_read_count *db_lock_size）/iotfrspeed

2）使用工作量系统统计信息时：

aud_stats$表中mreadtim字段的值，但以下两种情况下CBO不在使用aud_stats$表中的值

当sreadtim、mreadtim或mbrc不可用时
当mreadtim小于或等于sreadtim时

此时cbo将使用前面的sreadtim公式计算sreadtim，使用如下的公式计算mreadtim

mreadtim=ioseektim+（mdrc *db_lock_size）/iotfrspeed

note：其实对于使用非工作量统计信息和工作量统计信息时，计算公式的逻辑是一样，只是二者在aux_stats$表中对应的字段不同，所以应灵活替换。接下来的探讨中，将不在讨论使用工作量系统统计信息的情况，全部是使用非工作量统计信息时的情况。

到此，得知IO的消耗应为(使用非工作量统计信息)：

io_cost= #SRds + (#MRds*mreadtim) / sreadtim

#MRds=Blocks/db_file_multiblock_read_count

sreadtime=ioseektim+db_block_size/iotfrspeed

mreadtim=ioseektim+（db_file_multiblock_read_count *db_lock_size）/iotfrspeed

后三者的计算公式中所用的多数分子式都可以在aud_stats$视图中查到，db_block_size，db_file_multiblock_read_count 则是初始化参数，Blocks则是在一个执行计划中将扫描的块数，由CBO根据对象的统计信息估算确定。同时我们可以发现，在使用非工作量统计信息时，db_file_multiblock_read_count在公式中以分母的形式存在，如果该参数设置过大，io_cost值会很小，CBO认为多块读的代价很小，在选择执行计划时会更倾向于使用全表扫描，影响执行高效的执行计划的产生。

4. cpu_cost/（cpuspeednw* sreadtim*1000）

cpu_cost：执行计划的信息会存放在plan_table表中，而该表中的cpu_cost字段的值就是我们所需的值。

cpuspeeddnw：在aux_stat$表中可以查到该字段值，其含义在最开始已经解释。

sreadtime：在4.2中已经计算得出

note：上述是使用非工作量统计信息下的公式，如果使用工作量统计信息，则用cpuspeed替代cpuspeednw.

5. 总结：

最后我们可以得出总的消耗为：

1）使用非工作量的统计信息时：

cost=io_cost+ cpu_cost/（cpuspeednw*sreadtim*1000）

2）使用工作量的统计信息时：

cost=io_cost+ cpu_cost/（cpuspeed*sreadtim*1000）

二、实验验证：

1.版本信息

SQL> select * from v$version;

BANNER

----------------------------------------------------------------

Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - 64bi

2. 构造环境

创建mssm的表空间

SQL> create tablespace ballontt datafile ‘/u01/app/oracle/oradata/BALLONTT/ballontt01.dbf‘ size 30m autoextend on maxsize 100m uniform size 1m segment space management manual blocksize 8k;

建表及设置属性

SQL> create table t tablespace ballontt as select * from dba_objects where 1=0;

Table created.

SQL> alter table t pctfree 99 pctused 1;

Table altered.

插入值，并确保每个数据块上只有一行值

SQL> insert into t select * from dba_objects where rownum<2;

1 row created.

SQL> alter table t minimize records_per_block;

Table altered.

SQL> insert into t select * from dba_objects where rownum<1000;

999 rows created.

SQL> commit;

Commit complete.

收集表的统计信息

SQL> begin

2 DBMS_STATS.GATHER_TABLE_STATS(

3 ownname => ‘SYS‘,

4 tabname => ‘T‘,

5 estimate_percent => 100,

6 method_opt => ‘for all columns size 1‘,

7 degree => DBMS_STATS.AUTO_DEGREE,

8 cascade=>TRUE

9 );

10 end;

11 /

PL/SQL procedure successfully completed.

SQL> select owner,table_name,blocks from dba_tables where table_name=‘T‘ and owner=‘SYS‘;

OWNER TABLE_NAME BLOCKS

------------------------------ ------------------------------ ----------

SYS T 1000

ballontt
2014/03/06

---The End---

微博：weibo.com/ballontt

如需转载，请标明出处和链接，谢谢！

【Cost】全表扫描时cost的计算（非工作量模式下-noworkload）,布布扣,bubuko.com

【Cost】全表扫描时cost的计算（非工作量模式下-noworkload）

原文：http://blog.csdn.net/ballontt/article/details/20649235

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

【Cost】全表扫描时cost的计算（非工作量模式下-noworkload）

ballontt 2014/03/06

ballontt
2014/03/06