观察analyze table compute statistics 都对什么对象统计了信息

analyze table compute statistics = analyze table compute statistics for table for all indexes for all columns;

比analyze table compute statistics for table for all indexes for all indexed columns 分析了更多的信息

[@more@]

但这里并不是鼓励使用 analyze table 的方法进行分析。

SQL> create table t as select * from all_objects; Table created.

SQL> create index t_idx on t(object_id); Index created.

SQL> analyze table t compute statistics for table 2 for all indexes for all indexed columns; Table analyzed.

SQL> select t.num_rows, i.num_rows, c.cnt 2 from (select num_rows from user_tables where table_name = 'T') t, 3 (select num_rows from user_indexes where table_name = 'T' ) i, 4 (select count(distinct column_name) cnt from user_tab_histograms where tab le_name = 'T' ) c 5 / NUM_ROWS NUM_ROWS CNT

---------- ---------- ----------

31213 31213 1 《------在这里因为只有1列建立有索引，因此user_tab_histograms 只统计了object_id列的数据分布，这里object_id因为唯一，所以是均匀分布的

SQL> analyze table t delete statistics; Table analyzed.

SQL> select t.num_rows, i.num_rows, c.cnt 2 from (select num_rows from user_tables where table_name = 'T') t, 3 (select num_rows from user_indexes where table_name = 'T' ) i, 4 (select count(distinct column_name) cnt from user_tab_histograms where ta ble_name = 'T' ) c; NUM_ROWS NUM_ROWS CNT

---------- ---------- ---------- 0

SQL> analyze table t compute statistics; Table analyzed.

SQL> select t.num_rows, i.num_rows, c.cnt 2 from (select num_rows from user_tables where table_name = 'T') t, 3 (select num_rows from user_indexes where table_name = 'T' ) i, 4 (select count(distinct column_name) cnt from user_tab_histograms where ta ble_name = 'T' ) c; NUM_ROWS NUM_ROWS CNT

---------- ---------- ----------

31213 31213 13 〈------统计了所有的列，但这些列并不是都用在 where col='X' 上的，因此很多信息其实都没有实际意义。

DBMS_STATS 和TABLE的MONITOR结合，可以当表数据量发生10%的变化的时候，自动重新收集统计信息。我平常更喜欢使用SIZE SKEWONLY 分析histograms 以下引用 ASKTOM中对“what kind of analyze is best”的回复 DBMS_STATS in general always gets table statistics (gather_table,gather_schema,gather_database all do). If you use CASCADE=>TRUE, it'll get indexes. METHOD_OPT dictates how histograms are done. Take the analyze command for example: analyze table T compute statistics for table TRUE or you use gather index stats directly for all columns size 1

ORACLE数据库的PL/SQL语句执行的优化器，有基于代价的优化器（CBO）和基于规则的优化器（RBO）。
RBO的优化方式，依赖于一套严格的语法规则，只要按照规则写出的语句，不管数据表和索引的内容是否发生变化，不会影响PL/SQL语句的"执行计划"。
CBO自ORACLE 7版被引入，ORACLE自7版以来采用的许多新技术都是只基于CBO的，如星型连接排列查询，哈希连接查询，反向索引，索引表，分区表和并行查询等。CBO计算各种可能"执行计划"的"代价"，即cost，从中选用cost最低的方案，作为实际运行方案。各"执行计划"的cost的计算根据，依赖于数据表中数据的统计分布，ORACLE数据库本身对该统计分布是不清楚的，须要分析表和相关的索引，才能搜集到CBO所需的数据。
CBO是ORACLE推荐使用的优化方式，要想使用好CBO，使SQL语句发挥最大效能，必须保证统计数据的及时性。
统计信息的生成可以有完全计算法和抽样估算法。SQL例句如下：
完全计算法： analyze table abc compute statistics;
抽样估算法(抽样20%)： analyze table abc estimate statistics sample 20 percent;
对表作完全计算所花的时间相当于做全表扫描，抽样估算法由于采用抽样，比完全计算法的生成统计速度要快，如果不是要求要有精确数据的话，尽量采用抽样分析法。建议对表分析采用抽样估算，对索引分析可以采用完全计算。
我们可以采用以下两种方法，对数据库的表和索引及簇表定期分析生成统计信息，保证应用的正常性能。

1. 在系统设置定时任务，执行分析脚本。
在数据库服务器端，我们以UNIX用户oracle，运行脚本analyze,在analyze中，我们生成待执行sql脚本，并运行。（假设我们要分析scott用户下的所有表和索引）
Analyze脚本内容如下：
sqlplus scott/tiger << EOF
set pagesize 5000
set heading off
SPOOL ANALYTAB.SQL
SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE STATISTICS SAMPLE 20 PERCENT ;' FROM USER_TABLES；
SPOOL OFF
SPOOL ANALYIND.SQL
SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE STATISTICS SAMPLE 20 PERCENT FOR ALL INDEXES;' FROM USER_TABLES；
SPOOL OFF
SPOOL ANALYZE.LOG
@ANALYTAB.SQL
@ANALYIND.SQL
SPOOL OFF
EXIT

2. 利用ORACLE提供的程序包（PACKAGE）对相关的数据库对象进行分析。
有以下的程序包可以对表，索引，簇表进行分析。
包中的存储过程的相关参数解释如下：
TYPE可以是：TABLE，INDEX，CLUSTER中其一。
SCHEMA为：TABLE，INDEX，CLUSTER的所有者，NULL为当前用户。
NAME为：相关对象的名称。
METHOD是：ESTIMATE，COMPUTE，DELETE中其一，当选用ESTIMATE，
下面两项，ESTIMATE_ROWS和ESTIMATE_PERCENT不能同
时为空值。
ESTIMATE_ROWS是：估算的抽样行数。
ESTIMATE_PERCENT是：估算的抽样百分比。
METHOD_OPT是：有以下选项，
FOR TABLE /*只统计表*/
[FOR ALL [INDEXED] COLUMNS] [SIZE N] /*只统计有索引的表列*/
FOR ALL INDEXES /*只分析统计相关索引*/

PARTNAME是：指定要分析的分区名称。

1)

DBMS_DDL.ANALYZE_OBJECT(
TYPE VARCHAR2,
SCHEMA VARCHAR2,
NAME VARCHAR2,
METHOD VARCHAR2,
ESTIMATE_ROWS NUMBER DEFAULT NULL,
ESTIMATE_PERCENT NUMBER DEFAULT NULL,
METHOD_OPT VARCHAR2 DEFAULT NULL,
PARTNAME VARCHAR2 DEFAULT NULL ) ;
该存储过程可对特定的表，索引和簇表进行分析。
例如，对SCOTT用户的EMP表，进行50%的抽样分析，参数如下：
DBMS_DDL.ANALYZE_OBJECT('TABLE', 'SCOTT', 'EMP', 'ESTIMATE', NULL,50);

2)

DBMS_UTILITY.ANALYZE_SCHEMA (
SCHEMA VARCHAR2,
METHOD VARCHAR2,
ESTIMATE_ROWS NUMBER DEFAULT NULL,
ESTIMATE_PERCENT NUMBER DEFAULT NULL,
METHOD_OPT VARCHAR2 DEFAULT NULL ) ;
DBMS_UTILITY.ANALYZE_DATABASE (
METHOD VARCHAR2,
ESTIMATE_ROWS NUMBER DEFAULT NULL,
ESTIMATE_PERCENT NUMBER DEFAULT NULL,
METHOD_OPT VARCHAR2 DEFAULT NULL ) ;

其中，ANALYZE_SCHEMA用于对某个用户拥有的所有TABLE，INDEX和CLUSTER的分析统计。
ANALYZE_DATABASE用于对整个数据库进行分析统计。

3) DBMS_STATS是在ORACLE8I中新增的程序包，它使统计数据的生成和处理更加灵活方便，并且可以并行方式生成统计数据。在程序包中的以下过程分别分析统计TABLE，INDEX，SCHEMA，DATABASE级别的信息。

DBMS_STATS.GATHER_TABLE_STATS
DBMS_STATS.GATHER_INDEX_STATS
DBMS_STATS.GATHER_SCHEMA_STATS
DBMS_STATS.GATHER_DATABASE_STATS

Analyze table对Oracle性能的提升