前几天ITPUB的熊建国主编和我联系,希望我能参加国产数据库达梦的适用活动,并写几篇使用感受。本来最近手工的事情比较多,本打算推辞的,不过熊主编再三邀请,而且强调并非是枪手文,只要写出真实使用感受即可。既然如此,我就本着支持国产数据库的原则,写几篇试用感受。
由于本人唯一熟悉的数据库就是Oracle,因此所有的对比都是与Oracle数据库进行对比,在这个过程中,将尽可能避免将对Oracle数据库的喜爱之情带进来,争取站在一个比较公正的位置上来进行评价。
这一篇简单介绍一下达梦数据库的分区。
达梦支持水平和垂直两种分区方式。其中水平分区支持范围分区和散列分区。
垂直分区是指:将一个表的一些字段划分到单独的对象也就是分区中,而用户在访问的时候并不需要了解分区的存在,直接访问原表就可以访问到整个表的所有字段。在Oracle中没有垂直分区的概念,和INDEX CLUSTER有一定的相似之处。不过INDEX CLUSTER是通过索引列将不同表的数据存储在同一个BLOCK中,这样访问的时候可以避免执行连接操作,仅扫描很少的块就可以完成查询。而垂直分区则是将表中的列分开到不同的分区中,并不是存储在一起,而是分别存储,只是访问的时候通过统一的接口。而且INDEX CLUSTER没有一个统一的接口。Oracle中想要实现同样的功能,可以通过两个表再加上一个视图来模拟垂直分区的分区表,同时还要再视图上建立INSTEAD OF触发器,来处理视图上的INSERT/UPDATE/DELETE操作。
SQL>CREATE TABLE T_PART_COL
2 (ID NUMBER PRIMARY KEY,
3 NAME VARCHAR(30),
4 AGE NUMBER,
5 ADDRESS VARCHAR(30))
6 PARTITION BY COLUMN ((ID, NAME, AGE), (ADDRESS));
CREATE TABLE T_PART_COL
(ID NUMBER PRIMARY KEY,
NAME VARCHAR(30),
AGE NUMBER,
ADDRESS VARCHAR(30))
PARTITION BY COLUMN ((ID, NAME, AGE), (ADDRESS));
time used: 85.715(ms) clock tick:143158160.
上面这个例子就将T_PART_COL分为两个分区,分别存储ID、NAME、AGE列和ADDRESS列。
SQL>SELECT TABLE_NAME, COLUMN_NAME, ORDINAL_POSITION
2 FROM INFORMATION_SCHEMA.COLUMNS
3 WHERE TABLE_SCHEMA = 'TEST'
4 AND TABLE_NAME LIKE 'T_PART_COL%';
SELECT TABLE_NAME, COLUMN_NAME, ORDINAL_POSITION
FROM INFORMATION_SCHEMA.COLUMNS
WHERE TABLE_SCHEMA = 'TEST'
AND TABLE_NAME LIKE 'T_PART_COL%';
TABLE_NAME COLUMN_NAME ORDINAL_POSITION
1 T_PART_COL ID 1
2 T_PART_COL NAME 2
3 T_PART_COL AGE 3
4 T_PART_COL ADDRESS 4
5 T_PART_COL00DMPART ID 1
6 T_PART_COL00DMPART NAME 2
7 T_PART_COL00DMPART AGE 3
8 T_PART_COL01DMPART ADDRESS 1
8 rows got
time used: 12.599(ms) clock tick:21052930.
Oracle生成了两张表,名称是表名后面增加00DMPART和01DMPART。查询或修改的时候数据库自动将两种表组合在一起。
水平分区支持RANGE和HASH两种方法,与Oracle的RANGE、HASH分区相比要简单很多。
首先看看RANGE分区:
SQL>CREATE TABLE T_PART_RANGE
2 (ID NUMBER,
3 NAME VARCHAR(30),
4 CREATE_DATE DATE)
5 PARTITION BY RANGE (CREATE_DATE)
6 LEFT FOR VALUES (TO_DATE('2009-1-1', 'YYYY-MM-DD'),
7 TO_DATE('2010-1-1', 'YYYY-MM-DD'),
8 TO_DATE('2011-1-1', 'YYYY-MM-DD'));
CREATE TABLE T_PART_RANGE
(ID NUMBER,
NAME VARCHAR(30),
CREATE_DATE DATE)
PARTITION BY RANGE (CREATE_DATE)
LEFT FOR VALUES (TO_DATE('2009-1-1', 'YYYY-MM-DD'),
TO_DATE('2010-1-1', 'YYYY-MM-DD'),
TO_DATE('2011-1-1', 'YYYY-MM-DD'));
time used: 18.524(ms) clock tick:30718050.
用户只能通过设定分区的上限或下限来确定分区的创建,而达梦似乎并没有提供分区信息的视图。
这是一个HASH分区的例子:
SQL>CREATE TABLE T_PART_RANGE
2 (ID NUMBER,
3 NAME VARCHAR(30),
4 CREATE_DATE DATE)
5 PARTITION BY RANGE (CREATE_DATE)
6 LEFT FOR VALUES (TO_DATE('2009-1-1', 'YYYY-MM-DD'),
7 TO_DATE('2010-1-1', 'YYYY-MM-DD'),
8 TO_DATE('2011-1-1', 'YYYY-MM-DD'));
CREATE TABLE T_PART_RANGE
(ID NUMBER,
NAME VARCHAR(30),
CREATE_DATE DATE)
PARTITION BY RANGE (CREATE_DATE)
LEFT FOR VALUES (TO_DATE('2009-1-1', 'YYYY-MM-DD'),
TO_DATE('2010-1-1', 'YYYY-MM-DD'),
TO_DATE('2011-1-1', 'YYYY-MM-DD'));
time used: 18.524(ms) clock tick:30718050.
虽然达梦数据库支持RANGE和HASH分区,但是与Oracle的分区还是存在很大的区别的。其中最主要的一点就是不透明,分区表建立成功后,就无法判断这个表是否是分区表了,而建立的分区数量,每个分区的名称以及物理属性都是不可见的。连分区名称都不清除,更不要说支持Oracle的SELECT * FROM TABLE PARTITION (P1)的语法了。
达梦数据库支持分区,也支持分区索引,但是在分区的透明度上还存在很大的不足,