在我们的数据库设计中,不可逃避的就是数据库表的主键,可能有很多朋友没有深入思考过,主键的设计对整个数据库的设计影响很大,因此我们不得不要重视起来。
主键的必要性 :
在有些中,虽然主键不是必需的,但最好为每个表都设置一个主键,不管是单主键还是复合主键。它存在代表着表结构的完整性,表的记录必须得有唯一区分的字段,主键主要是用于其他表的外键关联,以及本记录的修改与删除。
主键的无意义性 :
在开发过程中,读者可能会看到将一些表使用有意义的字段表示主键,例如“用户登录信息表”将“登录名”(英文名)作为主键,“订单表”中将“订单编号”作为主键,如此设计主键一般都是没什么问题,因为将这些主键基本不具有“意义更改”的可能性。但是,也有一些例外的情况,例如“订单表”需要支持需求“订单可以作废,并重新生成订单,而且订单号要保持原订单号一致”,那将“订单编号”作为主键就满足不了要求了。因此读者在使用具有实际意义的字段作为主键时,需要考虑是否存在这种可能性。
主键的选择
我们现在在思考一下,应该采用什么来作表的主键比较合理,申明一下,主键的设计没有一个定论,各人有各人的方法,哪怕同一个,在不同的项目中,也会采用不同的主键设计原则。
第一:编号作主键
此方法就是采用实际业务中的唯一字段的“编号”作为主键设计,这在小型的项目中是推荐这样做的,因为这可以使项目比较简单化,但在使用中却可能带来一些麻烦,比如要进行“编号修改”时,可能要涉及到很多相关联的其他表,就象黎叔说的“后果很严重” ; 还有就是上面提到的“业务要求允许编号重复时”,我们再那么先知,都无法知道业务将会修改成什么 ?
第二:自动编号主键
这种方法也是很多朋友在使用的,就是新建一个 ID 字段,自动增长,非常方便也满足主键的原则,
优点是:
数据库自动编号,速度快,而且是增量增长,聚集型主键按顺序存放,对于检索非常有利 ;
数字型的,占用空间小,易排序,在程序中传递也方便 ;
如果通过非系统增加记录(比如手动录入,或是用其他工具直接在表里插入新记录,或老系统数据导入)时,非常方便,不用担心主键重复问题。
缺点是:
其实缺点也就是来自其优点,就是因为自动增长,在手动要插入指定 ID 的记录时会显得麻烦,尤其是当系统与其他系统集成时,需要数据导入时,很难保证原系统的 ID 不发生主键冲突(前提是老系统也是数字型的) ;
如果其他系统主键不是数字型那就麻烦更大了,会导致修改主键数据类型了,这也会导致其他相关表的修改,后果同样很严重 ;
就算其他系统也是数字型的,在导入时,为了区分新老数据,可能想在老数据主键前统一加一个“ o ”(old)来表示这是老数据,那么自动增长的数字型又面临一个挑战。
MySQL(auto_increment)、SQL Server(IDENTITY)、Informix、Oracle(首先创建自增序列,接着为自增主键的表创建插入时的触发器,给自增主键ID赋值)等数据库都支持这种自增主键,这种主键在各种系统中应用广泛,但是如果考虑到有新旧系统并存等问题,为了避免不必要的麻烦,使用自增主键要三思。
第三: Max 加一
优点是:
由于自动编号存在那些问题,所以有些朋友就采用自己生成,同样是数字型的,只是把自动增长去掉了,
采用在Insert 时,读取 Max 值后加一,这种方法可以避免自动编号的问题,
缺点是:
但也存在一个效率问题,如果记录非常大的话,那么Max() 也会影响效率的 ;
更严重的是并发性问题,如果同时有两人读到相同的 Max 后,加一后插入的 ID 值会重复,这已经是有经验教训的了。
第四:自制加一
考虑 Max 加一的效率后,有人采用自制加一,也就是建一个特别的表,字段为:表名,当前序列值。这样在往表中插入值时,先从此表中找到相应表的最大值后加一,进行插入,有人可能发现,也可能会存在并发处理,这个并发处理,我们可以采用 lock 线程的方式来避免,在生成此值的时,先 Lock ,取到值以后,再 unLock 出来,这样不会有两人同时生成了。这比 Max 加一的速度要快多了。
但同样存在一个问题:在与其他系统集成时,脱离了系统中的生成方法后,很麻烦保证自制表中的最大值与导入后的保持一致,而且数字型都存在上面讲到的“ o ”老数据的导入问题。因此在“自制加一”中可以把主键设为字符型的。字符型的自制加一我倒是蛮推荐的,应该字符型主键可以应付很多我们意想不到的情况。
1 package com.aspboy.base.database.util; 2 import java.util.HashMap; 3 public class KeyGenerator 4 { 5 private static KeyGenerator keygen=new KeyGenerator(); 6 private static final int POOL_SIZE=20; 7 private HashMap keylist=new HashMap(10); 8 private KeyGenerator() 9 {} 10 11 public static KeyGenerator getInstance() 12 { 13 return keygen; 14 } 15 public synchronized int getNextKey(String keyName) 16 { 17 KeyInfo keyinfo; 18 if (keylist.containsKey(keyName)) 19 { 20 keyinfo=(KeyInfo)keylist.get(keyName); 21 System.out.println("key found"); 22 } 23 else 24 { 25 keyinfo=new KeyInfo(POOL_SIZE,keyName); 26 keylist.put(keyName, keyinfo); 27 System.out.println("new key created"); 28 } 29 return keyinfo.getNextKey(); 30 } 31 32 } 33 34 35 package com.aspboy.base.database.util; 36 import com.aspboy.base.database.DBBean; 37 public class KeyInfo 38 { 39 private int keyMax; 40 private int Keymin; 41 private int nextKey; 42 private int poolSize; 43 private String keyName; 44 //private int times ; 45 46 public KeyInfo(int poolSize,String keyName) 47 { 48 this.poolSize=poolSize; 49 this.keyName=keyName; 50 loadFromDB(); 51 //times++; 52 //System.out.println("get keyvalue from db tiems=="+times); 53 54 } 55 public int getKeyMax() { 56 return keyMax; 57 } 58 public int getKeymin() { 59 return Keymin; 60 } 61 62 private void loadFromDB() 63 { 64 String sql1="update tb_key set KeyValue=KeyValue+"+poolSize+" where keyName='"+keyName+"'"; 65 DBBean.executeSql(sql1); 66 String sql2="select KeyValue from tb_key where keyName='"+keyName+"'"; 67 int keyFromDB=DBBean.getIntSingle(sql2); 68 keyMax=keyFromDB; 69 Keymin=keyFromDB-poolSize+1; 70 nextKey=Keymin; 71 } 72 public int getNextKey() { 73 74 if (nextKey>keyMax) 75 { 76 loadFromDB(); 77 System.out.println("get keyvalue from db"); 78 79 } 80 return nextKey++; 81 } 82 83 84 } 85 86 87 88 调用 方法: KeyGenerator.getInstance().getNextKey(keyName); 89 90 91 keyName 为表名称 92 93 94 相关数据库结构: 95 96 表tb_key 97 98 字段如下: 99 100 KeyValue:pk大小101 102 keyName:表名103
第五: GUID 主键
目前一个比较好的主键是采用 GUID ,当然我是推荐主键还是字符型的,但值由 GUID 生成, GUID 是可以自动生成,也可以程序生成,而且键值不可能重复,可以解决系统集成问题,几个系统的 GUID 值导到一起时,也不会发生重复,就算有“ o ”老数据也可以区分,而且效率很高,在 .NET 里可以直接使用 System.Guid.NewGuid() 进行生成,在 SQL 里也可以使用 NewID() 生成。优点是:
同 IDENTITY 列相比, uniqueidentifier 列可以通过 NewID() 函数提前得知新增加的行 ID ,为应用程序的后续处理提供了很大方便。
便于数据库移植,其它数据库中并不一定具有 IDENTITY 列,而 Guid 列可以作为字符型列转换到其它数据库中,同时将应用程序中产生的 GUID 值存入数据库,它不会对原有数据带来影响。
便于数据库初始化,如果应用程序要加载一些初始数据, IDENTITY 列的处理方式就比较麻烦,而 uniqueidentifier 列则无需任何处理,直接用 T-SQL 加载即可。
便于对某些对象或常量进行永久标识,如类的 ClassID ,对象的实例标识, UDDI 中的联系人、服务接口、 tModel 标识定义等。
缺点是:
GUID 值较长,不容易记忆和输入,而且这个值是随机、无顺序的
GUID 的值有 16 个字节,与其它那些诸如 4 字节的整数相比要相对大一些。这意味着如果在数据库中使用uniqueidentifier 键,可能会带来两方面的消极影响:存储空间增大;索引时间较慢。
基于上面的分析,使用GUID的利大于弊,笔者推荐可以采用此种方式。
第六:具有实际意义的主键
有些表可以使用具有实际意义的主键,但这种表为数不多,因为要保证该字段长久的具有行记录唯一的特点,如若有可能变成该表中的非唯一字段,那它就不适合将其变成主键。
笔者建议有些表可以使用具有实际意义的主键,例如“用户信息表”的“用户登录名”字段基本都是唯一的,而且几乎不可能变成一个登录名对应两条记录,因此可以使用其作为主键。另外,例如“一号通用户信息表”中,“一号通号码”肯定是唯一的,因此也可作为主键。
我也不是推荐 GUID 最好,其实在不同的情况,我们都可以采用上面的某一种方式,思考了一些利与弊,也方便大家在进行设计时参考。
1、采用mysql自增长主键策略
:简单,不需要程序特别处理
:这种方法对以后如果项目移植到其它数据库上改动会比较大,oracle、 db2采用Sequence,mysql、sqlServer又采用自增长,通用性不好
2、使用时间戳+随机数
:实现简单,与数据库无关,移植性较好
:长度太长,最少也得20位,不仅占空间并且建索引的话性能会比较差点吧
3、每次取主键最大值+1做为新的主键
:主键长度可控,移植性较好
:并发写可能会造成主键冲突,对并发也不太好控制
4、单独建一个存放主键的表
:实现简单,移植性较好
:需要考虑并发问题,整个系统主键生成都依赖该表,性能影响可能较大
参考网址:
2.
3.
4.