国产亚洲精品a在线观看,18亚洲男同志videos网站,亚洲1区2区3区精华液

数据表损坏的修复�Ҏ(gu��)��(�l�极完美�?!!!!)[转]

lk — Fri, 25 Apr 2008 01:46:00 GMT

原文地址�Q?font style="background-color: #dee0fe">http://x.discuz.net/183161/viewspace-16039.html

�׃�� MySQL 本��n的读写及(qi��ng)锁定机制�{�方面的原因�Q�与一些其他数据库软�g一��P��在特�D�情况下的极为频�J�读写时�Q�或在服务器掉电(sh��)、死机等情况下，相关的数据文件可能会(x��)发生被损坏的情况�Q�通常可以采用以下的方式加以解冟�?

一:repair.php 修复工具
Discuz! 自带�?ji��n)一个��?PHP �~�写的数据表修复工具 repair.php�Q�虚拟主机用户也可��用。该工具位于软�g包的 ./utilities 目录中，使用旉��要上传到服务器上论坛目录�Q�注意不要连 ./utilities 目录一起上传，否则无法�q�行�Q�，

upload.jpg
在浏览器�q�行后点��M��面的链接卛_��

run.jpg

修复以后如果出现下面的画面表�C�Z��复成�?!!

result.jpg
�q�个工具能修复大多数常见的数据库错误�Q�尤其是错误号�ؓ(f��) 126�?27 的错误，�?145 错误也可修复�Q�同时能�Ҏ(gu��)��据表在修复之后进行优化。如果一�ơ修复不成功�Q�可以尝试多�ơ，或将数据库重启后再试�?

�?:myisamchk 修复工具
MySQL 自带�?ji��n)专门用��h��据表��(g��)查和修复的工具——myisamchk�Q�当 repair.php 多次修复均无法成功时�Q�可以在服务器终端��?myisamchk �q�行修复。在 MySQL 的程序文件目录（见《数据备份与恢复》中的说明）(j��)可以扑ֈ��q�个工具�?

常用的修复命令�ؓ(f��) myisamchk -r 数据文�g目录/数据表名.MYI�Q�如�?-r 参数不能奏效�Q�可以先把数据文件备份（备䆾可��用直接文件复制的方式�Q�详见《数据备份与恢复》中的说明）(j��)后��?-o 参数,如果-o�q��(sh��)��可以的话,��׃��?f参数,如果�q�是无法修复,只有使用你的备䆾文�g来恢复数据了(ji��n)!什�??你没有备份文�?img title="点击囄��可在新窗口打开" style="cursor: pointer" src="http://www.discuz.net/images/smilies/shocked.gif" align="absMiddle" border="0" alt="" />那你��坐到那里哭�?!开个玩�W?但是�|�站�?qi��ng)时的做备䆾��实是很重要�?��其当有一定的规模以后,��每天都做备䆾!!
下面说一下具体的步骤:
1.

cmd.jpg
2.更改当前目录到mysql/bin下面,一般情况下只有在这个下面才能运行myisamchk命��o(h��)

myisamchk.jpg
3.修复的结�?如果修复后的情况都如下图所�C�的�?你就可以�?成功�?�l�箋(hu��)开启你的网�?�q�行�?!

theresult.jpg
4.别忘?sh��)��(ji��n)启动你的mysql,要不你的�|�站�q�是�q�行不�v�?

startmysql.jpg
ps:下面�l�的一个是linux下面的修复方�?和上面的基本相同.只是linux下面关闭和启动mysql的方法和windows的不�?一般情况下linux�?br />

CODE:

[Copy to clipboard]

/etc/init.d/mysql stop service mysqld stop /etc/init.d/mysql start service mysqld start

来关闭和启动mysql

linux.jpg

另外 MySQL 官方文档中还提供�?ji��n)针对上面操作均无法奏效时的��?gu��)��办法�Q�如先清�I�重建数据表�Q�然后再用备份的数据文�g覆盖�{�，�q�种特别复杂的情�는�户通常不会(x��)��到�Q�因此这里不再做�q�于深入的研�I��?

�?数据表经常性损坏的解决�Ҏ(gu��)��

--------------------------------------------------------------------------------

首先��L(f��ng)��认在服务器硬件不存在问题�Q�如内存工作不稳定、散热条件不好等�Q�，且��用中的操作系�l�版本也没有相关�?BUG 报告或升�U�补丁。这�U�情况下�Q�如果数据库仍出现经常性的损坏�Q�请��(g��)查是�?MySQL 的编译方式或参数存在问题。通常情况下��用官�Ҏ(gu��)��供的�~�译好的版本是比较稳定的�Q�可以长期��用。如果�?zh��n)�钟爱自行�~�译相关�E�序�Q�请��认�(zh��n)�的语言�~�译器（�?gcc�Q�和配置的相兛_��数没有导致不�E�_��的因素。同�Ӟ��盘分区满也可能是导致数据表�l�常性损坏的原因。网上提供了(ji��n)一些问题的处理�Ҏ(gu��)��Q�英文）(j��)�Q�需要时可多参考，�q��Ҏ(gu��)��的具体服务器环境制定解决�Ҏ(gu��)��?/font>

lk 2008-04-25 09:46 发表评论

如何修复损坏的MySQL数据表[转]

lk — Fri, 25 Apr 2008 01:42:00 GMT

原文地址�Q?font style="background-color: #dee0fe">http://www.3v.org.cn/article.asp?id=164

�?/font>于断甉|��非正常关��导致MySQL数据库出现错误是非常常见的问题。有两种�Ҏ(gu��)��Q�一�U�方法��用mysql的check table和repair table 的sql语句�Q�另一�U�方法是使用MySQL提供的多个myisamchk, isamchk数据?hu��)��(g��)��恢复工兗��前者��用�v来比较简�ѝ��推荐��用�?br />
1. check table �?nbsp;repair table
登陆mysql �l�端�Q?br /> mysql -uxxxxx -p dbname
> check table tabTest;
如果出现的结果说Status是OK�Q�则不用修复�Q�如果有Error�Q�可以用�Q?br /> > repair table tabTest;
�q�行修复�Q�修复之后可以在用check table命��o(h��)来进行检查。在新版本的phpMyAdmin里面也可以��用check/repair的功能�?br />
2. myisamchk, isamchk
其中myisamchk适用于MYISAM�c�d��的数据表�Q�而isamchk适用于ISAM�c�d��的数据表。这两条命��o(h��)的主要参数相同，一般新的系�l�都使用MYISAM作�ؓ(f��)�~�省的数据表�c�d��Q�这里以myisamchk��Z��子进行说明。当发现某个数据表出现问题时可以使用�Q?br />
myisamchk tablename.MYI

�q�行��(g��)��，如果需要修复的话，可以使用�Q?br />
myisamchk -of tablename.MYI

关于myisamchk的详�l�参数说明，可以参见它的使用帮助。需要注意的时在�q�行修改时必��ȝ��保M(m��n)ySQL服务器没有访问这个数据表�Q�保险的情况下是最好在�q�行��(g��)��时把MySQL服务器Shutdown掉�?br />
�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q?br />
另外可以把下面的命��o(h��)攑֜�你的rc.local里面启动MySQL服务器前�Q?br />
[ -x /tmp/mysql.sock ] && /pathtochk/myisamchk -of /DATA_DIR/*/*.MYI

其中�?tmp/mysql.sock是MySQL监听的Sock文�g位置�Q�对于��用RPM安装的用户应该是/var/lib/mysql/mysql.sock�Q�对于��用源码安装则�?tmp/mysql.sock可以�Ҏ(gu��)��自己的实际情况进行变��_(d��)��而pathtochk则是myisamchk所在的位置�Q�DATA_DIR是你的MySQL数据库存攄��位置�?br />
需要注意的�Ӟ��如果你打��把�q�条命��o(h��)攑֜�你的rc.local里面�Q�必��ȝ��认在执行�q�条指��o(h��)时MySQL服务器必��L��有启动！

��(g��)��修复所有数据库(�?
mysqlcheck -A -o -r -p
---------------------------------------------------------------------------------

�C�Z��:
mysql> check table tabFTPAccountInstances;

lk 2008-04-25 09:42 发表评论

java执行存储�q�程

lk — Tue, 19 Feb 2008 06:49:00 GMT

conn.prepareCall("{call procedure_name(?,?)}");

�q�种调用是用一�U�换码语法来写的�Q�有两种形式�Q�一�U��Ş式带�l�果参，另一�U��Ş式不带结果参数。结果参数是一�U�输�?font face="Times New Roman"> (OUT) 参数�Q�是已储存过�E�的�q�回倹{��两�U��Ş式都可带有数量可变的输入�Q?font face="Times New Roman">IN 参数�Q�、输出（OUT 参数�Q�或输入和输出（INOUT 参数�Q�的参数。问号将用作参数的占位符�?font face="Times New Roman">

　�?font face="Times New Roman"> JDBC 中调用已储存�q�程的语法如下所�C�。注意，�Ҏ(gu��)��可��C�其间的内容是可选项�Q�方括号本��n�q��语法的组成部份�?font face="Times New Roman">
{call �q�程�?font face="Times New Roman">[(?, ?, ...)]}
　　�q�回�l�果参数的过�E�的语法为：(x��)
{? = call �q�程�?font face="Times New Roman">[(?, ?, ...)]}
　　不带参数的已储存�q�程的语法类��|��(x��)
{call �q�程�?font face="Times New Roman">}

通常�Q�创�?font face="Times New Roman"> CallableStatement 对象的�h应当知道所用的 DBMS 是支持已储存�q�程的，�q�且知道�q�些�q�程都是些什么。然而，如果需要检查，多种DatabaseMetaData �Ҏ(gu��)��都可以提供这��L(f��ng)��信息。例如，如果 DBMS 支持已储存过�E�的调用�Q�则supportsStoredProcedures �Ҏ(gu��)��返�?font face="Times New Roman"> true�Q��?font face="Times New Roman">getProcedures �Ҏ(gu��)��返回对已储存过�E�的描述�?font face="Times New Roman">CallableStatement �l�承 Statement 的方法（它们用于处理一般的 SQL 语句�Q�，�q��(h��)承了(ji��n) PreparedStatement 的方法（它们用于处理 IN 参）(j��)�?font face="Times New Roman">
　　CallableStatement 中定义的所有方法都用于处理 OUT 参数�?font face="Times New Roman"> INOUT 参数的输出部分：(x��)注册 OUT 参数�?font face="Times New Roman"> JDBC �c�d��Q�一�?font face="Times New Roman"> SQL �c�d��Q�、从�q�些参数中检索结果，或者检查所�q�回的值是否�ؓ(f��) JDBC NULL�?font face="Times New Roman">
1、创�?font face="Times New Roman"> CallableStatement 对象
　　CallableStatement 对象是用 Connection �Ҏ(gu��)�� prepareCall 创徏的。下例创�?font face="Times New Roman"> CallableStatement 的实例，其中含有对已储存�q�程 getTestData 调用。该�q�程有两个变量，但不含结果参敎ͼ�(x��)
CallableStatement cstmt = con.prepareCall("{call getTestData(?, ?)}");
　　其中?占位�W��ؓ(f��)IN�?font face="Times New Roman">OUT�q�是INOUT参数�Q�取决于已储存过�E?font face="Times New Roman">getTestData�?font face="Times New Roman">
2�?font face="Times New Roman">IN�?font face="Times New Roman">OUT参数
　　��?font face="Times New Roman">IN参数传给 CallableStatement 对象是通过 setXXX �Ҏ(gu��)��完成的。该�Ҏ(gu��)��l�承�?font face="Times New Roman"> PreparedStatement。所传入参数的类型决定了(ji��n)所用的setXXX�Ҏ(gu��)��Q�例如，�?font face="Times New Roman"> setFloat 来传�?font face="Times New Roman"> float 值等�Q��?font face="Times New Roman">
　　如果已储存过�E�返�?font face="Times New Roman"> OUT 参数�Q�则在执�?font face="Times New Roman"> CallableStatement 对象以前必须先注册每�?font face="Times New Roman"> OUT 参数�?font face="Times New Roman"> JDBC �c�d��Q�这是必需的，因�ؓ(f��)某些 DBMS 要求 JDBC �c�d��Q�。注�?font face="Times New Roman"> JDBC �c�d��是用 registerOutParameter �Ҏ(gu��)��来完成的。语句执行完后，CallableStatement �?font face="Times New Roman"> getXXX �Ҏ(gu��)��取回参数倹{��正��的 getXXX �Ҏ(gu��)��是�ؓ(f��)各参数所注册�?font face="Times New Roman"> JDBC �c�d��所对应�?font face="Times New Roman"> Java �c�d��。换�a�之， registerOutParameter 使用的是 JDBC �c�d��Q�因此它与数据库�q�回�?font face="Times New Roman"> JDBC �c�d��匚w��Q�，�?font face="Times New Roman"> getXXX ��之转换�?font face="Times New Roman"> Java �c�d��?font face="Times New Roman">
　　作�ؓ(f��)�C�Z��Q�下�q�C��码先注册 OUT 参数�Q�执行由 cstmt 所调用的已储存�q�程�Q�然后检索在 OUT 参数中返回的倹{��方�?font face="Times New Roman"> getByte 从第一�?font face="Times New Roman"> OUT 参数中取��Z��?font face="Times New Roman"> Java 字节�Q��?font face="Times New Roman"> getBigDecimal 从第二个 OUT 参数中取��Z��?font face="Times New Roman"> BigDecimal 对象�Q�小数点后面带三位数�Q�：(x��)
CallableStatement cstmt = con.prepareCall("{call getTestData(?, ?)}");
cstmt.registerOutParameter(1, java.sql.Types.TINYINT);
cstmt.registerOutParameter(2, java.sql.Types.DECIMAL, 3);
cstmt.executeQuery();
byte x = cstmt.getByte(1);
java.math.BigDecimal n = cstmt.getBigDecimal(2, 3);

　　CallableStatement �?font face="Times New Roman"> ResultSet 不同�Q�它不提供用增量方式��(g��)索大 OUT 值的�Ҏ(gu��)��机制�?font face="Times New Roman">

3�?font face="Times New Roman">INOUT参数
　　既支持输入又接受输出的参敎ͼ�INOUT 参数�Q�除�?ji��n)调�?font face="Times New Roman"> registerOutParameter �Ҏ(gu��)��外，�q�要求调用适当�?font face="Times New Roman"> setXXX �Ҏ(gu��)��Q�该�Ҏ(gu��)��是从 PreparedStatement �l�承来的�Q��?font face="Times New Roman">setXXX �Ҏ(gu��)��参数��D��|��ؓ(f��)输入参数�Q��?font face="Times New Roman"> registerOutParameter �Ҏ(gu��)��它�?font face="Times New Roman"> JDBC �c�d��注册��出参数�?font face="Times New Roman">setXXX �Ҏ(gu��)��提供一�?font face="Times New Roman"> Java ��|��而驱动程序先把这个��D�{换�ؓ(f��) JDBC ��|��然后��它送到数据库中。这�U?font face="Times New Roman"> IN 值的 JDBC �c�d��和提供给 registerOutParameter �Ҏ(gu��)��?font face="Times New Roman"> JDBC �c�d��应该相同。然后，要检索输出��|��p��用对应的 getXXX �Ҏ(gu��)��。例如，Java �c�d��?font face="Times New Roman">byte 的参数应该��用方�?font face="Times New Roman"> setByte 来赋输入倹{��应该给registerOutParameter 提供�c�d��?font face="Times New Roman"> TINYINT �?font face="Times New Roman"> JDBC �c�d��Q�同时应使用 getByte 来检索输出倹{�?font face="Times New Roman">
　　下例假设有一个已储存�q�程 reviseTotal�Q�其唯一参数�?font face="Times New Roman"> INOUT 参数。方�?font face="Times New Roman">setByte 把此参数设�ؓ(f��) 25�Q�驱动程序将把它作�ؓ(f��) JDBC TINYINT �c�d��送到数据库中。接着�Q?font face="Times New Roman">registerOutParameter ��该参数注册�?font face="Times New Roman"> JDBC TINYINT。执行完该已储存�q�程后，��返回一个新�?font face="Times New Roman"> JDBC TINYINT 倹{��方�?font face="Times New Roman"> getByte ��把�q�个新��g��?font face="Times New Roman"> Java byte �c�d��(g��)索�?font face="Times New Roman">
CallableStatement cstmt = con.prepareCall("{call reviseTotal(?)}");
cstmt.setByte(1, 25);
cstmt.registerOutParameter(1, java.sql.Types.TINYINT);
cstmt.executeUpdate();
byte x = cstmt.getByte(1);

4、先��(g��)索结果，再检�?font face="Times New Roman"> OUT 参数

　　�׃��某些 DBMS 的限�Ӟ��Z��(ji��n)实现最大的可移植性，��先检索由执行CallableStatement 对象所产生的结果，然后再用 CallableStatement.getXXX �Ҏ(gu��)��来检�?font face="Times New Roman"> OUT 参数。如�?font face="Times New Roman"> CallableStatement 对象�q�回多个 ResultSet 对象�Q�通过调用 execute �Ҏ(gu��)��Q�，在检�?font face="Times New Roman"> OUT 参数前应先检索所有的�l�果。这�U�情况下�Q��ؓ(f��)��保�Ҏ(gu��)��有的�l�果都进行了(ji��n)讉K��Q�必��d�� Statement �Ҏ(gu��)�� getResultSet�?font face="Times New Roman">getUpdateCount �?font face="Times New Roman">getMoreResults �q�行调用�Q�直��C��再有�l�果为止�?font face="Times New Roman">

　　��(g��)索完所有的�l�果后，��可�?font face="Times New Roman"> CallableStatement.getXXX �Ҏ(gu��)��来检�?font face="Times New Roman"> OUT 参数中的倹{�?font face="Times New Roman">

5、检索作�?font face="Times New Roman">OUT参数�?font face="Times New Roman">NULL�?font face="Times New Roman">

�q�回�?font face="Times New Roman"> OUT 参数中的值可能会(x��)�?font face="Times New Roman">JDBC NULL。当出现�q�种情�Ş�Ӟ��对 JDBC NULL ��D��行�{换以�?font face="Times New Roman"> getXXX �Ҏ(gu��)��所�q�回的��gؓ(f��) null�?font face="Times New Roman">0 �?font face="Times New Roman"> false�Q�这取决�?font face="Times New Roman">getXXX �Ҏ(gu��)��c�d��。对�?font face="Times New Roman"> ResultSet 对象�Q�要知道0�?font face="Times New Roman">false是否源于JDBCNULL的唯一�Ҏ(gu��)��Q�是用方�?font face="Times New Roman">wasNull�q�行��(g��)��。如�?font face="Times New Roman"> getXXX �Ҏ(gu��)��d��的最后一个值是 JDBC NULL�Q�则该方法返�?font face="Times New Roman"> true�Q�否则返�?font face="Times New Roman"> flase�?/font>

lk 2008-02-19 14:49 发表评论

��量数据�Q�数据量比较大时�Q�的处理分析

lk — Mon, 18 Feb 2008 02:13:00 GMT

��量数据处理问题是一��艰巨而复杂的��d��。原因有以下几个斚w��Q?/p>

一、数据量�q�大�Q�数据中什么情况都可能存在。如果说�?0条数据，那么大不�?ji��n)每条去逐一��(g��)查，��Zؓ(f��)处理�Q�如果有上百条数据，也可以考虑�Q�如果数据上到千万��别，甚至�q�亿�Q�那不是手工能解决的�?ji��n)，必须通过工具或者程序进行处理，��其��量的数据中�Q�什么情况都可能存在�Q�例如，数据中某处格式出�?ji��n)问题，��其在程序处理时�Q�前面还能正常处理，�H�然��C��(ji��n)某个地方问题出现�?ji��n)，�E�序�l�止�?ji��n)。httpwww.itokit.com

二、��Y��g要求高，�pȝ��资源占用率高。对��量的数据进行处理，除了(ji��n)好的�Ҏ(gu��)��Q�最重要的就是合理��用工��P��合理分配�pȝ��资源。一般情况，如果处理的数据过TB�U�，��型机是要考虑的，普通的机子如果有好的方法可以考虑�Q�不�q�也必须加大CPU和内存，��p��面对着千军万马�Q�光有勇气没有一兵一卒是很难取胜的�?/p>

三、要求很高的处理�Ҏ(gu��)��和技巧。这也是本文的写作目的所在，好的处理�Ҏ(gu��)��是一位工�E�师长期工作�l�验的积累，也是个�h的经验的�ȝ��。没有通用的处理方法，但有通用的原理和规则�?/p>

那么处理��量数据有哪些经验和技巧呢�Q�我把我所知道的罗列一下，以供大家参考：(x��)

一、选用优秀的数据库工具httpwww.itokit.com
现在的数据库工具厂家比较多，�Ҏ(gu��)�v量数据的处理�Ҏ(gu��)��使用的数据库工具要求比较高，一般��用Oracle或者DB2�Q�微软公司最�q�发布的SQL Server 2005性能也不错。另外在BI领域�Q�数据库�Q�数据仓库，多维数据库，数据挖掘�{�相兛_��具也要进行选择�Q�象好的ETL工具和好的OLAP工具都十分必要，例如Informatic�Q�Eassbase�{�。笔者在实际数据分析��目中，�Ҏ(gu��)��?000万条的日志数据进行处理，使用SQL Server 2000需要花�?��时�Q�而��用SQL Server 2005则只需要花�?��时�?/p>

二、编写优良的�E�序代码
处理数据��M��开优秀的程序代码，��其在进行复杂数据处理时�Q�必��M��用程序。好的程序代码对数据的处理至关重要，�q�不仅仅是数据处理准��度的问题，更是数据处理效率的问题。良好的�E�序代码应该包含好的��法�Q�包含好的处理流�E�，包含好的效率�Q�包含好的异常处理机制等�?/p>

三、对��量数据�q�行分区操作
�Ҏ(gu��)�v量数据进行分区操作十分必要，例如针对按年份存取的数据�Q�我们可以按�q�进行分区，不同的数据库有不同的分区方式�Q�不�q�处理机制大体相同。例如SQL Server的数据库分区是将不同的数据存?sh��)��不同的文�g�l�下�Q�而不同的文�g�l�存?sh��)��不同的��盘分区下，�q�样��数据分散开�Q�减��磁盘I(y��)O�Q�减��了(ji��n)�pȝ��负荷�Q�而且�q�可以将日志�Q�烦(ch��)引等放于不同的分��Z��?/p>

四、徏立广泛的索引
�Ҏ(gu��)�v量的数据处理�Q�对大表建立索引是必行的�Q�徏立烦(ch��)引要考虑到具体情况，例如针对大表的分�l�、排序等字段�Q�都要徏立相应烦(ch��)引，一般还可以建立复合索引�Q�对�l�常插入的表则徏立烦(ch��)引时要小�?j��)，�W�者在处理数据�Ӟ��曄��在一个ETL��程中，当插入表�Ӟ��首先删除索引�Q�然后插入完毕，建立索引�Q��ƈ实施聚合操作�Q�聚合完成后�Q�再�ơ插入前�q�是删除索引�Q�所以烦(ch��)引要用到好的时机�Q�烦(ch��)引的填充因子和聚集、非聚集索引都要考虑�?/p>

五、徏立缓存机制httpwww.itokit.com
当数据量增加�Ӟ��一般的处理工具都要考虑到缓存问题。缓存大��设�|�的好差也关�p�d��数据处理的成败，例如�Q�笔者在处理2亿条数据聚合操作�Ӟ��~�存讄��?00000条Buffer�Q�这对于�q�个�U�别的数据量是可行的�?/p>

六、加大虚拟内�?br /> 如果�pȝ��资源有限�Q�内存提�C�Z��I��则可以靠增加虚拟内存来解冟뀂笔者在实际��目中曾�l�遇到针�?8亿条的数据进行处理，内存?sh��)?GB�Q?个P4 2.4G的CPU�Q�对�q�么大的数据量进行聚合操作是有问题的�Q�提�C�内存�(sh��)��I��那么采用�?ji��n)加大虚拟内存的��?gu��)��来解冻I��?块磁盘分��Z��分别建立�?�?096M的磁盘分区，用于虚拟内存�Q�这栯��拟的内存则增加�ؓ(f��) 40966 + 1024 = 25600 M�Q�解决了(ji��n)数据处理中的内存?sh��)��问题�?/p>

七、分批处�?
��量数据处理隑֛�为数据量大，那么解决��量数据处理隄��问题其中一个技巧是减少数据量。可以对��量数据分批处理�Q�然后处理后的数据再�q�行合�ƈ操作�Q�这样逐个�ȝ��Q�有利于��数据量的处理，不至于面对大数据量带来的问题�Q�不�q�这�U�方法也要因时因势进行，如果不允许拆分数据，�q�需要另惛_��法。不�q�一般的数据按天、按月、按�q�等存储的，都可以采用先分后合的�Ҏ(gu��)��Q�对数据�q�行分开处理�?/p>

八、��用��(f��)时表和中间表
数据量增加时�Q�处理中要考虑提前汇怅R��这样做的目的是化整为零�Q�大表变��表�Q�分块处理完成后�Q�再利用一定的规则�q�行合�ƈ�Q�处理过�E�中的��(f��)时表的��用和中间�l�果的保存都非常重要�Q�如果对于超��量的数据，大表处理不了(ji��n)�Q�只能拆分�ؓ(f��)多个��表。如果处理过�E�中需要多步汇��L��作，可按汇��L��骤一步步来，不要一条语句完成，一口气吃掉一个胖子�?/p>

�?ji��)、优化查询SQL语句httpwww.itokit.com
在对��量数据�q�行查询处理�q�程中，查询的SQL语句的性能�Ҏ(gu��)��询效率的影响是非常大的，�~�写高效优良的SQL脚本和存储过�E�是数据库工作�h员的职责�Q�也是检验数据库工作人员水��^的一个标准，在对SQL语句的编写过�E�中�Q�例如减��关联，��用或不用游标，设计好高效的数据库表�l�构�{�都十分必要。笔者在工作中试着�?亿行的数据��用游标，�q�行3个小时没有出�l�果�Q�这是一定要改用�E�序处理�?ji��n)�?/p>

十、��用文本格式进行处�?br /> 对一般的数据处理可以使用数据库，如果对复杂的数据处理�Q�必��d��助�E�序�Q�那么在�E�序操作数据库和�E�序操作文本之间选择�Q�是一定要选择�E�序操作文本的，原因为：(x��)�E�序操作文本速度快；�Ҏ(gu��)��本进行处理不�Ҏ(gu��)��出错�Q�文本的存储不受限制�{�。例如一般的��量的网�l�日志都是文本格式或者csv格式�Q�文本格式）(j��)�Q�对它进行处理牵扯到数据清洗�Q�是要利用程序进行处理的�Q�而不��导入数据库再做清�z��?/p>

十一�?nbsp; 定制强大的清�z�规则和出错处理机制
��量数据中存在着不一致性，极有可能出现某处的瑕��c(di��n)��例如，同样的数据中的时间字�D�，有的可能为非标准的时��_(d��)��出现的原因可能�ؓ(f��)应用�E�序的错误，�pȝ��的错误等�Q�这是在�q�行数据处理�Ӟ��必须制定强大的数据清�z�规则和出错处理机制�?/p>

十二�?nbsp; 建立视图或者物化视�?br /> 视图中的数据来源于基表，�Ҏ(gu��)�v量数据的处理�Q�可以将数据按一定的规则分散到各个基表中�Q�查询或处理�q�程中可以基于视图进行，�q�样分散�?ji��n)磁盘I(y��)O�Q�正�?0根��子吊着一�Ҏ(gu��)��子和一根吊着一�Ҏ(gu��)��子的区别�?/p>

十三�?nbsp; 避免使用32位机子（极端情况�Q?br /> 目前的计��机很多都是32位的�Q�那么编写的�E�序对内存的需要便受限�Ӟ��而很多的��量数据处理是必��d��量消耗内存的�Q�这便要求更好性能的机子，其中对位数的限制也十分重要�?/p>

十四�?nbsp; 考虑操作�pȝ��问题
��量数据处理�q�程中，除了(ji��n)�Ҏ(gu��)��据库�Q�处理程序等要求比较高�(sh��)��外，�Ҏ(gu��)��作系�l�的要求也放��C��(ji��n)重要的位�|�，一般是必须使用服务器的�Q�而且对系�l�的安全性和�E�_��性等要求也比较高。尤其对操作�pȝ��自��n的缓存机�Ӟ��临时�I�间的处理等问题都需要综合考虑�?/p>

十五�?nbsp; 使用数据仓库和多�l�数据库存储
数据量加大是一定要考虑OLAP的，传统的报表可�?�?个小时出来结果，而基于Cube的查询可能只需要几分钟�Q�因此处理�v量数据的利器是OLAP多维分析�Q�即建立数据仓库�Q�徏立多�l�数据集�Q�基于多�l�数据集�q�行报表展现和数据挖掘等�?/p>

十六�?nbsp; 使用采样数据�Q�进行数据挖�?br /> ��Z��量数据的数据挖掘正在逐步兴�v�Q�面对着��v量的数据�Q�一般的挖掘软�g或算法往(xi��n)往(xi��n)采用数据抽样的方式进行处理，�q�样的误差不�?x��)很高，大大提高�(sh��)��(ji��n)处理效率和处理的成功率。一般采��h��要注意数据的完整性和�Q�防止过大的偏差。笔者曾�l�对1�?千万行的表数据进行采��P��抽取�?00万行�Q�经��试软�g��试处理的误差�ؓ(f��)千分之五�Q�客户可以接受�?/p>

�q�有一些方法，需要在不同的情况和场合下运用，例如使用代理键等操作�Q�这��L(f��ng)��好处是加快了(ji��n)聚合旉��Q�因为对数值型的聚合比对字�W�型的聚合快得多。类似的情况需要针对不同的需求进行处理�?br /> ��量数据是发展趋势，�Ҏ(gu��)��据分析和挖掘?sh��)��越来越重要�Q�从��量数据中提取有用信息重要而紧�q�，�q�便要求处理要准��，�_�ֺ�要高�Q�而且处理旉��要短�Q�得到有价��g��息要快，所以，�Ҏ(gu��)�v量数据的研究很有前途，也很值得�q�行�q�泛深入的研�I��?/p>

原文地址是：(x��)http://www.itokit.combbsviewthread.phptid=1876

lk 2008-02-18 10:13 发表评论

lk — Mon, 18 Feb 2008 01:55:00 GMT

数据库表�l�构设计�Ҏ(gu��)��?qi��ng)原�?br /> Author: Chancey

在目前的企业信息�pȝ��中，数据库还是最佳的数据存储方式�Q�虽然已�l�有很多的书�c�在指导我们�q�行数据库设计，但应该那�U�方式是设计数据库的表结构的最好方法、设计时应遵从什么样的原则、四个范式如何能够用一�U�方式达到顺畅的应用�{�是我一直在思考和�ȝ��的问题，下文是我针对�q�几个问题根据自��q��设计�l�历准备�ȝ��的一��文章的提纲�Q�欢�q�大家一块进行探讨，集思广益。其中提��C��(ji��n)领域建模的概念，但未作详�l�解释，希望以后能够有时间我们针对这个命题进行深入探讨�?/p>

1)不应该针�Ҏ(gu��)��个系�l�进行数据库设计�Q�而应该根据系�l�架构中的组件划分，针对每个�l��g所处理的业务进行组件单元的数据库设计；不同�l��g间所对应的数据库表之间的兌��应尽可能减少�Q�如果不同组仉��的表需要外键关联也��量不要创徏外键兌��Q�而只是记录关联表的一个主键，��保�l��g对应的表之间的独立性，为系�l�或表结构的重构提供可能性�?/p>

2)采用领域模型驱动的方式和自顶向下的思�\�q�行数据库设计，首先分析�pȝ��业务�Q�根据职责定义对象。对象要�W�合��装的特性，��保与职责相关的数据��被定义在一个对象之内，�q�些数据��能够完整描�q�该职责�Q�不�?x��)出现职责描�q�缺失。�ƈ且一个对象有且只有一��职责，如果一个对象要负责两个或两个以上的职责�Q�应�q�行分拆�?/p>

3)�Ҏ(gu��)��建立的领域模型进行数据库表的映射�Q�此时应参考数据库设计�W�二范式�Q�一个表中的所有非关键字属性都依赖于整个关键字。关键字可以是一个属性，也可以是多个属性的集合�Q�不论那�U�方式，都应��保关键字能够保证唯一性。在��定关键字时�Q�应保证关键字不�?x��)参与业务且不�?x��)出现更新异常�Q�这�Ӟ��最优解��x(ch��ng)��案�ؓ(f��)采用一个自增数值型属性或一个随机字�W�串作�ؓ(f��)表的关键字�?/p>

4)�׃��W�一�Ҏ(gu��)��q�的领域模型驱动的方式设计数据库表结构，领域模型中的每一个对象只有一��职责，所以对象中的数据项不存在传递依赖，所以，�q�种思�\的数据库表结构设计从一开始即满��W�三范式�Q�一个表应满��第二范式，且属性间不存在传递依赖�?/p>

5)同样�Q�由于对象职责的单一性以�?qi��ng)对象之间的关系反映的是业务逻辑之间的关�p�，所以在领域模型中的对象存在��d��象和从对象之分，从对象是�?�Q�N或N�Q�N的角度进一步主对象的业务逻辑�Q�所以从对象�?qi��ng)对象关�p�L��ؓ(f��)的表�?qi��ng)表兌��关系不存在删除和插入异常�?/p>

6)在映��后得出的数据库表结构中�Q�应再根据第四范式进行进一步修改，��保不存在多��g��赖。这�Ӟ��应根据反向工�E�的思�\反馈�l�领域模型。如果表�l�构中存在多��g��赖，则证明领域模型中的对象具有至��两个以上的职责�Q�应�Ҏ(gu��)��W�一条进行设计修正。第四范式：(x��)一个表如果满��BCNF�Q�不应存在多��g��赖�?/p>

7)在经�q�分析后��认所有的表都满��二、三、四范式的情况下�Q�表和表之间的关联尽量采用弱兌��以便于对表字�D�和表结构的调整和重构。�ƈ且，我认为数据库中的表是用来持久化一个对象实例在特定旉��?qi��ng)特定条件下的状态的�Q�只是一个存储介质，所以，表和表之间也不应用强兌��来表�q�C��务（数据间的一致性）(j��)�Q�这一职责应由�pȝ��的逻辑层来保证�Q�这�U�方式也��保�?ji��n)系�l�对于不正确数据�Q�脏数据�Q�的兼容性。当�?d��ng)��从整个系�l�的角度来说我们�q�是要尽最大努力确保系�l�不�?x��)��生脏数据�Q�单从另一个角度来��_(d��)��脏数据的产生在一定程度上也是不可避免的，我们也要保证�pȝ��对这�U�情�늚�定w��性。这是一个折?sh��)��的��?gu��)��?/p>

8)应针�Ҏ(gu��)��有表的主键和外键建立索引�Q�有针对性的�Q�针对一些大数据量和常用��(g��)索方式）(j��)建立�l�合属性的索引�Q�提高检索效率。虽然徏立烦(ch��)引会(x��)消耗部分系�l�资源，但比较�v在检索时搜烦(ch��)整张表中的数据尤其时表中的数据量较大时所带来的性能影响�Q�以�?qi��ng)无索引时的排序操作所带来的性能影响�Q�这�U�方式仍然是值得提倡的�?/p>

9)��量��采用存储过�E�，目前已经有很多技术可以替代存储过�E�的功能�?#8220;对象/关系映射”�{�，��数据一致性的保证攑֜�数据库中�Q�无论对于版本控制、开发和部��v、以�?qi��ng)数据库的迁�U�都�?x��)带来很大的影响。但不可否认�Q�存储过�E�具有性能上的优势�Q�所以，当系�l�可使用的硬件不�?x��)得到提升而性能又是非常重要的质量属性时�Q�可�l�过�q��考虑选用存储�q�程�?/p>

10)当处理表间的兌��U�束所付出的代��P��常常是��用性上的代��P��(j��)��过�?ji��n)保证不会(x��)出��C��攏V��删除、更改异常所付出的代��P��q�且数据冗余也不是主要的问题�Ӟ��表设计可以不�W�合四个范式。四个范式确保了(ji��n)不会(x��)出现异常�Q�但也可能由此导致过于纯�z�的设计�Q��得表�l�构难于使用�Q�所以在设计旉��要进行综合判断，但首先确保符合四个范式，然后再进行精化修正是刚刚�q�入数据库设计领域时可以采用的最好办法�?/p>

11)设计出的表要��h��较好的��用性，主要体现在查询时是否需要关联多张表且还需使用复杂的SQL技巧�?/p>

12)设计出的表要��可能减��数据冗余，��保数据的准��性，有效的控制冗余有助于提高数据库的性能�?/p>

lk 2008-02-18 09:55 发表评论

lk — Mon, 18 Feb 2008 01:47:00 GMT

数据库设计理�?/p>

一�?nbsp; 数据库设计的几个原则

一个好的数据库产品不等于就是一个好的应用系�l�，如果不能设计一个合理的数据库模型，不仅�?x��)增加客��L(f��ng)��与服务器端的�~�程和维护难度，而且�?x��)�?ji��ng)响系�l�实际运行的性能。因此，要想开发出一�Ƅ��想的数据库��品应遵��@以下设计准则�Q?/p>

�Q?�Q?nbsp; 命名规范�?/p>

不同的数据库产品对对象的命名有不同的要求。数据库中的各种对象的命名以�?qi��ng)后台程序的代码�~�写应采用大��写敏感的字母�Ş式，各种对象命名长度不要��过30个字�W�，�q�样便于应用�pȝ��适应不同的数据库�?/p>

�Q?�Q?nbsp; 慎用游标(Cursor)

对多表和大表定义的游标（大的数据集合�Q�而言�Q��用游标逐行遍历数据很容易�ɽE�序�q�入漫长的等待甚��x(ch��ng)��机，因此在��用游标时�Q�可以考虑建立一个��(f��)时表�Q�将�W�合条�g的数据行转入临时表中�Q�再对��(f��)时表定义游标�q�行操作�Q�这时性能�?x��)得到明显提高�?/p>

�Q?�Q?nbsp; 索引(Index)的��?/p>

索引一般用于快速访问表中的数据。大型数据库有两�U�烦(ch��)引，即簇索引和非��烦(ch��)引。添加�Q何一�U�烦(ch��)引均能提高按索引列查询的速度�Q�但�?x��)降低插入、更新、删除操作的性能�Q�尤其是当填充因�?Fill Factor)较大时。所以，如果要对索引较多的表�q�行频繁的插入、更新、删除操作，建立表和索引时应该设�|�较?y��u)��的填充因子�Q�以便在各项数据��中留下较多的自��q��_(d��)��减少��分割及(qi��ng)重新重新�l�织的工作，�q�样才能够提高性能�?/p>

�Q?�Q?nbsp; 数据的一致性和完整�?/p>

��Z��(ji��n)保证数据库的一致性和完整性，设计人员往(xi��n)往(xi��n)�?x��)设计过多的表间兌��Q�尽可能地降低数据的冗余。但是，表间兌��是一�U�强制性措施，建立后，对父表和子表的插入、更新、删除操作均要占用系�l�的开销。此外，最好不要用Identify属性字�D�作��Z��键与子表兌��。如果数据冗余低�Q�数据的完整性容易得��C��证，但增加了(ji��n)表间�q�接查询的操作，因此�Q��ؓ(f��)�?ji��n)提高系�l�的响应旉��Q�合理的数据冗余也是必要的�?/p>

�Q?�Q?nbsp; 事务的��?/p>

事务是必��M��ơ性完成的一�l�操作。虽然这些操作是单个的操作，但数据库�pȝ��能够保证�q�组操作要么全部都完成，要么一炚w��不做。正是大型数据库的这一�Ҏ(gu��)��，使得数据的完整性得��C��(ji��n)极大的保证�?/p>

�Q?�Q?nbsp; 数据库性能调整

在计��机��g配置和网�l�设计确定的情况下，影响到应用系�l�性能的因素主要是数据库性能和客��L(f��ng)��E�序设计。大多数数据库设计员采用两步法进行数据库设计�Q�首先进行逻辑设计�Q�而后�q�行物理设计。数据库逻辑设计去除�?ji��n)所有冗余数据，提高?sh��)��(ji��n)数据吞吐速度�Q�保证了(ji��n)数据的完整性，清楚地表达数据元素之间的关系。而对于多表之间的兌��查询�Q�尤其是大数据表�Q�时�Q�其性能��会(x��)降低�Q�同时也提高?sh��)��(ji��n)客��L(f��ng)��E�序的编�E�难度，因此�Q�物理设计需折�(sh��)��考虑�Q�根据业务规则，��定兌��表的数据量大��、数据项的访问频度，�Ҏ(gu��)��c�L��据表频繁的关联查询应适当提高数据冗余设计�?/p>

�Q?�Q?nbsp; 数据�c�d��的选择

数据�c�d��的合理选择对于数据库的性能和操作具有很大的影响�?/p>

? Identify字段不要作�ؓ(f��)表的主键与其他表兌��Q�这��会(x��)影响到该表的数据�q�移�?/p>

? Text和Image字段属指针型数据�Q�主要用来存放二�q�制大型对象(BLOB)。这�c�L��据的操作相比其他数据�c�d��较慢�Q�因此要避开使用�?/p>

? 日期型字�D늚�优点是有众多的日期函数支持，因此�Q�在日期的大��比较、加减操作上非常��单。但是，按照日期作�ؓ(f��)条�g的查询操作也要用函数�Q�相比其他数据类型在速度上就慢许多。这是因为用函数作�ؓ(f��)查询的条件时�Q�服务器无法用先�q�的性能�{�略来优化查询，只能�q�行表扫描遍历每行�?/p>

二�?nbsp; 数据库设计的基本步骤

对于数据库设计来��_(d��)��比较�l�一的看法是分�ؓ(f��)5个步骤：(x��)需求分析，概念�l�构设计�Q�逻辑�l�构设计�Q�物理设计，数据实施和维护�?/p>

1�Q?nbsp; 需求分�?/p>

要设计一个良好的数据库系�l�，首先要明��应用环境对�pȝ��的要求。因此，对应用环境的需求收集和分析��是数据库设计的�W�一步。需求阶�D�|��集到的基��数据和一�l�数据流�E�图是进行下一步概念设计的基础。需求分析包括以下几个方面：(x��)

�Q?�Q?nbsp; 攉��资料

攉��资料是数据库设计人员和用户共同完成的��d��。强调各�U�用��L(f��ng)��参与是数据库应用�pȝ��设计的特点之一�?/p>

�Q?�Q?nbsp; 分析整理

在大量资料收集完成以后，��p��对资料进行分析和整理。分析的�q�程是对所攉��到的数据�q�行抽象的过�E��?/p>

�Q?�Q?nbsp; 数据?hu��)��程�?/p>

在系�l�分析中通常采用数据?hu��)��程�?Data Flow Diagram)来描�q�系�l�的数据?hu��)��向和对数据的处理功能�?/p>

�Q?�Q?nbsp; 数据字典(Data Dictionary)

除了(ji��n)一套数据流�E�图外，�q�要从原始的数据资料中分析整理出下述数据信息�Q�数据元素的名称、同义词、性质、取��D��围、提供者、��用者、控制权限、保密要求、��用频率、数据量、数据之间联�pȝ��语义说明、各个部门对数据的要求以�?qi��ng)数据处理要求�?/p>

�Q?�Q?nbsp; 用户��认

数据?hu��)��程��N��和数据字典的内容必须�q�回�l�用��P��q�且用非专业术语与用户交��?/p>

需求分析阶�D늚�成果要�Ş成文档资料，臛_��包括各项业务的数据流�E�图�?qi��ng)有兌��明和对各�c�L��据描�q�的集合�Q�即数据字典�?/p>

2�Q?nbsp; 概念�l�构设计

��需求分析得到的用户需求抽象�ؓ(f��)信息�l�构设计�?qi��ng)概忉|��型的�q�程��是概念�l�构设计�Q�它是整个数据库设计的关键。概念徏模的�q�程包括定义实体集、定义联�p�d��定义属性。当�q?�U�成分确定之后，��可以用E-R�Ҏ(gu��)��来进行数据库的概念设计。在设计完全局的E-R图之后，要尽量消除冗余�?/p>

3�Q?nbsp; 逻辑�l�构设计

数据库逻辑设计的�Q务是��概�늻�构设计阶�D�设计好的基本E-R图，转换成特定DBMS所支持的数据模型的�q�程。这样开始进�?#8220;实现设计”�Q�需要考虑具体DBMS的性能�Q�具体的数据模型特点。逻辑设计可分为E-R囑֐�关系模型的�{化、数据模型的优化和设计用户子模式3个过�E��?/p>

4�Q?nbsp; 物理设计

对于�l�定的逻辑数据模型选取一个最适合应用环境的物理结构的�q�程�Q�称为数据库物理设计。数据库的物理设计通常分�ؓ(f��)两步�Q�确定数据库的物理结构，在关�p�L��据库中主要指存取�Ҏ(gu��)��与存储结构：(x��)对物理结构进行评��P��评�h(hu��n)的重点的旉��和空间效率�?/p>

5�Q?nbsp; 数据库的实施和维�?/p>

数据库的实施和维护过�E�可分数据的载入和应用程序的调试、数据库的试�q�行和数据库的维护与�q�行�?/p>

lk 2008-02-18 09:47 发表评论

lk — Mon, 18 Feb 2008 01:42:00 GMT

一个好的数据库产品不等于就有一个好的应用系�l�，如果不能设计一个合理的数据库模型，不仅�?x��)增加客��L(f��ng)��和服务器�D늨�序的�~�程和维护的隑ֺ��Q�而且��会(x��)影响�pȝ��实际�q�行的性能。一般来�Ԍ��在一个MIS�pȝ��分析、设计、测试和试运行阶�D�，因�ؓ(f��)数据量较?y��u)��，设计人员和测试�h员往(xi��n)往(xi��n)只注意到功能的实玎ͼ�而很难注意到性能的薄�׃��处，�{�到�pȝ��投入实际�q�行一�D�|��间后�Q�才发现�pȝ��的性能在降低，�q�时再来考虑提高�pȝ��性能则要��p��更多的�h力物力，而整个系�l�也不可避免的�Ş成了(ji��n)一个打补丁工程。笔者依据多�q�来设计和��用数据库的经验，提出以下一些设计准则，供同仁们参考�?

命名的规�?/p>

---- 不同的数据库产品对对象的命名有不同的要求�Q�因此，数据库中的各�U�对象的命名、后台程序的代码�~�写应采用大��写敏感的�Ş式，各种对象命名长度不要��过30个字�W�，�q�样便于应用�pȝ��适应不同的数据库�?/p>

游标�Q�Cursor�Q�的慎用

---- 游标提供�?ji��n)对特定集合中逐行扫描的手�D�，一般��用游标逐行遍历数据�Q�根据取出的数据不同条�g�q�行不同的操作。尤其对多表和大表定义的游标�Q�大的数据集合）(j��)循环很容易�ɽE�序�q�入一个�O长的�{�特甚至��L��Q�笔者在某市(j��ng)《住房公�U�金��理�pȝ��》进行日�l�帐��h��U�数计息处理�Ӟ��对一�?0万个帐户的游标处理导致程序进入了(ji��n)一个无限期的等特（后经��算需48个小时才能完成）(j��)(��g环境�Q�Alpha/4000 128Mram ,Sco Unix ,Sybase 11.0)�Q�后�Ҏ(gu��)��不同的条件改成用不同的UPDATE语句得以在二十分钟之内完成。示例如下：(x��)
Declare Mycursor cursor for select count_no from COUNT
Open Mycursor
Fetch Mycursor into @vcount_no
While (@@sqlstatus=0)
Begin
If @vcount_no=’’ 条�g1
操作1
If @vcount_no=’’ 条�g2
操作2
。。�?br /> Fetch Mycursor into @vcount_no
End
。。�?br /> 。。�?br /> 改�ؓ(f��)
Update COUNT set 操作1 for 条�g1
Update COUNT set 操作2 for 条�g2
。。�?br /> 。。�?/p>

---- 在有些场合，有时也非得��用游标，此时也可考虑��符合条件的数据行�{入��(f��)时表中，再对临时表定义游标进行操作，可时性能得到明显提高。笔者在某地�?j��ng)〈电(sh��)信收费系�l�〉数据库后台�E�序设计中，对一个表�Q?万行中符合条件的30多行数据�Q�进行游标操�?��g环境�Q�PC服务器，PII266 64Mram ,NT4.0 Ms Sqlserver 6.5)�?�C�Z��如下�Q?

Create #tmp /* 定义临时�?*/
(字段1
字段2
。。�?br /> )
Insert into #tmp select * from TOTAL where
条�g /* TOTAL�?万行 �W�合条�g只有几十�?*/
Declare Mycursor cursor for select * from #tmp
/*对��(f��)时表定义游标*/
。。�?/p>

索引(Index)的��用原�?/p>

---- 创徏索引一般有以下两个目的�Q�维护被索引列的唯一性和提供快速访问表中数据的�{�略。大型数据库有两�U�烦(ch��)引即��烦(ch��)引和非簇索引�Q�一个没有簇索引的表是按堆结构存储数据，所有的数据均添加在表的��N��Q�而徏立了(ji��n)��烦(ch��)引的表，其数据在物理上会(x��)按照��烦(ch��)引键的顺序存储，一个表只允许有一个簇索引�Q�因此，�Ҏ(gu��)��B�?w��i)结构，可以理解��d��M��一�U�烦(ch��)引均能提高按索引列查询的速度�Q�但�?x��)降低插入、更新、删除操作的性能�Q�尤其是当填充因子（F(tu��n)ill Factor�Q�较大时。所以对索引较多的表�q�行频繁的插入、更新、删除操作，��和烦(ch��)引时因设�|�较?y��u)��的填充因子�Q�以便在各数据页中留下较多的自由�I�间�Q�减��页分割�?qi��ng)重新组�l�的工作�?/p>

数据的一致性和完整�?/p>

---- ��Z��(ji��n)保证数据库的一致性和完整性，设计人员往(xi��n)往(xi��n)�?x��)设计过多的表间兌��Q�Relation�Q�，��可能的降低数据的冗余。表间关联是一�U�强制性措施，建立后，对父表（Parent Table�Q�和子表(Child Table)的插入、更新、删除操作均要占用系�l�的开销�Q�另外，最好不要用Identify 属性字�D�作��Z��键与子表兌��。如果数据冗余低�Q�数据的完整性容易得��C��证，但增加了(ji��n)表间�q�接查询的操作，��Z��(ji��n)提高�pȝ��的响应时��_(d��)��合理的数据冗余也是必要的。��用规则（Rule�Q�和�U�束�Q�Check�Q�来防止�pȝ��操作人员误输入造成数据的错误是设计人员的另一�U�常用手�D�，但是�Q�不必要的规则和�U�束也会(x��)占用�pȝ��的不必要开销�Q�需要注意的是，�U�束�Ҏ(gu��)��据的有效性验证要比规则快。所有这些，设计人员在设计阶�D�应�Ҏ(gu��)��pȝ��操作的类型、频度加以均衡考虑�?/p>

事务的陷�?/p>

---- 事务是在一�ơ性完成的一�l�操作。虽然这些操作是单个的操作，SQL Server能够保证�q�组操作要么全部都完成，要么一炚w��不做。正是大型数据库的这一�Ҏ(gu��)��，使得数据的完整性得��C��(ji��n)极大的保证�?br /> ---- 众所周知�Q�SQL Server为每个独立的SQL语句都提供了(ji��n)隐含的事务控�Ӟ��使得每个DML的数据操作得以完整提交或回滚�Q�但是SQL Server�q�提供了(ji��n)昑ּ�事务控制语句

---- BEGIN TRANSACTION 开始一个事�?

---- COMMIT TRANSACTION 提交一个事�?

---- ROLLBACK TRANSACTION 回滚一个事�?

---- 事务可以嵌套�Q�可以通过全局变量@@trancount��(g��)索到�q�接的事务处理嵌套层�ơ。需要加以特别注意�ƈ且极�Ҏ(gu��)��使编�E��h员犯错误的是�Q�每个显�C�或隐含的事物开始都使得该变量加1�Q�每个事务的提交使该变量�?�Q�每个事务的回滚都会(x��)使得该变量置0�Q�而只有当该变量�ؓ(f��)0时的事务提交�Q�最后一个提交语句时�Q�，�q�时才把物理数据写入��盘�?/p>

数据库性能调整

---- 在计��机��g配置和网�l�设计确定的情况下，影响到应用系�l�性能的因素不外乎为数据库性能和客��L(f��ng)��E�序设计。而大多数数据库设计员采用两步法进行数据库设计�Q�首先进行逻辑设计�Q�而后�q�行物理设计。数据库逻辑设计去除�?ji��n)所有冗余数据，提高?sh��)��(ji��n)数据吞吐速度�Q�保证了(ji��n)数据的完整性，清楚地表达数据元素之间的关系。而对于多表之间的兌��查询�Q�尤其是大数据表�Q�时�Q�其性能��会(x��)降低�Q�同时也提高?sh��)��(ji��n)�?��L(f��ng)��E�序的编�E�难度，因此�Q�物理设计需折衷考虑�Q�根据业务规则，��定对关联表的数据量大小、数据项的访问频度，�Ҏ(gu��)��c�L��据表频繁的关联查询应适当提高数据冗余设计�?/p>

数据�c�d��的选择

---- 数据�c�d��的合理选择对于数据库的性能和操作具有很大的影响�Q�有兌��斚w��的书�c�也有不��的阐述�Q�这里主要介�l�几点经验�?br /> Identify字段不要作�ؓ(f��)表的主键与其它表兌��Q�这��会(x��)影响到该表的数据�q�移�?/p>

Text 和Image字段属指针型数据�Q�主要用来存放二�q�制大型对象�Q�BLOB�Q�。这�c�L��据的操作相比其它数据�c�d��较慢�Q�因此要避开使用�?

日期型字�D늚�优点是有众多的日期函数支持，因此�Q�在日期的大��比较、加减操作上非常��单。但是，在按照日期作为条件的查询操作也要用函敎ͼ�相比其它数据�c�d��速度上就慢许�?因�ؓ(f��)用函��C��为查询的条�g�Ӟ��服务器无法用先进的性能�{�略来优化查询而只能进行表扫描遍历每行�?
---- 例如�Q�要从DATA_TAB1中（其中有一个名为DATE的日期字�D�）(j��)查询1998�q�的所有记录�?
---- Select * from DATA_TAB1 where datepart(yy,DATE)=1998

lk 2008-02-18 09:42 发表评论

lk — Mon, 18 Feb 2008 01:31:00 GMT

以下是针对事务型数据库：(x��)
1.是否使用联合主键�Q�个人們֐�于少采用联合主键。因��样会(x��)降低索引的效率，联合主键一般都要用到至��一个业务字�D�，往(xi��n)往(xi��n)是字�W�串型的�Q�而且理论上多字段的烦(ch��)引比单字�D늚�索引要慢些。看上去��g��也不那么清爽�?br /> 在实际的设计中，我尽量避免��用联合主键，有些时�?#8220;不得�?#8221;使用联合主键�?/p>

2.PK采用无意义的字段�Q�逻辑主键�Q�还是有意义的字�D�（业务主键�Q�？个�h們֐��?#8220;逻辑主键”�Q�理由是�q�样设计出的数据库模型结构清晰、关�p�脉�l�清楚，往(xi��n)往(xi��n)更符�?#8220;�W�三范式”�Q�虽然不是故意的�Q�呵呵）(j��)。而且更容易避开“联合主键”�Q�而且可以使用索引效率高的字段�c�d��Q�比如int、long、number。缺�Ҏ(gu��)��用无意义的字�D�徏立表间的关系�Q��跨表查询增多�Q�效率下降。（矛盾无处不在�Q�前面刚说完可以提高效率�Q�这里马上又降低效率�Q��?#8220;业务主键”可以提升查询�~�码的简�z�度和效率�?br /> 个�h使用实际状况�Q��M��来说“逻辑主键”�?#8220;业务主键”执行效率低，但不�?x��)低到无法满��需求。采�?#8220;逻辑主键”比采�?#8220;业务主键”更利于数据库模型的结构、关�p�L��晎ͼ�也更便于�l�护�?br /> 对于分析型数据库�Q�如数据仓库�Q�千万不要这样做�?/p>

3.不要使用多对多关�p�？个�h們֐�于少使用多对多关�p�R��这个问题其实不是数据库设计的问题�(sh��)��(ji��n)�Q�在数据库设计中�Q�多对多关系也仅仅存在于概念模型�Q�E-R�Q�阶�D�，物理模型不在有多对多关系�Q�实际数据库中也不会(x��)�?#8220;多对�?#8221;关系。这是��用ORM时的问题�Q�比如��用Hibernate�Q�多对多关系有时�?x��)�ɾ~�码看�v来灵�z�M��些，代�h(hu��n)是效率的明显降低�?br /> 个�h实际使用中，设计时基本不考虑多对多关�p�，但编码时��M��(x��)有小�l�成员�(sh��)��用一些多对多关系�Q�自己徏立多对多的ORM�Q��自己�~�码方便些，用在数据量小的地方，影响不大。大数据量，�?#8220;��止使用”�?/p>

4.为每个表增加一个state字段�Q�我�?f��n)惯在设计时�l�每个表设一个state字段�Q�取�?�?�Q�默认��gؓ(f��)1�Q�具体业务意义或操作上的意义可以自定义。可以作��Z��个状态控制字�D�，如查询、更新、删除条�Ӟ��单据是否有效�Q�业务单据对应的表会(x��)有业务意义上�?#8220;�?无效”�?#8220;状�?#8221;字段�Q�这�U�情况下�Q�我�q�是�?x��)再加一个state字段�Q�，甚至仅仅是控制一条数据是�?#8220;有效”�Q�有效的意义你自己定�Q�。在数据�q�移�Q�如转入分析用的数据库）(j��)时也可能�?x��)发挥作用�?/p>

5.为每个表讄��一些备用字�D�？没办法，我��L��设计不出“完美”的数据表�Q�给每个表加几个备用字段�Q�我一般用字符串型�Q�随你）(j��)可以应付“不时之需”�Q�尤其是需要长期维护的、业务可能有临时性变动的�pȝ��?/p>

6.��量不要在一个表中存入其兌��表的字段�Q�徏议不存！�q�样做确实可以提高查询效率，但在一个有很多表，�q�且兌��表多的情况下�Q�很难保持数据的一致性！数据库结构也比较�p�糕。而且不存�Q�也不会(x��)使效率十分低下�?/p>

7.不要�ȝ��接修�Ҏ(gu��)��据库�Q�个��点很重要�Q�当需要修�Ҏ(gu��)��Q�应该先��M��Ҏ(gu��)��型，然后同步物理数据库，��其是团队开发，否则要多做更多的事情来搞定，也可能会(x��)引入更多的错误�?nbsp;

lk 2008-02-18 09:31 发表评论

lk — Fri, 15 Feb 2008 06:13:00 GMT

数据库优化设计方�?/h1>

　　本文首先讨论�?ji��n)基于第三范式的数据库表的基本设计，着重论�q�C��(ji��n)建立主键和烦(ch��)引的�{�略和方案，然后从数据库表的扩展设计和库表对象的攄��{�角度概�q�C��(ji��n)数据库管理系�l�的优化�Ҏ(gu��)��?

　　1 引言

　　数据库优化的目标无非是避免磁盘I(y��)/O瓉��、减��CPU利用率和减少资源竞争。�ؓ(f��)�?ji��n)便于读者阅��d��理解�Q�笔者参阅了(ji��n)Sybase、Informix和Oracle�{�大型数据库�pȝ��参考资料，��Z��多年的工�E�实�늻�验，从基本表设计、扩展设计和数据库表对象攄��{�角度进行讨论，着重讨��Z��(ji��n)如何避免��盘I(y��)/O瓉��和减��资源竞争，�怿�读者会(x��)一目了(ji��n)然�?

　　2 ��Z��W�三范式的基本表设计

　　在基于表驱动的信息管理系�l�（MIS�Q�中�Q�基本表的设计规范是�W�三范式�Q?NF�Q�。第三范式的基本特征是非主键属性只依赖于主键属性。基于第三范式的数据库表设计��h��很多优点�Q�一是消除了(ji��n)冗余数据�Q�节省了(ji��n)��盘存储�I�间�Q�二是有良好的数据完整性限�Ӟ��卛_��于主外键的参照完整限制和��Z��主键的实体完整性限�Ӟ��q��得数据容易维护，也容易移植和更新�Q�三是数据的可逆性好�Q�在做连接（Join�Q�查询或者合�q�表时不遗漏、也不重复；四是因消除了(ji��n)冗余数据�Q�冗余列�Q�，在查询（Select�Q�时每个数据��存的数据行��多�Q�这样就有效地减��了(ji��n)逻辑I/O�Q�每个Cash存的��面��多�Q�也减少物理I/O�Q�五是对大多��C��?Transaction)而言�Q�运行性能好；六是物理设计(Physical Design)的机动性较大，能满��x(ch��ng)��益增长的用户需求�?

　　在基本表设计中，表的主键、外键、烦(ch��)引设计占有非帔R��要的��C��Q�但�pȝ��设计人员往(xi��n)往(xi��n)只注重于满��用户要求�Q�而没有从�pȝ��优化的高度来认识和重视它们。实际上�Q�它们与�pȝ��的运行性能密切相关。现在从�pȝ��数据库优化角度讨��些基本概念及(qi��ng)光��要意义：(x��)

　　�Q?�Q�主�?Primary Key)�Q�主键被用于复杂的SQL语句�Ӟ��频繁地在数据讉K��中被用到。一个表只有一个主键。主键应该有固定��|��不能为Null或缺省��|��要有相对�E�_��性）(j��)�Q�不含代码信息，易访问。把常用�Q�众所周知�Q�的列作��Z��键才有意义。短主键最佻I��于25bytes�Q�，主键的长短媄(ji��ng)响烦(ch��)引的大小�Q�烦(ch��)引的大小影响索引��늚�大小�Q�从而媄(ji��ng)响磁盘I(y��)/O。主键分��然主键和��Zؓ(f��)主键。自然主键由实体的属性构成，自然主键可以是复合性的�Q�在形成复合主键�Ӟ��主键列不能太多，复合主键使得Join作复杂化、也增加�?ji��n)外键表的大��。�h��Z��键是�Q�在没有合适的自然属性键、或自然属性复杂或灉|��度高�Ӟ��Zؓ(f��)形成的。�h��Z��键一般是整型��|��满��最��化要求�Q�，没有实际意义�Q�也略微增加�?ji��n)表的大��；但减��?ji��n)把它作�ؓ(f��)外键的表的大��?

　　�Q?�Q�外键（F(tu��n)oreign Key�Q�：(x��)外键的作用是建立关系型数据库中表之间的关�p�（参照完整性）(j��)�Q�主键只能从独立的实体迁�U�d��非独立的实体�Q�成为后者的一个属性，被称为外键�?

　　�Q?�Q�烦(ch��)�?Index)�Q�利用烦(ch��)引优化系�l�性能是显而易见的�Q�对所有常用于查询中的Where子句的列和所有用于排序的列创建烦(ch��)引，可以避免整表扫描或访问，在不改变表的物理�l�构的情况下�Q�直接访问特定的数据列，�q�样减少数据存取旉��Q�利用烦(ch��)引可以优化或排除耗时的分�c?作；把数据分散到不同的页面上�Q�就分散�?ji��n)插入的数据�Q�主键自动徏立了(ji��n)唯一索引�Q�因此唯一索引也能��保数据的唯一性（卛_��体完整性）(j��)�Q�烦(ch��)引码��小�Q�定位就��直接；新徏的烦(ch��)引效能最好，因此定期更新索引非常必要。烦(ch��)引也有代��P��(x��)有空间开销�Q�徏立它也要��p��旉��Q�在�q�行Insert、Delete和Update作时�Q�也有维护代仗��烦(ch��)引有两种�Q�聚族烦(ch��)引和非聚族烦(ch��)引。一个表只能有一个聚族烦(ch��)引，可有多个非聚族烦(ch��)引。��用聚族烦(ch��)引查询数据要比��用非聚族索引快。在建烦(ch��)引前�Q�应利用数据库系�l�函��C��烦(ch��)引的大小�?

　　�?聚族索引�Q�Clustered Index�Q�：(x��)聚族索引的数据页按物理有序储存，占用�I�间��。选择�{�略是，被用于Where子句的列�Q�包括范围查询、模�p�查询或高度重复的列�Q�连�l�磁盘扫描）(j��)�Q�被用于�q�接Join作的列；被用于Order by和Group by子句的列。聚族烦(ch��)引不利于插入作，另外没有必要用主键徏聚族索引�?

　　�?非聚族烦(ch��)引（Nonclustered Index�Q�：(x��)与聚族烦(ch��)引相比，占用�I�间大，而且效率低。选择�{�略是，被用于Where子句的列�Q�包括范围查询、模�p�查询（在没有聚族烦(ch��)引时�Q�、主键或外键列、点�Q�指针类�Q�或��范��_(d��)��q�回的结果域��于整表数据�?0%�Q�查询；被用于连接Join作的列、主键列�Q�范围查询）(j��)�Q�被用于Order by和Group by子句的列�Q�需要被覆盖的列。对只读表徏多个非聚族烦(ch��)引有利。烦(ch��)引也有其弊端�Q�一是创建烦(ch��)引要耗费旉��Q�二是烦(ch��)引要占有大量��盘�I�间�Q�三是增加了(ji��n)�l�护代�h(hu��n)�Q�在修改带烦(ch��)引的数据列时索引�?x��)减�~�修攚w��度�Q�。那么，在哪�U�情况下不徏索引呢？对于��表�Q�数据小�?��）(j��)、小��C��表（不直接访问单行数据或�l�果集不用排序）(j��)、单值域�Q�返回值密集）(j��)、烦(ch��)引列值太长（大于20bitys�Q�、容易变化的列、高度重复的列、Null值列�Q�对没有被用于Where子语句和Join查询的列都不能徏索引。另外，对主要用于数据录入的�Q�尽可能��徏索引。当�?d��ng)��也要防止建立无效索引�Q�当Where语句中多�?个条件时�Q�维护烦(ch��)引的开销大于索引的效益，�q�时�Q�徏立��(f��)时表存储有关数据更有效�?

　　扚w��导入数据时的注意事项�Q�在实际应用中，大批量的计算�Q�如�?sh��)信话单计费�Q�用C语言�E�序做，�q�种��Z��d��键关�p�L��据计��而得的批量数据（文本文�g�Q�，可利用系�l�的自��n功能函数�Q�如Sybase的BCP命��o(h��)�Q�快速批量导入，在导入数据库表时�Q�可先删除相应库表的索引�Q�这有利于加快导入速度�Q�减��导入时间。在导入后再重徏索引以便优化查询�?

　　�Q?�Q�锁�Q�锁是�ƈ行处理的重要机制�Q�能保持数据�q�发的一致性，��x(ch��ng)��事务�q�行处理�Q�系�l�利用锁�Q�保证数据完整性。因此，我们避免不了(ji��n)死锁�Q�但在设计时可以充分考虑如何避免长事务，减少排它锁时��_(d��)��减少在事务中与用��L(f��ng)��交互�Q�杜�l�让用户控制事务的长短；要避免批量数据同时执行，��其是耗时�q�用到相同的数据表。锁的征用：(x��)一个表同时只能有一个排它锁�Q�一个用��L(f��ng)��Ӟ��其它用户在等待。若用户数增加，则Server的性能下降�Q�出�?#8220;假死”现象。如何避免死锁呢�Q�从��锁到行��锁，减少�?ji��n)锁征用�Q�给��表增加无效记录�Q�从��锁到行��锁没有媄(ji��ng)响，若在同一��内竞争有媄(ji��ng)响，可选择合适的聚族索引把数据分配到不同的页面；创徏冗余表；保持事务��短；同一批处理应该没有网�l�交互�?

　　�Q?�Q�查询优化规则：(x��)在访问数据库表的数据(Access Data)�Ӟ��要尽可能避免排序�Q�Sort�Q�、连�?Join)和相兛_��查询作。经验告诉我们，在优化查询时�Q�必��d��刎ͼ�(x��)

　　�?��可能少的行�Q?

　　�?避免排序或�ؓ(f��)��可能少的行排序�Q�若要做大量数据排序�Q�最好将相关数据攑֜�临时表中作；用简单的键（列）(j��)排序�Q�如整型或短字符串排序；

　　�?避免表内的相兛_��查询�Q?

　　�?避免在Where子句中��用复杂的表达式或非�v始的子字�W�串、用长字�W�串�q�接�Q?

　　�?在Where子句中多使用“�?#8221;�Q�And�Q�连接，��?#8220;�?#8221;(Or)�q�接�Q?

　　�?利用临时数据库。在查询多表、有多个�q�接、查询复杂、数据要�q��o(h��)�Ӟ��可以��Z��(f��)时表�Q�烦(ch��)引）(j��)以减��I/O。但�~�点是增加了(ji��n)�I�间开销�?

　　除非每个列都有烦(ch��)引支持，否则在有�q�接的查询时分别扑և�两个动态烦(ch��)引，攑֜�工作表中重新排序�?

　　3 基本表扩展设�?

　　��Z��W�三范式设计的库表虽然有其优��性（见本文第一部分�Q�，然而在实际应用中有时不利于�pȝ��q�行性能的优化：(x��)如需要部分数据时而要扫描整表�Q�许多过�E�同时竞争同一数据�Q�反复用相同行计��相同的�l�果�Q�过�E�从多表获取数据时引发大量的�q�接作，当数据来源于多表时的�q�接作；�q�都消耗了(ji��n)��盘I(y��)/O和CPU旉��?

　　��其在遇��C��列情形时�Q�我们要对基本表�q�行扩展设计�Q�许多过�E�要频繁讉K��一个表、子集数据访问、重复计��和冗余数据�Q�有时用戯��求一些过�E�优先或低的响应旉��?/p>
　　如何避免�q�些不利因素呢？�Ҏ(gu��)��讉K��的频�J�程度对相关表进行分割处理、存储冗余数据、存储衍生列、合�q�相兌��处理�Q�这些都是克服这些不利因素和优化�pȝ��q�行的有效途径�?

　　3.1 分割表或储存冗余数据

　　分割表分为水�q�_��割表和垂直分割表两种。分割表增加�?ji��n)维护数据完整性的代�h(hu��n)�?

　　水��^分割表：(x��)一�U�是当多个过�E�频�J�访问数据表的不同行�Ӟ��水��^分割表，�q�消除新表中的冗余数据列�Q�若个别�q�程要访问整个数据，则要用连�?作，�q�也无妨分割表；典型案例是电(sh��)信话单按月分割存放。另一�U�是当主要过�E�要重复讉K��部分行时�Q�最好将被重复访问的�q�些行单独�Ş成子集表�Q�冗余储存）(j��)�Q�这在不考虑��盘�I�间开销时显得十分重要；但在分割表以后，增加�?ji��n)维护难度，要用触发器立��x(ch��ng)��新、或存储�q�程或应用代码批量更斎ͼ��q�也�?x��)增加额外的��盘I(y��)/O开销�?

　　垂直分割表（不破坏第三范式）(j��)�Q�一�U�是当多个过�E�频�J�访问表的不同列�Ӟ��可将表垂直分成几个表�Q�减��磁盘I(y��)/O�Q�每行的数据列少�Q�每��存的数据行��多�Q�相应占用的��就��）(j��)�Q�更新时不必考虑锁，没有冗余数据。缺�Ҏ(gu��)��要在插入或删除数据时要考虑数据的完整性，用存储过�E�维护。另一�U�是当主要过�E�反复访问部分列�Ӟ��最好将�q�部分被频繁讉K��的列数据单独存�(sh��)ؓ(f��)一个子集表�Q�冗余储存）(j��)�Q�这在不考虑��盘�I�间开销时显得十分重要；但这增加�?ji��n)重叠列的维护难度，要用触发器立��x(ch��ng)��新、或存储�q�程或应用代码批量更斎ͼ��q�也�?x��)增加额外的��盘I(y��)/O开销。垂直分割表可以辑ֈ�最大化利用Cache的目的�?

　　��M��Q��ؓ(f��)主要�q�程分割表的�Ҏ(gu��)��适用于：(x��)各个�q�程需要表的不联结的子集，各个�q�程需要表的子集，讉K��频率高的主要�q�程不需要整表。在主要的、频�J�访问的主表需要表的子集而其它主要频�J�访问的�q�程需要整表时则��生冗余子集表�?

　　注意�Q�在分割表以后，要考虑重新建立索引�?

　　3.2 存储衍生数据

　　对一些要做大量重复性计��的�q�程而言�Q�若重复计算�q�程得到的结果相同（源列数据�E�_��Q�因此计��结果也不变�Q�，或计��牵扯多行数据需额外的磁盘I(y��)/O开销�Q�或计算复杂需要大量的CPU旉��Q�就考虑存储计算�l�果�Q�冗余储存）(j��)。现予以分类说明�Q?

　　若在一行内重复计算�Q�就在表内增加列存储�l�果。但若参与计��的列被更新�Ӟ��必须要用触发器更新这个新列�?

　　若对表按�c�进行重复计��，��增加新表（一般而言�Q�存攄��和结果两列就可以�?ji��n)�?j��)存储相关�l�果。但若参与计��的列被更新�Ӟ��必��要用触发器立即更新、或存储�q�程或应用代码批量更新这个新表�?

　　若对多行�q�行重复性计��（如排名次�Q�，��在表内增加列存储结果。但若参与计��的列被更新�Ӟ��必须要用触发器或存储�q�程更新�q�个新列�?

　　��M��Q�存储冗余数据有利于加快讉K��速度�Q�但�q�反�?ji��n)第三范式，�q�会(x��)增加�l�护数据完整性的代�h(hu��n)�Q�必��ȝ��触发器立��x(ch��ng)��新、或存储�q�程或应用代码批量更斎ͼ�以维护数据的完整性�?

　　3.3 消除昂贵�l�合

　　对于频繁同时讉K��多表的一些主要过�E�，考虑在主表内存储冗余数据�Q�即存储冗余列或衍生列（它不依赖于主键）(j��)�Q�但破坏�?ji��n)第三范式，也增加�?ji��n)�l�护隑ֺ�。在源表的相兛_��发生变化�Ӟ��必须要用触发器或存储�q�程更新�q�个冗余列。当主要�q�程��d��时访问两个表时可以合�q�表�Q�这样可以减��磁盘I(y��)/O作，但破坏了(ji��n)�W�三范式�Q�也增加�?ji��n)维护难度。对父子表和1�Q?关系表合�q�方法不同：(x��)合�ƈ父子表后�Q��生冗余表�Q�合�q?�Q?关系表后�Q�在表内产生冗余数据�?

　　4 数据库对象的攄��{�略

　　数据库对象的攄��{�略是均匀地把数据分布在系�l�的��盘?sh��)��，�q��I/O讉K��Q�避免I/O瓉��?

　　�?讉K��分散��C��同的��盘�Q�即使用��h��据尽可能跨越多个讑֤��Q�多个I/O�q��{�Q�避免I/O竞争�Q�克服访问瓶颈；分别攄��随机讉K��和连�l�访问数据�?

　　�?分离�pȝ��数据库I/O和应用数据库I/O。把�pȝ��审计表和临时库表攑֜�不忙的磁盘�(sh��)��?

　　�?把事务日志放在单独的��盘?sh��)��，减少��盘I(y��)/O开销�Q�这�q�有利于在障��后恢复�Q�提高�(sh��)��(ji��n)�pȝ��的安全性�?

　　�?把频�J�访问的“�z�L�?#8221;表放在不同的��盘?sh��)��；把频�J�用的表、频�J�做Join*作的表分别放在单独的��盘?sh��)��，甚至把把频繁讉K��的表的字�D�|��在不同的��盘?sh��)��，把访问分散到不同的磁盘?sh��)��Q�避免I/O争夺�Q?

　　�?利用�D�分��频�J�访问的表及(qi��ng)其烦(ch��)引（非聚族的�Q�、分��L��本和囑փ�数据。段的目的是�q��I/O�Q�避免瓶颈，增加吞吐量，实现�q�行扫描�Q�提高�ƈ发度�Q�最大化��盘的吞吐量。利用逻辑�D�功能，分别攄��“�z�L�?#8221;表及(qi��ng)光��聚族索引以��^衡I/O。当然最好利用系�l�的默认�D�c(di��n)��另外，利用�D�可以��备䆾和恢复数据更加灵�z�，使系�l�授权更加灵�z�R�?/p>

lk 2008-02-15 14:13 发表评论

lk — Fri, 15 Feb 2008 06:11:00 GMT

大型数据库的设计原则与开发技�?/h1>

　　随着计算机技术越来越�q�泛地应用于国民�l�济的各个领域，在计��机��g不断微型化的同时�Q�应用系�l�向着复杂化、大型化的方向发展。数据库是整个系�l�的核心(j��)�Q�它的设计直接关�pȝ��l�执行的效率和系�l�的�E�_��性。因此在软�g�pȝ��开发中�Q�数据库设计应遵循必要的数据库范式理论，以减��冗余、保证数据的完整性与正确性。只有在合适的数据库��品上设计出合理的数据库模型，才能降低整个�pȝ��的编�E�和�l�护隑ֺ��Q�提高系�l�的实际�q�行效率。虽然对于小��目或中�{�规模的��目开发�h员可以很�Ҏ(gu��)��地利用范式理��计出一套符合要求的数据库，但对于一个包含大型数据库的��Y仉��目，��必��L��一套完整的设计原则与技巧�?/p>
　　一、成立数据小�l?/p>
　　大型数据库数据元素多�Q�在设计上有必要成立专门的数据小�l�。由于数据库设计者不一定是使用者，对系�l�设计中的数据元素不可能考虑周全�Q�数据库设计出来后，往(xi��n)往(xi��n)难以扑ֈ�所需的库表，因此数据��组最好由熟�?zh��n)�业务的项目骨�q�组成�?/p>
　　数据��组的职能�ƈ非是设计数据库，而是通过需求分析，在参考其他相似系�l�的基础上，提取�pȝ��的基本数据元素，担负�Ҏ(gu��)��据库的审核。审核内容包括审核新的数据库元素是否完全、能否实现全部业务需�?�Ҏ(gu��)��数据�?如果存在旧系�l?的分析及(qi��ng)数据转换;数据库设计的审核、控制及(qi��ng)必要调整�?/p>
　　二、设计原�?/p>
　　1.规范命名。所有的库名、表名、域名必��遵循统一的命名规则，�q�进行必要说明，以方便设计、维护、查询�?/p>
　　2.控制字段的引用。在设计�Ӟ��可以选择适当的数据库设计��理工具�Q�以方便开发�h员的分布式设计和数据��组的集中审核管理。采用统一的命名规则，如果设计的字�D�已�l�存在，可直接引�?否则�Q�应重新设计�?/p>
　　3.库表重复控制。在设计�q�程中，如果发现大部分字�D�都已存在，开发�h员应怀疑所设计的库表是否已存在。通过对字�D�|��在库表及(qi��ng)相应设计人员的查询，可以��认库表是否��实重复�?/p>
　　4.�q�发控制。设计中应进行�ƈ发控�Ӟ��卛_��于同一个库表，在同一旉��只有一个�h有控制权�Q�其他�h只能�q�行查询�?/p>
　　5.必要的讨论。数据库设计完成后，数据��组应与相关人员�q�行讨论�Q�通过讨论来熟�(zh��n)�数据库�Q�从而对设计中存在的问题�q�行控制或从中获取数据库设计的必要信息�?/p>
　　6.数据��组的审核。库表的定版、修�Ҏ(gu��)��l�都要通过数据��组的审核，以保证符合必要的要求�?/p>
　　7.头文件处理。每�ơ数据修改后�Q�数据小�l�要对相应的头文件进行修�?可由��理软�g自动完成)�Q��ƈ通知相关的开发�h员，以便�q�行相应的程序修攏V�?/p>
　　三、设计技�?/p>
　　1.分类拆分数据量大的表。对于经�怋�用的�?如某些参数表或代码对照表)�Q�由于其使用频率很高�Q�要��量减少表中的记录数量。例如，银行的户主�̎表原来设计成一张表�Q�虽然可以方便程序的设计与维护，但经�q�分析发玎ͼ��׃��数据量太大，�?x��)�?ji��ng)响数据的�q�速定位。如果将户主账表分别设计为活期户主�̎、定期户主�̎�?qi��ng)对公户主�̎�{�，则可以大大提高查询效率�?/p>
　　2.索引设计。对于大的数据库表，合理的烦(ch��)引能够提高整个数据库的操作效率。在索引设计中，索引字段应挑(xi��)选重复��D��?y��u)��的字�?在对建有复合索引的字�D�进行检索时�Q�应注意按照复合索引字段建立的顺序进行。例如，如果对一�?万多条记录的��水表以日期和流水号为序建立复合索引�Q�由于在该表中日期的重复值接�q�整个表的记录数�Q�用��水可��行查询所用的旉��接近3�U?而如果以��水号�ؓ(f��)索引字段建立索引�q�行相同的查询，所用时间不�?�U�。因此在大型数据库设计中�Q�只有进行合理的索引字段选择�Q�才能有效提高整个数据库的操作效率�?/p>
　　3.数据操作的优化。在大型数据库中�Q�如何提高数据操作效率值得��x(ch��ng)��。例如，每在数据库流水表中增加一�W�业务，��必��M��水控制表中取出��水��P��q�将其流水号的数值加一。正常情况下�Q�单�W�操作的反应速度��属正常�Q�但当用它进行批量业务处理时�Q�速度�?x��)明昑և�慢。经�q�分析发玎ͼ�每次�Ҏ(gu��)��水控制表中的��水��h��值加一旉��要锁定该表，而该表却是整个系�l�操作的核心(j��)�Q�有可能在操作时被其他进�E�锁定，因而��整个事务操作速度变慢。对�q�一问题的解决的办法是，�Ҏ(gu��)��扚w��业务的�ȝ��数批量申��h��水号�Q��ƈ�Ҏ(gu��)��水控制表�q�行一�ơ更斎ͼ�卛_��提高扚w��业务处理的速度。另一个例子是�Ҏ(gu��)��表的优化。对于大扚w��的业务处理，如果在插入数据库表时用普通的Insert语句�Q�速度�?x��)很慢。其原因在于�Q�每�ơ插表都要进行一�ơI/O操作�Q�花费较长的旉��。改�q�后�Q�可以用Put语句�{�缓冲区形式�{�满��后再进行I/O操作�Q�从而提高效率。对大的数据库表�q�行删除�Ӟ��一般会(x��)直接用Delete语句�Q�这个语句虽然可以进行小表操作，但对大表却会(x��)因带来大事务而导致删除速度很慢甚至��p�|。解决的�Ҏ(gu��)��是去掉事务，但更有效的办法是先进行Drop操作再进行重建�?/p>
　　4.数据库参数的调整。数据库参数的调整是一个经验不断积累的�q�程�Q�应由有�l�验的系�l�管理员完成。以Informix数据库�ؓ(f��)例，记录锁的数目太少�?x��)造成锁表的失�?逻辑日志的文件数目太��会(x��)造成插入大表��p�|�{�，�q�些问题都应�Ҏ(gu��)��实际情况�q�行必要的调整�?/p>
　　5.必要的工兗��在整个数据库的开发与设计�q�程中，可以先开发一些小的应用工��P��如自动生成库表的头文件、插入数据的初始化、数据插入的函数��装、错误跟�t�或自动昄��{�，以此提高数据库的设计与开发效率�?/p>
　　6.避免长事务。对单个大表的删除或插入操作�?x��)带来大事务�Q�解决的办法是对参数�q�行调整�Q�也可以在插入时�Ҏ(gu��)��件进行分剌Ӏ�对于一个由一�p�d��事务顺序操作共同构成的长事�?如银行交易系�l�的日终交易)�Q�可以由一�p�d��操作完成整个事务�Q�但其缺�Ҏ(gu��)��有可能因整个事务太大而��不能完成�Q�或者，�׃��偶然的意外而��事务重做所需的时间太�ѝ��较好的解决�Ҏ(gu��)��是，把整个事务分解成几个较小的事务，再由应用�E�序控制整个�pȝ��的流�E�。这��P��如果其中某个事务不成功，则只需重做该事务，因而既可节�U�时��_(d��)��又可避免长事务�?/p>
　　7.适当��前。计��机技术发展日新月异，数据库的设计必须��h��一定前��L��，不但要满��_��前的应用要求�Q�还要考虑未来的业务发展，同时必须有利于扩展或增加应用�pȝ��的处理功能�?/p>
　　相对于中��型数据库，大型数据库的设计与开发要复杂得多�Q�因此在设计、开发过�E�中�Q�除�?ji��n)要遵��@数据库范式理论、增加系�l�的一致性和完整性外�Q�还要在��M��上根据具体情况进行分布式设计�Q�紧紧把握集中控制、统一审核的基本原则，保证数据库设计结构紧凑、分布��^衡、定位迅速。在数据库操作上�Q�要采用一定的技巧提高整个应用系�l�的执行效率�Q��ƈ注意适当��前�Q�以适应不断变化的应用及(qi��ng)�pȝ��发展的要求�?/p>

lk 2008-02-15 14:11 发表评论

lk — Fri, 15 Feb 2008 06:09:00 GMT

数据库设计中�?4个技�?/h1>

　　1. 原始单据与实体之间的关系

　　可以是一对一、一对多、多对多的关�p�R��在一般情况下�Q�它们是一对一的关�p�：(x��)即一张原始单据对

　　应且只对应一个实体。在�Ҏ(gu��)��情况下，它们可能是一对多或多对一的关�p�，即一张原始单证对应多个实

　　体，或多张原始单证对应一个实体。这里的实体可以理解为基本表。明��这�U�对应关�p�d��Q�对我们设计

　　录入界面大有好处�?/p>
　　〖例1〗：(x��)一份员工��历资料，在�h力资源信息系�l�中�Q�就对应三个基本表：(x��)员工基本情况表、社�?/p>
　　关系表、工作简历表。这��是“一张原始单证对应多个实�?#8221;的典型例子�?/p>
　　2. 主键与外�?/p>
　　一般而言�Q�一个实体不能既无主键又无外键。在E—R 图中, 处于叶子部位的实�? 可以定义主键�Q?/p>
　　也可以不定义主键(因�ؓ(f��)它无子孙), 但必��要有外�?因�ؓ(f��)它有父亲)�?/p>
　　主键与外键的设计�Q�在全局数据库的设计中，占有重要��C��。当全局数据库的设计完成以后�Q�有�?/p>
　　��国数据库设计专家说�Q?#8220;键，到处都是键，除了(ji��n)键之外，什么也没有”�Q�这��是他的数据库设计经�?/p>
　　之谈�Q�也反映�?ji��n)他对信息系�l�核�?数据模型)的高度抽象思想。因为：(x��)主键是实体的高度抽象�Q�主键与

　　外键的配对，表示实体之间的连接�?/p>
　　3. 基本表的性质

　　基本表与中间表、��(f��)时表不同�Q�因为它��h��如下四个�Ҏ(gu��)��：(x��)

　　(1) 原子性。基本表中的字段是不可再分解的�?/p>
　　(2) 原始性。基本表中的记录是原始数据（基础数据�Q�的记录�?/p>
　　(3) 演绎性。由基本表与代码表中的数据，可以�z��出所有的输出数据�?/p>
　　(4) �E�_��性。基本表的结构是相对�E�_��的，表中的记录是要长期保存的�?/p>
　　理解基本表的性质后，在设计数据库�Ӟ��p��基本表与中间表、��(f��)时表区分开来�?/p>
　　4. 范式标准

　　基本表及(qi��ng)其字�D�之间的关系, 应尽量满��第三范式。但是，满��W�三范式的数据库设计�Q�往(xi��n)往(xi��n)不是

　　最好的设计。�ؓ(f��)�?ji��n)提高数据库的运行效率，常常需要降低范式标准：(x��)适当增加冗余�Q�达��C��I�间换时�?/p>
　　的目的�?/p>
　　〖例2〗：(x��)有一张存攑֕�品的基本表，如表1所�C��?#8220;金额”�q�个字段的存在，表明该表的设计不�?/p>
　　��第三范式，因�ؓ(f��)“金额”可以�?#8220;单�h(hu��n)”乘�(sh��)��“数量”得到�Q�说�?#8220;金额”是冗余字�D�c(di��n)��但是，增加

　　“金额”�q�个冗余字段�Q�可以提高查询统计的速度�Q�这��是以空间换旉��的作法�?/p>
　　在Rose 2002中，规定列有两种�c�d��Q�数据列和计��列�?#8220;金额”�q�样的列被称�?#8220;计算�?#8221;�Q��?#8220;

　　单�h(hu��n)”�?#8220;数量”�q�样的列被称�?#8220;数据�?#8221;�?/p>
　　�? 商品表的表结�?/p>
　　商品名称商品型号单�h(hu��n) 数量金额

　　�?sh��)视�?29�?2,500 40 100,000

　　

　　5. 通俗地理解三个范�?/p>
　　通俗地理解三个范式，对于数据库设计大有好处。在数据库设计中�Q��ؓ(f��)�?ji��n)更好地应用三个范式�Q�就

　　必须通俗地理解三个范�?通俗地理解是够用的理解，�q�不是最�U�学最准确的理�?�Q?/p>
　　�W�一范式�Q?NF是对属性的原子性约束，要求属性具有原子性，不可再分解；

　　�W�二范式�Q?NF是对记录的惟一性约束，要求记录有惟一标识�Q�即实体的惟一性；

　　�W�三范式�Q?NF是对字段冗余性的�U�束�Q�即��M��字段不能由其他字�D�|��生出来，它要求字�D�|��有冗�?/p>
　　�?/p>
　　没有冗余的数据库设计可以做到。但是，没有冗余的数据库未必是最好的数据库，有时��Z��(ji��n)提高�q?/p>
　　行效率，��必��降低范式标准，适当保留冗余数据。具体做法是�Q�在概念数据模型设计旉��守第三范�?/p>
　　�Q�降低范式标准的工作攑ֈ�物理数据模型设计时考虑。降低范式就是增加字�D�，允许冗余�?/p>
　　6. 要善于识别与正确处理多对多的关系

　　若两个实体之间存在多对多的关�p�，则应消除�q�种关系。消除的办法是，在两者之间增加第三个�?/p>
　　体。这��P��原来一个多对多的关�p�，现在变�(sh��)ؓ(f��)两个一对多的关�p�R��要��原来两个实体的属性合理地分配

　　��C��个实体中厅R��这里的�W�三个实体，实质上是一个较复杂的关�p�，它对应一张基本表。一般来�Ԍ��?/p>
　　据库设计工具不能识别多对多的关系�Q�但能处理多对多的关�p�R�?/p>
　　〖例3〗：(x��)�?#8220;图书馆信息系�l?#8221;中，“图书”是一个实体，“读�?#8221;也是一个实体。这两个实体�?/p>
　　间的关系�Q�是一个典型的多对多关�p�：(x��)一本图书在不同旉��可以被多个读者借阅�Q�一个读者又可以借多

　　本图书。�ؓ(f��)此，要在二者之间增加第三个实体�Q�该实体取名�?#8220;借还?sh��)?#8221;�Q�它的属性�ؓ(f��)�Q�借还旉��、�?/p>
　　�q�标�?0表示借书�Q?表示�q��(sh��)��)�Q�另外，它还应该有两个外�?“图书”的主键，“读�?#8221;的主�?�Q��

　　它能�?#8220;图书”�?#8220;读�?#8221;�q�接�?/p>
　　7. 主键PK的取值方�?/p>
　　PK是供�E�序员�(sh��)��用的表间�q�接工具�Q�可以是一无物理意义的数字�? ��q��序自动加1来实现。也�?/p>
　　以是有物理意义的字段名或字段名的�l�合。不�q�前者比后者好。当P(y��ng)K是字�D�名的组合时�Q�徏议字�D늚��?/p>
　　��C��要太多，多了(ji��n)不但索引占用�I�间大，而且速度也慢�?/p>
　　8. 正确认识数据冗余

　　主键与外键在多表中的重复出现, 不属于数据冗余，�q�个概念必须清楚�Q�事实上有许多�h�q��(sh��)��清楚

　　。非键字�D늚�重复出现, 才是数据冗余�Q�而且是一�U�低�U�冗余，即重复性的冗余。高�U�冗余不是字�D늚�

　　重复出现�Q�而是字段的派生出现�?/p>
　　〖例4〗：(x��)商品中的“单�h(hu��n)、数量、金�?#8221;三个字段�Q?#8220;金额”��是�?#8220;单�h(hu��n)”乘�(sh��)��“数量”�z��?/p>
　　来的�Q�它?y��u)��是冗余�Q�而且是一�U�高�U�冗余。冗余的目的是�ؓ(f��)�?ji��n)提高处理速度。只有低�U�冗余才�?x��)增加�?/p>
　　据的不一致性，因�ؓ(f��)同一数据�Q�可能从不同旉��、地炏V��角色上多次录入。因此，我们提倡高�U�冗�?�z?/p>
　　生性冗�?�Q�反对低�U�冗�?重复性冗�?�?/p>
　　9. E--R图没有标准答�?/p>
　　信息�pȝ��的E--R图没有标准答案，因�ؓ(f��)它的设计与画法不是惟一的，只要它覆盖了(ji��n)�pȝ��需求的业务

　　范围和功能内容，��是可行的。反之要修改E--R图。尽��它没有惟一的标准答案，�q�不意味着可以随意

　　设计。好的E—R囄��标准是：(x��)�l�构清晰、关联简�z�、实体个数适中、属性分配合理、没有低�U�冗余�?/p>
　　10. 视图技术在数据库设计中很有�?/p>
　　与基本表、代码表、中间表不同�Q�视图是一�U�虚表，它依赖数据源的实表而存在。视图是供程序员

　　使用数据库的一个窗口，是基表数据综合的一�U��Ş�? 是数据处理的一�U�方法，是用��h��据保密的一�U?/p>
　　手段。�ؓ(f��)�?ji��n)进行复杂处理、提高运��速度和节省存储空�? 视图的定义深度一般不得超�q�三层�?若三�?/p>
　　视图仍不够用, 则应在视图上定义临时�? 在��(f��)时表上再定义视图。这样反复交�q�定�? 视图的深度就

　　不受限制�?ji��n)�?/p>
　　对于某些与国家政沅R��经��、技术、军事和安全利益有关的信息系�l�，视图的作用更加重要。这�?/p>
　　�pȝ��的基本表完成物理设计之后�Q�立卛_��基本表上建立�W�一层视图，�q�层视图的个数和�l�构�Q�与基本�?/p>
　　的个数和�l�构是完全相同。�ƈ且规定，所有的�E�序员，一律只准在视图上操作。只有数据库��理员，�?/p>
　　着多个人员共同掌握�?#8220;安全钥匙”�Q�才能直接在基本表上操作。请读者想惻I��(x��)�q�是��Z��么？

　　11. 中间表、报表和临时�?/p>
　　中间表是存放�l�计数据的表�Q�它是�ؓ(f��)数据仓库、输出报表或查询�l�果而设计的�Q�有时它没有主键�?/p>
　　外键(数据仓库除外)。��(f��)时表是程序员?sh��)��h设计的，存放临时记录�Q��ؓ(f��)个�h所用。基表和中间表由DBA�l?/p>
　　护，临时表由�E�序员自��q��E�序自动�l�护�?/p>
　　12. 完整性约束表现在三个斚w��

　　域的完整性：(x��)用Check来实现约束，在数据库设计工具中，对字�D늚�取��D��围进行定义时�Q�有一个Ch

　　eck按钮�Q�通过它定义字�D늚�值城�?/p>
　　参照完整性：(x��)用PK、FK、表�U�触发器来实现�?/p>
　　用户定义完整性：(x��)它是一些业务规则，用存储过�E�和触发器来实现�?/p>
　　13. 防止数据库设计打补丁的方法是“三少原则”

　　(1) 一个数据库中表的个数越��越好。只有表的个数少�?ji��n)，才能说明�pȝ��的E--R囑ְ�而精�Q�去掉了(ji��n)

　　重复的多余的实体�Q��Ş成了(ji��n)对客观世界的高度抽象�Q�进行了(ji��n)�pȝ��的数据集成，防止�?ji��n)打补丁式的设计�Q?/p>
　　(2) 一个表中组合主键的字段个数��少��好。因��Z��键的作用�Q�一是徏主键索引�Q�二是做为子表的

　　外键�Q�所以组合主键的字段个数��了(ji��n)�Q�不仅节省了(ji��n)�q�行旉��Q�而且节省�?ji��n)�?ch��)引存储空��_(d��)��

　　(3) 一个表中的字段个数��少��好。只有字�D늚�个数��了(ji��n)�Q�才能说明在�pȝ��中不存在数据重复�Q�且

　　很少有数据冗余，更重要的是督�?j��)读者学�?#8220;列变�?#8221;�Q�这样就防止�?ji��n)将子表中的字段拉入��C��表中�?/p>
　　�Q�在主表中留下许多空余的字段。所�?#8220;列变�?#8221;�Q�就是将主表中的一部分内容拉出去，另外单独��Z��

　　个子表。这个方法很��单，有的人就是不�?f��n)惯、不采纳、不执行�?/p>
　　数据库设计的实用原则是：(x��)在数据冗余和处理速度之间扑ֈ�合适的�q��炏V�?#8220;三少”是一个整体概

　　念，�l�合观点�Q�不能孤立某一个原则。该原则是相对的�Q�不是绝对的�?#8220;三多”原则肯定是错误的。试

　　惻I��(x��)若覆盖系�l�同��L(f��ng)��功能�Q�一百个实体(�׃��千个属�? 的E--R图，肯定比二百个实体(�׃��千个属�?

　　的E--R图，要好得多�?/p>
　　提�?#8220;三少”原则�Q�是叫读者学�?x��)利用数据库设计技术进行系�l�的数据集成。数据集成的步骤是将

　　文�g�pȝ��集成为应用数据库�Q�将应用数据库集成�ؓ(f��)主题数据库，��主题数据库集成为全局�l�合数据库�?/p>
　　集成的程度越高，数据�׃�n性就��强�Q�信息孤岛现象就��少�Q�整个企业信息系�l�的全局E—R图中实体�?/p>
　　个数、主键的个数、属性的个数��׃��(x��)��少�?/p>
　　提�?#8220;三少”原则的目的，是防止读者利用打补丁技术，不断地对数据库进行增删改�Q��企业数据

　　库变成了(ji��n)随意设计数据库表�?#8220;垃圾�?#8221;�Q�或数据库表�?#8220;大杂�?#8221;�Q�最后造成数据库中的基本表、代

　　码表、中间表、��(f��)时表杂�ؕ无章�Q�不计其敎ͼ��D��企事业单位的信息�pȝ��无法�l�护而瘫痪�?/p>
　　“三多”原则��M��人都可以做到�Q�该原则�?#8220;打补丁方�?#8221;设计数据库的歪理学说�?#8220;三少”原则

　　是少而精的原则，它要求有较高的数据库设计技巧与艺术�Q�不是�Q何�h都能做到的，因�ؓ(f��)该原则是杜绝

　　�?#8220;打补丁方�?#8221;设计数据库的理论依据�?/p>
　　14. 提高数据库运行效率的办法

　　在给定的�pȝ��g和系�l��Y件条件下�Q�提高数据库�pȝ��的运行效率的办法是：(x��)

　　(1) 在数据库物理设计�Ӟ��降低范式�Q�增加冗�? ��用触发�? 多用存储�q�程�?/p>
　　(2) 当计��非常复杂、而且记录条数非常巨大�?例如一千万�?�Q�复杂计��要先在数据库外面，�?/p>
　　文�g�pȝ��方式用C++语言计算处理完成之后�Q�最后才入库�q�加到表中去。这是电(sh��)信计费系�l�设计的�l�验�?/p>
　　(3) 发现某个表的记录太多�Q�例如超�q�一千万条，则要对该表进行水�q�_��剌Ӏ�水�q�_��割的做法是，

　　以该表主键PK的某个��gؓ(f��)界线�Q�将该表的记录水�q�_��割�ؓ(f��)两个表。若发现某个表的字段太多�Q�例如超�q?/p>
　　八十个，则垂直分割该表，��原来的一个表分解��Z��个表�?/p>
　　(4) �Ҏ(gu��)��据库��理�pȝ��DBMS�q�行�pȝ��优化�Q�即优化各种�pȝ��参数�Q�如�~�冲��Z��数�?/p>
　　(5) 在��用面向数据的SQL语言�q�行�E�序设计�Ӟ��量采取优化��法�?/p>
　　��M��Q�要提高数据库的�q�行效率�Q�必��M��数据库系�l��优化、数据库设计�U�优化、程序实现��优化

　　�Q�这三个层次上同时下功夫�?/p>
　　上述十四个技巧，是许多�h在大量的数据库分析与设计实践中，逐步�ȝ��出来的。对于这些经验的

　　�q�用�Q�读者不能生帮硬套，死记��背�Q�而要消化理解�Q�实事求是，灉|��掌握。�ƈ逐步做到�Q�在应用中发

　　展，在发展中应用�?/p>

lk 2008-02-15 14:09 发表评论

lk — Fri, 15 Feb 2008 06:08:00 GMT

数据库性能基准�?个问�?/h1>

　　��?/strong>

　　数据库已�l�是�l�大多数IT应用的核�?j��)，各种数据库看上去很大不同�Q�多层体�pȝ��构以�?qi��ng)SOA的发展，使得应用逻辑的实现前�U�R��数据库的性能�Q�与其功能相比较�Q�变得越来越重要�?ji��n)。因此，性能是衡量数据库的非帔R��要的斚w��Q�我们这里将讨论数据库性能基准的五个常见问题�?/p>
　　1.Windows和Linux�Q�哪个操作系�l�的性能基准�l�果更好�Q?/strong>

　　�q�是一个有争议的很隑֛��{�的问题。虽然大部分可能认�ؓ(f��)Linux可能更快一些，但是Windows server�q�_��在过�ȝ��几年中已�l�快速成熟了(ji��n)。下面是图表1,它是在相同的��g环境下执行得到的在线TPC-C基准�l�果的图表，使用�?2位和64位的Windows 2003 Server Release 2 �?CentOS 4 Update 3 (一个免费Redhat的企业版�?�?/p>
　　你可以看刎ͼ�技术上看来是不分胜负的。因�?你可以按自己意愿选择�Q�或者考虑到培训成本，可以选择拥有较多�pȝ��理员的那个操作�pȝ��?/p>
　

　　�?

　　2. 32位还�?4位，哪种更好?�q�会(x��)影响操作�pȝ��的选择�?

　　64位Unix 服务器已�l�有很多�q�了(ji��n),�?4位的Windows操作�pȝ��才刚刚变成现实�?Windows NT可运行在DEC Alpha�?但一直没有真正进入主��?很长一�D�|��_(d��)��AMD的Athlon-64和Opteron处理器一直很�?gu��)��。直�?006�q�中Intel的二代双核CPU的出玎ͼ�它的表现相当让�h惊讶�Q�现在我们可以用更好的�h(hu��n)��D��买这些硬件。我们将能耗和戉K��制冷都计��到TCO中�?/p>
　　�?2位相比，64位真的有明显差异�?�Ҏ(gu��)��图表1,回答是否定的。但那是因�ؓ(f��)64位提供的主要优势在于增加�?ji��n)可��d��内存。图�?��再�ơ显�C�TPC-C基准执行的结果，但系�l�和数据库可以分配的内存的��L��量增加了(ji��n)。　

　　

　　�?

　　我们有了(ji��n)�q�些很清楚的�l�果。这些数据显�C?如果你的服务器有2GB或少一些的内存,�?2位和64位的处理下没有明昄��差别。但当你的服务器的内存增加到��过2GB以后,64位的优势��׃��(x��)昄��出来.��管诸如Oracle数据库有32位联接选项来欺骗数据库�Q��之可以访问稍多的内存(知名的巨大内存模�?�Q�这仅仅只能有一�Ҏ(gu��)��果。特大内存对�pȝ��和数据库来说�Q�可以不断实现性能的改�q��?/p>
　　一般情况下�Q�服务器的内存大�?GB�Ӟ��使用64位。不�q�值得注意的是�Q�有时某些类型的��g�Q�例如驱动器�Q�iSCS�Q�和更新的数据库选项(例如�Q�ASM,OCFS)�?2位的Linux上工作得更好�?/p>
　　3.哪个数据库拥有最好的性能基准�Q�Oracle 10g�Q�SQL Server 2005 �q�是MySQL 5.0?

　　�q�也是一个有争议的问题。说到它�Q�仅仅是把经常提到最多的三个数据库拿来讨论。（�q�里�q�不是有意忽略DB2�Q�UDB�Q�PostgreSQL或所有的其他数据库）(j��)。我们知道数据库厂商一般是不欢�q�公布性能基准数据的，特别是在它们之间的比较情��c(di��n)��尽��如此，我们来讨��个常见的问题。图�?昄��?ji��n)在MySQL,SQL Server和Oracle数据库上执行的TPC�Q�C基准的结果�?

　

　　�?

　　��y的是我们不必冒�Q何厂商愤怒的风险�Q�因为性能�l�果昄��Q�它们的技术不分胜负。同��P��你可以按照你的意愉K��择数据库，或者是哪个数据库管理员多就选择哪一个�?/p>
　　当然�Q�在�q�些厂商之间的花�Ҏ(gu��)��不同的，但是因�ؓ(f��)没有��Z��(x��)按照报�h(hu��n)购买产品�Q�所以按照这个因素进行比较TPC-C是很困难的�?/p>
　　4.如何��定一个服务器所能支持的最大�ƈ发OLTP用户�?

　　�q�始�l�是一个很隑֛��{�得问题�Q�因��Z�h们经常想听到�Q?#8220;Dell 1850能处理多��的�q�发用户量�?#8221;事实上，即��是同一�p�d��的服务器�Q�有相同的内存容量，但是也会(x��)�׃��CPU的数量、CPU的时钟频率、CPU的内核数、高速缓冲存储器的大��等因素��D��能力的差异。比较服务器是很困难的，除非你有看�v来几乎一样配�|�的机器。但是你也需要比较相同的�|�络和磁盘I(y��)O�{�情��c(di��n)��假设你那样做，问题变成你如何分析这��L(f��ng)��基准�l�果�Q��ƈ准确��定那台服务器的最大�ƈ发用戯��载。图�?昄��?ji��n)TPC-C基准的结果，只在一台服务器上确定拐点（即用戯��载开始对响应旉��有负面媄(ji��ng)响）(j��)�?/p>
　　

　　�?

　　如果你的最�l�用戯��求响应时��_(d��)��最常见的指标）(j��)��于2�U�，那么�?00个�ƈ发用戯��个点你应该停下来。图4昄��q�个服务器可支持多达250个用户�ƈ发直到响应时间达到无法接受的急骤上升的点. 在这�U�情况下�Q�TPS比率开始趋于��^�~�或减少�Q�这个例子中��y�Q�这两个点同时出现。但是�ƈ不��L��如此明显;�q�是因�ؓ(f��)有时两个拐点�q�不一定排列的�q�么整齐。当拿不准时�Q�徏议通常��x(ch��ng)��TPC-C或OLTP�c�d��事务的响应时间�?/p>
　　5.如何��定一个服务器所能支持的最大数据仓库大��?

　　�q�又是一个很隑֛��{�的问题�Q�因为大多数人想听到是，“处理X千兆字节的数据需要一台Dell 1850�?#8221;上文中提刎ͼ�比较服务器是不容易的事情�Q�除非你拥有的主机几乎有一��L(f��ng)��配置�Q�以�?qi��ng)一��L(f��ng)��|�络和磁盘I(y��)/O环境。磁盘I(y��)/O在这里是特别重要的，因�ؓ(f��)TPC-H�l�果大部分是��q��盘数量来军_��的。如果能比较服务器，那么问题��变?sh��)��如何从基准�l�果中确定那台指定服务器的最大数据仓库的大小。在图表5中，昄��?ji��n)基于几个强大的Oracle RAC服务器配�|�的TPC-H基准的测试结果。这些服务器讉K��分布在多个SAN和超�q?00个磁盘�(sh��)��?00GB数据�?/p>
　　

　　�?

　　在TPC-H中，值得注意的是�Q�应该同时关注整体运行时和间�q�_��响应旉��。TPC-H的询问是非常复杂的，通常要花��C��时�Q�或好几天才能完成�?/p>
　　�Ҏ(gu��)��图表6�Q�最好的��g配置大运�?��时�Q��^均响应时间约4��时。然而，通过几次�q�行旉��很长的测试，实际的响应时间的变化是很倾斜的。因此，如果你的用户对于高度复杂的决�{�支持查询能接受�q�行旉��?个小时的�Q?个节点的集群��可以满��求。如果不能接受的话，那么需要购买更多磁盘，而不是增加更多的服务器。对于千兆容量的数据仓库�Q��?00�?000个磁盘可以达到最佳的效果�Q�这�U�情况�ƈ不少见�?/p>
　　

　　�?

lk 2008-02-15 14:08 发表评论

lk — Fri, 15 Feb 2008 06:02:00 GMT

SQL数据库��用JOIN的优化方�?/h1>

　　很早以前�Q�也是一提到SQL Server�Q�就觉得它的性能没法跟Oracle相比�Q�一提到大数据处理就惛_��Oracle。自�׃��路走来，在本地blog上记录了(ji��n)很多优化斚w��?post�Q�对的错的都有，没有旉��p�d��的整理出来，�q�篇文章��join�Ҏ(gu��)��的概�늨�微整理在一��P��l�大家个参考。通过查资料了(ji��n)解里面提到的各种概念�Q�在�?际中不断验证�ȝ��Q�完全可以对数据库一步步深入理解下去的�?/p>
　　我只对SQL Server 2000比较�?ji��n)解�Q�但�q��ƈ不阻��我在Oracle、MySql�q�行SQL调优、��品架构，因�ؓ(f��)在数据库理论原理上，各大数据库基本出入不大，�Ҏ(gu��)��据库的深入理解，也不�?x��)�?ji��ng)响你架构设计思想变坏�Q�相反给你带来的是更深层�ơ的思考�?

　　关于执行计划的说�?/p>
　　在SQL Server查询分析器的Query菜单中选择Show Execution Plan�Q�运行SQL查询语句�Q�在�l�果�H�口中有Grid、Execution Plan、Messages三个Tab。看囑�Ş形式的执行计划，��序是从叛_��左，�q�也是执行的��序。执行计划中的每一个图标表�C�Z��个操作，每一个操作都�?有一个或多个输入�Q�也�?x��)有一个或多个输出。输入和输出�Q�有可能是一个物理数据表、烦(ch��)引数据结构，或者是执行�q�程中的一些中间结果集/数据�l�构。鼠标移动到图标上，�?x��)显�C��个操作的具体信息�Q�例如逻辑和物理操作名�U�、记录的数量和大��、I/O成本、CPU成本、操作的具体表达式（参数Argument�Q�。鼠标移动到�q�接��头上，�?x��)显�C�箭头�v始端的操作输出结果集的记录数、记录的大小�Q�一般情况下可以��这个输出结果集理解为箭头结束端的输入�?

　　�?外关于执行计划的一些补充说明：(x��)1. 执行计划中显�C�的信息�Q�都是一�?#8220;评估”的结果，不是100%准确的信息，例如记录数量是取自统计信息，I/O成本、CPU成本来自执行计划生成�q�程中基于统计信息等得出的评估结果�?. 执行计划不一定准��，一斚w��受SQL Server�l�护的统计信息准��性的影响�Q�另一斚w��SQL语句�~�译时刻与执行时�ȝ��环境�Q�内存�(sh��)��用状��c(di��n)��CPU状况�{�）(j��)可能�?x��)不一栗��?

　　关于�l�计信息、I/O成本和CPU成本的评估、SQL语句的编译和执行�q�程�Q�这里不再深入。另外尽��执行计划不一定准��，但它仍是SQL语句分析最重要的依据，因�ؓ(f��)你可以理解�ؓ(f��)�Q�绝大部分情况下�Q�SQL Server是以�q�种方式来执行的�?/p>
　　JOIN�Ҏ(gu��)��说明

　　数据库中�Q�象tableA inner join tableB、tableA left out join tableB�q�样的SQL语句是如何执行join操作的？��是说SQL Server使用什么算法实��C��个表数据的join操作�Q?/p>
　　SQL Server 2000有三�U�方式：(x��)nested loop、merge、hash。Oracle也是使用�q�三�U�方式，不过Oracle选择使用nested loop的条件跟SQL Server有点差别�Q�内存管理机制跟SQL Server不一��P��因此查看执行计划�Q�Oracle中nested loop�q�用非常多，而merge和hash方式相对较少�Q�SQL Server中，merge跟hash方式则是非常普遍�?/p>
　　以SQL Server 2000��Z��对这三种方式�q�行说明�Q�穿插在里面讲解执行计划的一些初�U��用�?/p>
　　1. nested loop join

　　1.1 �C�Z��SQL

　　select ... from tableA inner join tableB on tableA.col1=tableB.col1 where tableA.col2=? and tableB.col2=?tableA中没有徏立�Q何烦(ch��)引，tableB中在col1上有建立一个主键（聚集索引�Q��?

　　1.2 ��法伪代码描�q?

　　foreach rowA in tableA where tableA.col2=?{search rowsB from tableB where tableB.col1=rowA.col1 and tableB.col2=? ;if(rowsB.Count�Q?0)discard rowA ;elseoutput rowA and rowsB ;}

　　join操作有两个输入，上面例子中tableA是outer input�Q�用于外层��@环；tableB是inner input�Q�用于��@环内部。下面针�Ҏ(gu��)��行计划描�q�C��下SQL Server完成�q�个操作的具体步骤�?%. ^ g.L

　　2vt [ AhVA

　　1.3 查看执行计划�Ҏ(gu��)��

　　�U�d��文章最前面�?

　　1.4 执行步骤

　　�?面是�C�Z��SQL的执行计划图�?nested loop操作的右边，位于上面的是outer input�Q�位于下面的是inner input。你不能够根据join中哪个表出现在前面来��定outer input和inner input关系�Q�而必��M��执行计划中来��定�Q�因为SQL Server�?x��)自动选择哪个作�ؓ(f��)inner input�?/p>

lk 2008-02-15 14:02 发表评论

lk — Fri, 15 Feb 2008 06:01:00 GMT

MySQL语句优化的原�?/h1>

　　1、��用烦(ch��)引来更快地遍历表�?

　　�~�省情况下徏立的索引是非��集索引�Q�但有时它�ƈ不是最佳的。在非群集烦(ch��)引下�Q�数据在物理上随机存攑֜�数据��上。合理的索引设计要徏立在对各�U�查询的分析和预��上。一般来��_(d��)��(x��)

　　a.有大量重复倹{��且�l�常有范围查询（ > ,<�Q?gt; =,<=�Q�和order by、group by发生的列�Q�可考虑建立��集索引�Q?

　　b.�l�常同时存取多列�Q�且每列都含有重复值可考虑建立�l�合索引�Q?

　　c.�l�合索引要尽量��关键查询形成索引覆盖�Q�其前导列一定是使用最频繁的列。烦(ch��)引虽有助于提高性能但不是烦(ch��)引越多越好，恰好相反�q�多的烦(ch��)引会(x��)��D��pȝ��低效。用户在表中每加�q�一个烦(ch��)引，�l�护索引集合��p��做相应的更新工作�?

　　2、在��量查询时尽量少用格式�{换�?

　　3、ORDER BY和GROPU BY使用ORDER BY和GROUP BY短语�Q��Q何一�U�烦(ch��)引都有助于SELECT的性能提高�?

　　4、�Q何对列的操作都将��D��表扫描，它包括数据库函数、计��表辑ּ��{�等�Q�查询时要尽可能��操作移至等号右辏V�?

　　5、IN、OR子句�怼�(x��)使用工作表，使烦(ch��)引失效。如果不产生大量重复��|��可以考虑把子句拆开。拆开的子句中应该包含索引�?

　　6、只要能满��你的需求，应尽可能使用更小的数据类型：(x��)例如使用MEDIUMINT代替INT

　　7、尽量把所有的列设�|��ؓ(f��)NOT NULL�Q�如果你要保存NULL�Q�手动去讄��它，而不是把它设为默认倹{�?

　　8、尽量少用VARCHAR、TEXT、BLOB�c�d��

　　9、如果你的数据只有你所知的��量的几个。最好��用ENUM�c�d��

　　10、正如graymice所讲的那样�Q�徏立烦(ch��)引�?

　　以下是我做的一个实验，可以发现索引能极大地提高查询的效率：(x��)

　　我有一个会(x��)员�(sh��)��息表users�Q�里�Ҏ(gu��)��37365条用戯��录：(x��)

　　在不加烦(ch��)引的时候进行查询：(x��)

　　sql语句A:

　　select * from users where username like '%�?';

　　在Mysql-Front中的8�ơ查询时长�ؓ(f��)�Q?.40,0.54,0.54,0.54,0.53,0.55,0.54 共找�?60条记�?

　　sql语句B:

　　select * from users where username like '�?';

　　在Mysql-Front中的8�ơ查询时长�ؓ(f��)�Q?.53,0.53,0.53,0.54,0.53,0.53,0.54,0.54 共找�?36条记�?

　　sql语句C:

　　select * from users where username like '%�?;

　　在Mysql-Front中的8�ơ查询时长�ؓ(f��)�Q?.51,0.51,0.52,0.52,0.51,0.51,0.52,0.51 共找�?条记�?

　　为username列添加烦(ch��)�?

　　create index usernameindex on users(username(6));

　　再次查询�Q?

　　sql语句A:

　　select * from users where username like '%�?';

　　在Mysql-Front中的8�ơ查询时长�ؓ(f��)�Q?.35,0.34,0.34,0.35,0.34,0.34,0.35,0.34 共找�?60条记�?

　　sql语句B:

　　select * from users where username like '�?';

　　在Mysql-Front中的8�ơ查询时长�ؓ(f��)�Q?.06,0.07,0.07,0.07,0.07,0.07,0.06,0.06 共找�?36条记�?

　　sql语句C:

　　select * from users where username like '%�?;

　　在Mysql-Front中的8�ơ查询时长�ؓ(f��)�Q?.32,0.31,0.31,0.32,0.31,0.32,0.31,0.31 共找�?条记�?

　　在实验过�E�中�Q�我没有另开��M��E�序�Q�以上的数据说明在单表查询中�Q�徏立烦(ch��)引的可以极大地提高查询速度�?

　　另外要说的是如果建立�?ji��n)�?ch��)引，对于like '�?'�c�d��的查询，速度提升是最明显的。因此，我们在写sql语句的时候也��量采用�q�种方式查询�?

　　对于多表查询我们的优化原则是�Q?

　　��量��烦(ch��)引徏立在�Q�left join on/right join on ...　�Q�条�Ӟ��的条件语句中所涉及(qi��ng)的字�D�上�?

　　多表查询比单表查询更能体现烦(ch��)引的优势�?

　　11、烦(ch��)引的建立原则�Q?

　　如果一列的中数据的前缀重复值很��，我们最好就只烦(ch��)引这个前�~�。Mysql支持�q�种索引。我在上面用到的索引�Ҏ(gu��)��是对username最左边�?个字�W�进行烦(ch��)引。烦(ch��)引越短，占用�?��盘�I�间��少�Q�在��(g��)索过�E�中��q��旉��也越��。这�Ҏ(gu��)��可以�Ҏ(gu��)��多左255个字�W�进行烦(ch��)引�?

　　在很多场合，我们可以�l�徏立多列数据徏立烦(ch��)引�?

　　索引应该建立在查询条件中�q�行比较的字�D�上�Q�而不是徏立在我们要找出来�q�且昄��的字�D�上

　　12、一往(xi��n)情深问到的问�?IN、OR子句�怼�(x��)使用工作表，使烦(ch��)引失效。如果不产生大量重复��|��可以考虑把子句拆开。拆开的子句中应该包含索引�?

　　�q�句话怎么理解冻I��请�D个例�?

　　例子如下:

　　如果在fields1和fields2上同时徏立了(ji��n)索引�Q�fields1��Z��索引

　　以下sql�?x��)用到�?ch��)�?

　　select * from tablename1 where fields1='value1' and fields2='value2'

　　以下sql不会(x��)用到索引

　　select * from tablename1 where fields1='value1' or fields2='value2'

　　13.索引带来查询上的速度的大大提�?但烦(ch��)引也占用�?ji��n)额外的��盘�I�间(当然现在一般硬盘空间不成问�?,而且往(xi��n)表中插入新记录时索引也要随着更新�q�也需要一定时�?

　　有些表如果经常insert,而较?y��u)��select,��׃��用加索引�?不然每次写入数据都要重新改写索引,��p��旉��; �q�个视实际情况而定,通常情况下烦(ch��)引是必需�?

　　14.我在�Ҏ(gu��)��询效率有怀疑的时�?一般是直接用Mysql的Explain来跟�t�查询情�?

　　你用Mysql-Front是通过旉��来比�?我觉得如果从查询时扫描字�D늚��ơ数来比较更�_��一�?

lk 2008-02-15 14:01 发表评论

完全优化MySQL数据库性能的八大��y�Ҏ(gu��)��

lk — Fri, 15 Feb 2008 05:55:00 GMT

完全优化MySQL数据库性能的八大��y�Ҏ(gu��)��

　　1、选取最适用的字�D�属�?/p>
　　MySQL可以很好的支持大数据量的存取�Q�但是一般说来，数据库中的表��小�Q�在它上面执行的查询也就�?x��)越快。因此，在创��的时候，��Z��(ji��n)获得更好的性能�Q�我们可以将表中字段的宽度设得尽可能��。例如，在定义邮政编码这个字�D�|��Q�如果将其设�|��ؓ(f��)CHAR(255),昄��l�数据库增加�?ji��n)不必要的空��_(d��)��甚至使用VARCHAR�q�种�c�d��也是多余的，因�ؓ(f��)CHAR(6)��可以很好的完成��d��?ji��n)。同��L(f��ng)��Q�如果可以的话，我们应该使用MEDIUMINT而不是BIGIN来定义整型字�D�c(di��n)�?/p>
　　另外一个提高效率的�Ҏ(gu��)��是在可能的情况下�Q�应该尽量把字段讄��为NOT NULL�Q�这样在��来执行查询的时候，数据库不用去比较NULL倹{�?/p>
　　对于某些文本字段�Q�例�?#8220;省䆾”或�?#8220;性别”�Q�我们可以将它们定义为ENUM�c�d��。因为在MySQL中，ENUM�c�d��被当作数值型数据来处理，而数值型数据被处理�v来的速度要比文本�c�d��快得多。这��P��我们又可以提高数据库的性能�?/p>
　　2、��用连接（JOIN�Q�来代替子查�?Sub-Queries)

　　MySQL�?.1开始支持SQL的子查询。这个技术可以��用SELECT语句来创��Z��个单列的查询�l�果�Q�然后把�q�个�l�果作�ؓ(f��)�q��o(h��)条�g用在另一个查询中。例如，我们要将客户基本信息表中没有��M��订单的客户删除掉�Q�就可以利用子查询先从销售信息表中将所有发�?gu��)��单的客户ID取出来，然后��结果传递给��L��询，如下所�C�：(x��)

　　DELETE FROM customerinfo WHERE CustomerID NOT in (SELECT CustomerID FROM salesinfo )

　　使用子查询可以一�ơ性的完成很多逻辑上需要多个步骤才能完成的SQL操作�Q�同时也可以避免事务或者表锁死�Q��ƈ且写��h��也很�Ҏ(gu��)��。但是，有些情况下，子查询可以被更有效率的连接（JOIN�Q?. 替代。例如，假设我们要将所有没有订单记录的用户取出来，可以用下面这个查询完成：(x��)

　　SELECT * FROM customerinfo WHERE CustomerID NOT in (SELECT CustomerID FROM salesinfo )

　　如果使用�q�接�Q�JOIN�Q?. 来完成这个查询工作，速度��会(x��)快很多。尤其是当salesinfo表中对CustomerID建有索引的话�Q�性能��会(x��)更好�Q�查询如下：(x��)

　　SELECT * FROM customerinfo LEFT JOIN salesinfoON customerinfo.CustomerID=salesinfo. CustomerID WHERE salesinfo.CustomerID IS NULL

　　�q�接�Q�JOIN�Q?. 之所以更有效率一些，是因�?MySQL不需要在内存?sh��)��创��Z��(f��)时表来完成这个逻辑上的需要两个步骤的查询工作�?/p>
　　3、��用联�?UNION)来代替手动创建的临时�?/p>
　　MySQL �?4.0 的版本开始支�?UNION 查询�Q�它可以把需要��用��(f��)时表的两条或更多�?SELECT 查询合�ƈ的一个查询中。在客户端的查询�?x��)话�l�束的时候，临时表会(x��)被自动删除，从而保证数据库整齐、高效。��?UNION 来创建查询的时候，我们只需要用 UNION作�ؓ(f��)关键字把多个 SELECT 语句�q�接��h��可以了(ji��n)�Q�要注意的是所�?SELECT 语句中的字段数目要想同。下面的例子��演�C�Z��(ji��n)一个��?UNION的查询�?/p>
　　SELECT Name, Phone FROM client UNION SELECT Name, BirthDate FROM author

　　UNION

　　SELECT Name, Supplier FROM product

　　4、事�?/p>
　　��管我们可以使用子查询（Sub-Queries�Q�、连接（JOIN�Q�和联合�Q�UNION�Q�来创徏各种各样的查询，但不是所有的数据库操作都可以只用一条或��数几条SQL语句��可以完成的。更多的时候是需要用��C��p�d��的语句来完成某种工作。但是在�q�种情况下，当这个语句块中的某一条语句运行出错的时候，整个语句块的操作��׃��(x��)变得不确定�v来。设想一下，要把某个数据同时插入两个相关联的表中�Q�可能会(x��)出现�q�样的情况：(x��)�W�一个表中成功更新后�Q�数据库�H�然出现意外状况�Q�造成�W�二个表中的操作没有完成�Q�这��P��׃��(x��)造成数据的不完整�Q�甚至会(x��)破坏数据库中的数据。要避免�q�种情况�Q�就应该使用事务�Q�它的作用是�Q�要么语句块中每条语句都操作成功�Q�要么都��p�|。换句话��_(d��)��是可以保持数据库中数据的一致性和完整性。事物以BEGIN 关键字开始，COMMIT关键字结束。在�q�之间的一条SQL操作��p�|�Q�那么，ROLLBACK命��o(h��)��可以把数据库恢复到BEGIN开始之前的状态�?/p>
　　BEGIN;

　　INSERT INTO salesinfo SET CustomerID=14;

　　UPDATE inventory SET Quantity=11

　　WHERE item='book';

　　COMMIT;

　　事务的另一个重要作用是当多个用户同时��用相同的数据源时�Q�它可以利用锁定数据库的�Ҏ(gu��)��来�ؓ(f��)用户提供一�U�安全的讉K��方式�Q�这样可以保证用��L(f��ng)��操作不被其它的用��h��q�扰�?/p>
　　5、锁定表

　　��管事务是维护数据库完整性的一个非常好的方法，但却因�ؓ(f��)它的独占性，有时�?x��)�?ji��ng)响数据库的性能�Q�尤其是在很大的应用�pȝ��中。由于在事务执行的过�E�中�Q�数据库��会(x��)被锁定，因此其它的用戯��求只能暂时等待直到该事务�l�束。如果一个数据库�pȝ��只有��数几个用户

　　来��用，事务造成的媄(ji��ng)响不�?x��)成��Z��个太大的问题�Q�但假设有成千上万的用户同时讉K��一个数据库�pȝ��Q�例如访问一个电(sh��)子商务网站，��׃��(x��)产生比较严重的响应�g�q��?/p>
　　其实�Q�有些情况下我们可以通过锁定表的�Ҏ(gu��)��来获得更好的性能。下面的例子��q��锁定表的�Ҏ(gu��)��来完成前面一个例子中事务的功能�?/p>
　　LOCK TABLE inventory WRITE

　　SELECT Quantity FROM inventory

　　WHEREItem='book';

　　...

　　UPDATE inventory SET Quantity=11

　　WHEREItem='book';

　　UNLOCK TABLES

　　�q�里�Q�我们用一�?SELECT 语句取出初始数据�Q�通过一些计��，�?UPDATE 语句��新值更新到表中。包含有 WRITE 关键字的 LOCK TABLE 语句可以保证�?UNLOCK TABLES 命��o(h��)被执行之前，不会(x��)有其它的讉K��来对 inventory �q�行插入、更新或者删除的操作�?/p>
　　6、��用外�?/p>
　　锁定表的�Ҏ(gu��)��可以�l�护数据的完整性，但是它却不能保证数据的关联性。这个时候我们就可以使用外键。例如，外键可以保证每一条销售记录都指向某一个存在的客户。在�q�里�Q�外键可以把customerinfo 表中的CustomerID映射到salesinfo表中CustomerID�Q��Q何一条没有合法CustomerID的记录都不会(x��)被更新或插入到salesinfo中�?/p>
　　CREATE TABLE customerinfo

　　(

　　CustomerID INT NOT NULL ,

　　PRIMARY KEY ( CustomerID )

　　) TYPE = INNODB;

　　CREATE TABLE salesinfo

　　(

　　SalesID INT NOT NULL,

　　CustomerID INT NOT NULL,

　　PRIMARY KEY(CustomerID, SalesID),

　　FOREIGN KEY (CustomerID) REFERENCES customerinfo

　　(CustomerID) ON DELETECASCADE

　　) TYPE = INNODB;

　　注意例子中的参数“ON DELETE CASCADE”。该参数保证�?customerinfo 表中的一条客戯��录被删除的时候，salesinfo 表中所有与该客��L(f��ng)��关的记录也会(x��)被自动删除。如果要�?MySQL 中��用外键，一定要��C��在创��的时候将表的�c�d��定义��Z��务安全表 InnoDB�c�d��。该�c�d��不是 MySQL 表的默认�c�d��。定义的�Ҏ(gu��)��是在 CREATE TABLE 语句中加�?TYPE=INNODB。如例中所�C��?/p>
　　7、��用烦(ch��)�?/p>
　　索引是提高数据库性能的常用方法，它可以��o(h��)数据库服务器以比没有索引快得多的速度��(g��)索特定的行，��其是在查询语句当中包含有MAX(), MIN()和ORDERBY�q�些命��o(h��)的时候，性能提高更�ؓ(f��)明显。那该对哪些字段建立索引呢？一般说来，索引应徏立在那些��用于JOIN, WHERE判断和ORDER BY排序的字�D�上。尽量不要对数据库中某个含有大量重复的值的字段建立索引。对于一个ENUM�c�d��的字�D�|��_(d��)��出现大量重复值是很有可能的情况，例如customerinfo中的“province”.. 字段�Q�在�q�样的字�D�上建立索引��不�?x��)有什么帮助；相反�Q�还有可能降低数据库的性能。我们在创徏表的时候可以同时创建合适的索引�Q�也可以使用ALTER TABLE或CREATE INDEX在以后创建烦(ch��)引。此外，MySQL

　　从版�?.23.23开始支持全文烦(ch��)引和搜烦(ch��)。全文烦(ch��)引在MySQL 中是一个FULLTEXT�c�d��索引�Q�但仅能用于MyISAM �c�d��的表。对于一个大的数据库�Q�将数据装蝲��C��个没有FULLTEXT索引的表中，然后再��用ALTER TABLE或CREATE INDEX创徏索引�Q�将是非常快的。但如果��数据装载到一个已�l�有FULLTEXT索引的表中，执行�q�程��会(x��)非常慢�?/p>
　　8、优化的查询语句

　　�l�大多数情况下，使用索引可以提高查询的速度�Q�但如果SQL语句使用不恰当的话，索引��无法发挥它应有的作用。下面是应该注意的几个方面。首先，最好是在相同类型的字段间进行比较的操作。在MySQL 3.23版之前，�q�甚��x(ch��ng)��一个必��ȝ��条�g。例如不能将一个徏有烦(ch��)引的INT字段和BIGINT字段�q�行比较�Q�但是作为特�D�的情况�Q�在CHAR�c�d��的字�D�和VARCHAR�c�d��字段的字�D�大��相同的时候，可以��它们进行比较。其�ơ，在徏有烦(ch��)引的字段上尽量不要��用函数进行操作�?/p>
　　例如�Q�在一个DATE�c�d��的字�D�上使用YEAE()函数�Ӟ��会(x��)使烦(ch��)引不能发挥应有的作用。所以，下面的两个查询虽然返回的�l�果一��P��但后者要比前者快得多�?/p>
　　SELECT * FROM order WHERE YEAR(OrderDate)<2001;

　　SELECT * FROM order WHERE OrderDate<"2001-01-01";

　　同样的情形也�?x��)发生在��?gu��)��值型字段�q�行计算的时候：(x��)

　　SELECT * FROM inventory WHERE Amount/7<24;

　　SELECT * FROM inventory WHERE Amount<24*7;

　　上面的两个查询也是返回相同的�l�果�Q�但后面的查询将比前面的一个快很多。第三，在搜索字�W�型字段�Ӟ��我们有时�?x��)��?LIKE 关键字和通配�W�，�q�种做法虽然��单，但却也是以牺牲系�l�性能��Z��L(f��ng)��。例如下面的查询��会(x��)比较表中的每一条记录�?/p>
　　SELECT * FROM books

　　WHERE name like "MySQL%"

　　但是如果换用下面的查询，�q�回的结果一��P��但速度��p��快上很多�Q?/p>
　　SELECT * FROM books

　　WHERE name>="MySQL"and name<"mysqm"

　　最后，应该注意避免在查询中让MySQL�q�行自动�c�d��转换�Q�因��{换过�E�也�?x��)��索引变得不�v作用�?/p>

lk 2008-02-15 13:55 发表评论

MYSQL使用索引的方�?

lk — Fri, 01 Feb 2008 08:08:00 GMT

MYSQL使用索引的方�?

作者：(x��)vicki 2006-12-05 16:46:51

标签�Q?/td>

如何建立索引

· 索引通常被用于提高WHERE条�g的数据行匚w��或者执行联�l�操作时匚w��其它表的数据行的搜烦(ch��)速度。所以我们选择索引的列也通常选择出现在WHERE子句、join子句、ORDER BY或GROUP BY子句中的列�?/div>
· 选择索引�Ӟ��需要考虑数据列的基数。所谓基敎ͼ�是指数据列所包含的不同的数据的个数。如果基数相对于数据表行数较高的话，索引的效果比较好。换句话��_(d��)��是指数据列的不同的��D��多，索引效果��好。如果一个数据列只包含：(x��)0或�?两个值的话，索引的用处就不大。如果值出现的几率几乎相等�Q�那么无论搜索哪个值都可能得到一半的数据行。在�q�些情况下，最好根本不要��用烦(ch��)引�?/div>
· 索引��D��短的��|��所选择的数据类型也��可能的要小一些。譬如：(x��)如果TEXT能满��需求的话，我们��׃��需要用MEDIUTEXT�?/div>
· 如果建立联合索引的话�Q�譬如对�Q�t1,t2,t3建立联合索引的话�Q�同时也是对t1和t1,t2建立�?ji��n)�?ch��)引。但是如果单独指定t2、t3、t1t3、t2t3的值的话，都会(x��)用不到烦(ch��)引�?br />

sql语句中如何避免没有��用烦(ch��)引的情况

首先先了(ji��n)解一下mysql优化器的工作原理�Q�MySQL查询优化器最主要的目标是��可能地使用索引�Q��ƈ且��用最严格的烦(ch��)引来消除��可能多的数据行。所以当我们提交查询语句�Ӟ��如果优化器排除不�W�合条�g的数据的速度��快�Q�那么查询的�l�果也会(x��)��快�?/div>
·��量比较数据�c�d��相同的数据列。例如，INT与BIGINT是不同的。CHAR(10)被认为是CHAR(10)或VARCHAR(10)�Q�但是与CHAR(12)或VARCHAR(12)不同�?/div>
·��量不要在where子句中对索引列��用表辑ּ�或者函数。如果你在烦(ch��)引列使用函数调用或者更复杂的算术表辑ּ��Q�MySQL��׃��?x��)��用�?ch��)引，因�ؓ(f��)它必��计��出每个数据行的表达式倹{�?/div>
   WHERE mycol < 4 / 2 使用索引
   WHERE mycol * 2 < 4 没有使用索引

· 在��用LIKE�Ӟ��量不要在开头��用通配�W��?/div>
    WHERE col_name LIKE ’%string%’

    WHERE col_name LIKE ’abc%’

· 不要使用�c�d��转换。如果某个烦(ch��)引列是int型，而在查询�Ӟ��赋��gؓ(f��)字符型，��用不�?ji��n)�?ch��)引�?/div>
    SELECT * FROM mytbl WHERE num_col = 1;使用索引
    SELECT * FROM mytbl WHERE num_col = ‘1’;没有使用索引

·在SELECT语句中可以��用STRAIGHT_JOIN关键字来重蝲优化器的选择�?/div>
    SELECT STRAIGHT_JOIN ... FROM t1, t2, t3 ... ;
    SELECT ... FROM t1 STRAIGHT_JOIN t2 STRAIGHT_JOIN t3 ... ;

http://blog.sina.com.cn/s/reader_46599af7010006rv.html

lk 2008-02-01 16:08 发表评论

lk — Fri, 02 Nov 2007 07:22:00 GMT
开发�h员的噩梦——删除重复记�?br />
　　惛_��每一位开发�h员都有过�c�M��的经历，在对数据库进行查询或�l�计的时候不时地�?x��)碰到由于表中存在重复的记录而导致查询和�l�计�l�果不准��。解册��问题的办法就是将�q�些重复的记录删除，只保留其中的一条�?br />
　　在SQL Server中除�?ji��n)对拥有十几条记录的表进行�h工删除外�Q�实现删除重复记录一般都是写一�D�代码，用游标的�Ҏ(gu��)��一行一行检查，删除重复的记录。因��U�方法需要对整个表进行遍历，所以对于表中的记录��C��是很大的时候还是可行的�Q�如果一张表的数据达��C��百万条，用游标的�Ҏ(gu��)��来删除简直是个噩梦，因�ؓ(f��)它会(x��)执行相当长的一�D�|��间�?

　　四板斧——轻松消除重复记�?/strong>

　　�D�不知在SQL Server中有一�U�更为简单的�Ҏ(gu��)��Q�它不需要用游标�Q�只要写一句简单插入语句就能实现删除重复记录的功能。�ؓ(f��)�?ji��n)能清楚地表�q�ͼ�我们首先假设存在一个��品信息表Products�Q�其表结构如下：(x��)

CREATE TABLE Products (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)

　　表中的数据如�?�Q?br />

�?

　　�?中可以看出，产品Chang和Tofu的记录在产品信息表中存在重复。现在要删除�q�些重复的记录，只保留其中的一条。步骤如下：(x��)

　　�W�一板斧——徏立一张具有相同结构的临时�?br />

CREATE TABLE Products_temp (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)

　　�W�二板斧——�ؓ(f��)该表加上索引�Q��ƈ使其忽略重复的�?br />
　　�Ҏ(gu��)��是在企业��理器中扑ֈ�上面建立的��(f��)时表Products _temp�Q�单击鼠标右键，选择所有�Q务，选择��理索引�Q�选择新徏。如�?所�C��?br />
　　按照�?中圈出来的地方设�|�烦(ch��)引选项�?br />

�?

　　�W�三板斧——拷贝��品信息到临时�?br />

insert into Products_temp Select * from Products

　　此时SQL Server�?x��)返回如下提�C�：(x��)

　　服务�? 消息 3604�Q��?16�Q�状�?1�Q�行 1

　　已忽略重复的键�?br />
　　它表明在产品信息临时表Products_temp中不�?x��)有重复的行出现�?br />
　　�W�四板斧——将新的数据导入原表

　　��原产品信息表Products清空�Q��ƈ��(f��)时表Products_temp中数据导入，最后删除��(f��)时表Products_temp�?br />

delete Products
insert into Products select * from Products_temp
drop table Products_temp

　　�q�样��完成了(ji��n)对表中重复记录的删除。无��有多大，它的执行速度都是相当快的�Q�而且因�ؓ(f��)几乎不用写语句，所以它也是很安全的�?br />
　　��提�C�：(x��)上述�Ҏ(gu��)��中删除重复记录取决于创徏唯一索引旉��择的字�D�，在实际的操作�q�程中读者务必首先确认创建的唯一索引字段是否正确�Q�以免将有用的数据删除�?

lk 2007-11-02 15:22 发表评论

查询数据库中的重复记�?集合但没整理)

lk — Fri, 02 Nov 2007 07:18:00 GMT

========�W�一��?========
在一张表中某个字�D�下面有重复记录�Q�有很多�Ҏ(gu��)��Q�但是有一个方法，是比较高效的�Q�如下语句：(x��)

select data_guid from adam_entity_datas a where a.rowid > (select min(b.rowid) from adam_entity_datas b where b.data_guid = a.data_guid)

如果表中有大量数据，但是重复数据比较?y��u)��，那么可以用下面的语句提高效�?/p>
select data_guid from adam_entity_datas where data_guid in (select data_guid from adam_entity_datas group by data_guid having count(*) > 1)

此方法查询出所有重复记录了(ji��n)�Q�也��是��_(d��)��只要是重复的��选出来，下面的语句也许更高效

select data_guid from adam_entity_datas where rowid in (select rid from (select rowid rid,row_number()over(partition by data_guid order by rowid) m from adam_entity_datas) where m <> 1)

目前只知道这三种比较有效的方法�?/p>
�W�一�U�方法比较好理解�Q�但是最慢，�W�二�U�方法最快，但是选出来的记录是所有重复的记录�Q�而不是一个重复记录的列表�Q�第三种�Ҏ(gu��)��Q�我认�ؓ(f��)最好�?br />
========�W�二��?========
select usercode,count(*)       from ptype     group by usercode     having count(*) >1
========�W�三��?========
扑և�重复记录的ID:
select ID      from
(         select ID ,count(*) as Cnt
from 要消除重复的�?
group by ID
) T1
where T1.cnt>1

删除数据库中重复数据的几个方�?nbsp;
         数据库的使用�q�程中由于程序方面的问题有时候会(x��)��到重复数据�Q�重复数据导致了(ji��n)数据库部分设�|�不能正��设�|?#8230;…
�Ҏ(gu��)��一
       declare @max integer,@id integer
       declare cur_rows cursor local for select ��d��D?count(*) from
            表名 group by ��d��D? having count(*) > 1
　　open cur_rows
　　fetch cur_rows into @id,@max
　　while @@fetch_status=0
　　begin
　　select @max = @max -1
　　set rowcount @max
　　delete from 表名 where ��d��D? = @id
　　fetch cur_rows into @id,@max
　　end
　　close cur_rows
　　set rowcount 0

�Ҏ(gu��)��?nbsp;
有两个意义上的重复记录，一是完全重复的记录�Q�也��x(ch��ng)��有字�D�均重复的记录，二是部分关键字段重复的记录，比如Name字段重复�Q�而其他字�D�不一定重复或都重复可以忽略�?nbsp;

1、对于第一�U�重复，比较�Ҏ(gu��)��解决�Q��?nbsp;
     select distinct * from tableName
    ��可以得到无重复记录的结果集�?nbsp;
如果该表需要删除重复的记录�Q�可以按以下�Ҏ(gu��)��删除
select distinct * into #Tmp from tableName
drop table tableName
select * into tableName from #Tmp
drop table #Tmp

2、这�c�重复问题通常要求保留重复记录中的�W�一条记录，*作方法如�?nbsp;
假设有重复的字段为Name,Address�Q�要求得到这两个字段唯一的结果集
　select identity(int,1,1) as autoID, * into #Tmp from
tableName
　select min(autoID) as autoID into #Tmp2 from #Tmp group by
Name,autoID
select * from #Tmp where autoID in(select autoID from
#tmp2)

最后一个select卛_��C��(ji��n)Name�Q�Address不重复的�l�果�?nbsp;
更改数据库中表的所属用��L(f��ng)��两个�Ҏ(gu��)��
大家可能�?x��)经常碰��C��个数据库备䆾�q�原到另外一台机器结果导致所有的表都不能打开�?ji��n)，原因是徏表的时候采用了(ji��n)当时的数据库用户……
========�W�四��?========
如何查询数据库中的重复记录？

比如说有个表中的数据是这��P��(x��)
---------
a
a
a
b
b
c
---------

查询出的�l�果是：(x��)
记录  数量
a          3
b          2
c          1

怎样写这个SQL语句�Q?br /> -----------------------
select distinct(name),count(*) from tabname group by name;
-------------------------------------
惛_��来了(ji��n)�Q�这样就可以排序�?ji��n)�?br /> select a1,count(a1)  as total from tablename group by a1 order by total desc
--------------------------------------
select distinct(a1),count(a1) as total from tablename group by a1 order by total desc
加个distinct更有效率
--------------------------------------------------------------
select p.*, m.* from table1 p left join table2 m on p.item1=m.item2 where p.item3='#$#@%$@' order by p.item3 asc limit 10
��q��D��么写
========�W�五��?========
如何查找数据库中的重复记�? 能在Access中用的方�?
----------------------------------------------------------------------
select *
from �?nbsp;A inner join (select 字段1,字段2 from �?nbsp;group by 字段1,字段2 having Count(*)>1) B on A.字段1=B.字段1 and A.字段2=B.字段2
--------------------------------------------------------
问题�Q?br /> �Ҏ(gu��)��其中几个字段判断重复�Q�只保留一条记录，但是要显�C�全部字�D�，怎么查询�Q�谢谢！�Q?
比如
字段1 字段2 字段3 字段4
a     b     c      1
a     b     c      1

a     b     d      2
a     b     d      3

b     b     d      2

惛_��到的�l�果�?
a     b     c      1
a     b     d      2�Q�或�?�Q?
b     b     d      2
说明�Q�根据字�D?�Q?,3�l�合不重复，字段4 不考虑�Q�得��C��(ji��n)3个记�?
但是也要昄��字段4�?nbsp;
�Ҏ(gu��)��一�Q?nbsp;
可以用��(f��)时表的方法来解决�Q?
CurrentProject.Connection.Execute "drop table temptable"
CurrentProject.Connection.Execute "select * into temptable from �? where 1=2"
CurrentProject.Connection.Execute "insert into temptable(字段1,字段2,字段3) SELECT DISTINCT �?.字段1, �?.字段2, �?.字段3 FROM �?;"
CurrentProject.Connection.Execute "UPDATE temptable INNER JOIN �? ON (�?.字段1 = temptable.字段1) AND (�?.字段2 = temptable.字段2) AND (�?.字段3 = temptable.字段3) SET temptable.字段4 = [�?].[字段4];"
�Ҏ(gu��)��二：(x��)
可以直接使用一个SELECT查询�{�选出需要的数据�Q?
可以假定�W�四字段都选值最��的
SELECT [1],[2], [3], Min([4]) AS Min4
FROM �?
GROUP BY �?.[1], �?.[2], �?.[3];

问题�Q?br /> �?

id  NAME  r1   r2
1   1     w    ee
1   1     1    1232
1   2     123  123
1   2     12   434
1   2     123  123
2   1     123  123

ID 为数��|��NAME 为字�W�。每条记录没有唯一标识�?
要求取得 ID �?nbsp;NAME 合�ƈ后不重复的记录，如有重复保留其中一条即可，但要昄��所有记录�?nbsp;
回答�Q?nbsp;
SELECT a.*, (select top 1 r1 from �? as a1 where a1.id=a.id and a1.name=a.name) AS r1, (select top 1 r2 from �? as a2 where a2.id=a.id and a2.name=a.name) AS r2
FROM [SELECT DISTINCT �?.id, �?.NAME
FROM �?]. AS a;

SELECT a.*, dlookup("r1","�?","id=" & a.id  & " and name='"& a.name & "'") AS r1, dlookup("r2","�?","id=" & a.id  & " and name='"& a.name & "'") AS r2
FROM [SELECT DISTINCT �?.id, �?.NAME
FROM �?]. AS a;

注意�Q�上�q�C��码中�׃��没有唯一标识列，因此昄��?nbsp;R1 R2 的先后次序无从确定，一般是按输入的先后��序�Q�但是微软没有官方资料说明到底按哪个��序�Q�请�|�友注意�?

��h��意，上述�?为没有唯一标识字段�Q�如果现在再建立一个自动编号字�D?#8220;主键”则可以用以下代码

SELECT a.ID, a.name, b.r1, b.r2, b.主键
FROM (SELECT �?.id, �?.NAME, Min(�?.主键) AS 主键
FROM �?
GROUP BY �?.id, �?.NAME) AS a inner JOIN �? AS b ON a.主键=b.主键;

========�W�六��?========
1.查询数据库中重复的记�?
select realname,count(*) from users group by realname having count(*)>1
========�W�七��?========
SELECT T0.ItemCode, T0.ItemName FROM OITM T0 WHERE exists (select 1 from OITM A where A.CODEBARS = TO.CODEBARS And A.ItemCode < > TO.ItemCode)
========�W�八��?========
�怿�很多人在查询数据库时都会(x��)��到��(g��)索某表中不重复记录的时�?提到��(g��)索不重复记录,马上惛_��的肯定是Distinct或者Group By分组,
��弟在初�ơ��用的时候碰��C��(ji��n)一些麻�?�q�里拿出来与大家分��n,希望�Ҏ(gu��)��多的朋友有所帮助!

    先看看数据库表结构：(x��)
        表名: TEST 字段: Id,A,B,C,D
        其中B字段包含重复�?

Id

A

B

C

D

1

11

a

34

bvb

2

22

a

35

fgfg

3

33

d

ht

sdf

4

44

a

345

de

5

55

c

sfsf

sscv

6

66

b

rt

fg






下面我们来看看用什么样的SQL语句��(g��)索出不含重复记录的数�?
使用Distinct关键�?br />     Distinct关键字主要用来在SELECT查询记录中根据某指定字段的值去除重复记�?br />     SELECT DISTINCT [字段名] FROM [表名] WHERE [��(g��)索条件字句]

    所以用�q�样一句SQL��可以去掉重复项�?


SELECT DISTINCT (B) FROM TEST

    但是:

    �q�里有一个非帔R��帔R��要注意的地方�Q?br />     SELECT DISTINCT [字段名]后面不能再跟其他的字�D�，否则��(g��)索出来的记录仍然�?x��)含有重复项�Q?br />       错误写法�Q?br />             SELECT DISTINCT [字段名] �Q�[其他字段名] FROM [表名] WHERE [��(g��)索条件字句]

    实际�?我们上面SQL语句�l�果集里��只有B字段;(一般情况下,�q�种�l�果应该是很难满��需求的)

    如果我们的记录集里还需要有其他字段�?那怎么办呢?

实际�?我们完全可以用另一�U�办法来解决问题;只是需要用到子查询而已!

使用GROUP BY 分组
    有一炚w��要注�?
       使用带有GROUP BY字句的查询语句时,在SELECT列表指定的列要么是GROUP BY 指定的列,要么包含聚合�l�函�?/font>

    所以用�q�样一句SQL��可以去掉重复项�?

SELECT * FROM TEST WHERE id in (SELECT MIN(id) FROM TEST GROUP BY B)

    �q�样��得到我们想要的�l�果集了(ji��n):


Id

A

B

C

D

1

11

a

34

bvb

3

33

d

ht

sdf

5

55

c

sfsf

sscv

6

66

b

rt

fg





========�W�九(ji��)��?=====mysql===
----------------------------------------------------------------------

我的mysql表中的帐��h��8位的随机�?我现在想查帐��h��没有重复�?应该怎样操作,

----------------------------------------------------------------------

select count(*) as num,帐号 from TABLE GROUP BY 帐号
num > 1 ��有重复!

========�W�十��?===�Q�着急的人直接看�U�字�Q?====
在��用mysql�Ӟ��有时需要查询出某个字段不重复的记录�Q�虽然mysql提供有distinct�q�个关键字来�q��o(h��)掉多余的重复记录只保留一条，但往(xi��n)往(xi��n)只用它来�q�回不重复记录的条数�Q�而不是用它来�q�回不重记录的所有倹{��其原因是distinct只能�q�回它的目标字段�Q�而无法返回其它字�D�，�q�个问题让我困扰�?ji��n)很久，用distinct不能解决的话�Q�我只有用二重��@环查询来解决�Q�而这样对于一个数据量非常大的站来��_(d��)��无疑是会(x��)直接影响到效率的。所以我�׃��(ji��n)很多旉��来研�I�这个问题，�|�上也查不到解决�Ҏ(gu��)��Q�期间把容容拉来帮忙�Q�结果是我们两�h都郁闷了(ji��n)。。。。。。。。�?br />
下面先来看看例子�Q?br />
    table
  id name
  1 a
  2 b
  3 c
  4 c
  5 b

库结构大概这��P��q�只是一个简单的例子�Q�实际情况会(x��)复杂得多�?br />
比如我想用一条语句查询得到name不重复的所有数据，那就必须使用distinct��L��多余的重复记录�?br />
select distinct name from table
得到的结果是:

  name
  a
  b
  c

好像辑ֈ�效果�?ji��n)，可是�Q�我惌��得到的是id值呢�Q�改一下查询语句吧:

select distinct name, id from table

�l�果�?x��)�?

  id name
  1 a
  2 b
  3 c
  4 c
  5 b

distinct怎么没�v作用�Q�作用是起了(ji��n)的，不过他同时作用了(ji��n)两个字段�Q�也��是必须得id与name都相同的才会(x��)被排除。。。。。。�?br />
我们再改�Ҏ(gu��)��询语�?

select id, distinct name from table

很遗憾，除了(ji��n)错误信息你什么也得不刎ͼ�distinct必须攑֜�开头。难��C��能把distinct攑ֈ�where条�g里？能，照样报错。。。。。。�?br />
很麻�?ch��)吧�Q�确实，费尽�?j��)思都没能解决�q�个问题。没办法�Q��(h��)�l�找人问�?br />
拉住公司里一JAVA�E�序员，他给我演�C�Z��(ji��n)oracle里��用distinct之后�Q�也没找到mysql里的解决�Ҏ(gu��)��Q�最后下班之前他��我试试group by�?br />
试了(ji��n)半天�Q�也不行�Q�最后在mysql手册里找��C��个用法，用group_concat(distinct name)配合group by name实现�?ji��n)我所需要的功能�Q�兴奋，天佑我也�Q�赶快试试�?br />
报错。。。。。。。。。。。。郁闗��。。。。。。连mysql手册也跟我过不去�Q�先�l�了(ji��n)我希望，然后又把我推向失望，好狠哪。。。�?br />
再仔�l�一查，group_concat函数�?.1支持�Q�晕�Q�我4.0的。没办法�Q�升�U�，升完�U�一试，成功。。。。。�?br />
�l�于搞定�?ji��n)，不过�q�样一来，又必��要求客户也升��?ji��n)�?br />
�H�然灉|��一闪，既然可以使用group_concat函数�Q�那其它函数能行吗？

赶紧用count函数一试，成功�Q�我。。。。。。。想哭啊�Q�费�?ji��n)这么多工夫。。。。。。。。原来就�q�么��单。。。。。�?br />
现在��完整语句放�?

select *, count(distinct name) from table group by name

�l�果:

  id name count(distinct name)
  1 a 1
  2 b 1
  3 c 1

最后一��Ҏ(gu��)��多余的，不用��就行了(ji��n)�Q�目的达到。。。。�?br />
唉，原来mysql�q�么�W�，轻轻一下就把他骗过��M��(ji��n)�Q�郁闷也��我吧（对了(ji��n)�Q�还有容定w��家伙�Q�，现在拿出来希望大家不要被�q�问题折腾�?br />
哦，对，再顺便说一句，group by 必须攑֜� order by �?limit之前�Q�不然会(x��)报错�Q�差不多�?ji��n)，发给容容攄��站上去，我�?h��)�l�忙��。。。。。�?br />
-----------------------------------------------------------------------------------------

更郁��L(f��ng)��事情发生�?ji��n)，在准备提交时容容发现�Q�有更简单的解决�Ҏ(gu��)��。。。。。�?br />
select id, name from table group by name
select * from table group by name

========�W�十一��?========

查询�?qi��ng)删除重复记录的��?gu��)��
(一)
1、查找表中多余的重复记录�Q�重复记录是�Ҏ(gu��)��单个字段�Q�peopleId�Q�来判断
select * from people
where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)

2、删除表中多余的重复记录�Q�重复记录是�Ҏ(gu��)��单个字段�Q�peopleId�Q�来判断�Q�只留有rowid最��的记录
delete from people
where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)
and rowid not in (select min(rowid) from people group by peopleId having count(peopleId )>1)

3、查找表中多余的重复记录�Q�多个字�D�）(j��)
select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

4、删除表中多余的重复记录�Q�多个字�D�）(j��)�Q�只留有rowid最��的记录
delete from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

5、查找表中多余的重复记录�Q�多个字�D�）(j��)�Q�不包含rowid最��的记录
select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

(�?
比方�?br /> 在A表中存在一个字�D?#8220;name”�Q?br /> 而且不同记录之间�?#8220;name”值有可能�?x��)相同�?br /> 现在��是需要查询出在该表中的各记录之间�Q?#8220;name”值存在重复的��；
Select Name,Count(*) From A Group By Name Having Count(*) > 1

如果�q�查性别也相同大则如�?
Select Name,sex,Count(*) From A Group By Name,sex Having Count(*) > 1

(�?
�Ҏ(gu��)��一

declare @max integer,@id integer

declare cur_rows cursor local for select ��d��D?count(*) from 表名 group by ��d��D?having count(*) >�Q?1

open cur_rows

fetch cur_rows into @id,@max

while @@fetch_status=0

begin

select @max = @max -1

set rowcount @max

delete from 表名 where ��d��D?= @id

fetch cur_rows into @id,@max

end

close cur_rows

set rowcount 0

　　�Ҏ(gu��)��?br />
　　有两个意义上的重复记录，一是完全重复的记录�Q�也��x(ch��ng)��有字�D�均重复的记录，二是部分关键字段重复的记录，比如Name字段重复�Q�而其他字�D�不一定重复或都重复可以忽略�?br />
　　1、对于第一�U�重复，比较�Ҏ(gu��)��解决�Q��?br />
select distinct * from tableName

　　��可以得到无重复记录的结果集�?br />
　　如果该表需要删除重复的记录�Q�重复记录保�?条）(j��)�Q�可以按以下�Ҏ(gu��)��删除

select distinct * into #Tmp from tableName

drop table tableName

select * into tableName from #Tmp

drop table #Tmp

　　发生�q�种重复的原因是表设计不周��生的�Q�增加唯一索引列即可解冟�?br />
　　2、这�c�重复问题通常要求保留重复记录中的�W�一条记录，操作�Ҏ(gu��)��如下

　　假设有重复的字段为Name,Address�Q�要求得到这两个字段唯一的结果集

select identity(int,1,1) as autoID, * into #Tmp from tableName

select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,autoID

select * from #Tmp where autoID in(select autoID from #tmp2)

　　最后一个select卛_��C��(ji��n)Name�Q�Address不重复的�l�果集（但多�?ji��n)一个autoID字段�Q�实际写时可以写在select子句中省��L��列）(j��)

(�?
查询重复

select * from tablename where id in (

select id from tablename

group by id

having count(id) > 1

)

========�W�二��?========

========�W�二��?========
========�W�二��?========

lk 2007-11-02 15:18 发表评论

ODBC方式动态连接数据库

lk — Sat, 29 Sep 2007 01:03:00 GMT
嘿嘿嘿！�Q�现��g��(ji��n)�Q�！�Q?br />
�q�可能是��C��天（2007-9-29�Q��ؓ(f��)止我唯一原创的东西，自己写的ODBC动态连接数据库的方法！

�q�样��可以不用徏立数据源�?ji��n)�?br />
public void set_ConnectDB() {
        try {
            Class.forName("sun.jdbc.odbc.JdbcOdbcDriver");
            con = DriverManager.getConnection("jdbc:odbc:driver={Microsoft Access Driver (*.mdb)};DBQ=F://database/user.mdb");
            con.setAutoCommit(false);
            stm = con.createStatement();
        } catch (Exception ex) {
            ex.printStackTrace();
        }
    }

�q�是我从�q�接�c�里截取的，大家都是高手�Q�我��׃��用写con和stm都是什么意思了(ji��n)��java人都知道�Q�！

lk 2007-09-29 09:03 发表评论

lk — Tue, 25 Sep 2007 04:02:00 GMT

mysql存储�q�程的创建，删除�Q�调用及(qi��ng)其他常用命��o(h��)

mysql 5.0存储�q�程学习(f��n)�ȝ��

一.创徏存储�q�程

1.基本语法�Q?

create procedure sp_name()
begin
………
end

2.参数传�?/p>

�?调用存储�q�程

1.基本语法�Q�call sp_name()
注意�Q�存储过�E�名�U�后面必��d��括号�Q�哪怕该存储�q�程没有参数传�?/div>
�?删除存储�q�程

1.基本语法�Q?br /> drop procedure sp_name//
2.注意事项
(1)不能在一个存储过�E�中删除另一个存储过�E�，只能调用另一个存储过�E?/div>
�?区块�Q�条�Ӟ��循环

1.区块定义�Q�常�?br /> begin
……
end;
也可以给区块起别名，如：(x��)
lable:begin
………..
end lable;
可以用leave lable;跛_��区块�Q�执行区块以后的代码
2.条�g语句

if 条�g then
statement
else
statement
end if;

3.循环语句
(1).while循环

[label:] WHILE expression DO

statements

END WHILE [label] ;

(2).loop循环

[label:] LOOP

statements

END LOOP [label];

(3).repeat until循环

[label:] REPEAT

statements

UNTIL expression

END REPEAT [label] ;

�?其他常用命��o(h��)

1.show procedure status
昄��数据库中所有存储的存储�q�程基本信息�Q�包括所属数据库�Q�存储过�E�名�U�ͼ�创徏旉��{?br /> 2.show create procedure sp_name
昄��某一个存储过�E�的详细信息

mysql存储�q�程中要用到的运��符

mysql存储�q�程学习(f��n)�ȝ��Q�操作符

��术�q�算�W?/strong>

+     �?nbsp; SET var1=2+2;       4
-     �?nbsp; SET var2=3-2;       1
*     �?nbsp; SET var3=3*2;       6
/     �?nbsp; SET var4=10/3;      3.3333
DIV   整除 SET var5=10 DIV 3; 3
%     取模 SET var6=10%3 ;     1

比较�q�算�W?/strong>

>            大于 1>2 False
<            ��于 2<1 False
<=           ��于�{�于 2<=2 True
>=           大于�{�于 3>=2 True
BETWEEN      在两��g��?nbsp;5 BETWEEN 1 AND 10 True
NOT BETWEEN 不在两��g��?nbsp;5 NOT BETWEEN 1 AND 10 False
IN           在集合中 5 IN (1,2,3,4) False
NOT IN       不在集合�?nbsp;5 NOT IN (1,2,3,4) True
=            �{�于 2=3 False
<>, !=       不等�?nbsp;2<>3 False
<=>          严格比较两个NULL值是否相�{?nbsp;NULL<=>NULL True
LIKE         ��单模式匹�?nbsp;"Guy Harrison" LIKE "Guy%" True
REGEXP       正则式匹�?nbsp;"Guy Harrison" REGEXP "[Gg]reg" False
IS NULL      为空 0 IS NULL False
IS NOT NULL 不�ؓ(f��)�I?nbsp;0 IS NOT NULL True

逻辑�q�算�W?/strong>

�?/strong>(AND)

AND

TRUE

FALSE

NULL

TRUE

TRUE

FALSE

NULL

FALSE

FALSE

FALSE

NULL

NULL

NULL

NULL

NULL

�?OR)

OR

TRUE

FALSE

NULL

TRUE

TRUE

TRUE

TRUE

FALSE

TRUE

FALSE

NULL

NULL

TRUE

NULL

NULL

异或(XOR)

XOR

TRUE

FALSE

NULL

TRUE

FALSE

TRUE

NULL

FALSE

TRUE

FALSE

NULL

NULL

NULL

NULL

NULL

位运��符

|   位或
&   位与
<< 左移�?br /> >> 右移�?br /> ~   位非(单目�q�算�Q�按位取�?

mysq存储�q�程中常用的函数�Q�字�W�串�c�d��操作�Q�数学类�Q�日期时间类�?/p>

mysql存储�q�程基本函数

一.字符串类

CHARSET(str) //�q�回字串字符�?br /> CONCAT (string2 [,… ]) //�q�接字串
INSTR (string ,substring ) //�q�回substring首次在string中出现的位置,不存在返�?
LCASE (string2 ) //转换成小�?br /> LEFT (string2 ,length ) //从string2中的左边起取length个字�W?br /> LENGTH (string ) //string长度
LOAD_FILE (file_name ) //从文件读取内�?br /> LOCATE (substring , string [,start_position ] ) 同INSTR,但可指定开始位�|?br /> LPAD (string2 ,length ,pad ) //重复用pad加在string开�?直到字串长度为length
LTRIM (string2 ) //去除前端�I�格
REPEAT (string2 ,count ) //重复count��?br /> REPLACE (str ,search_str ,replace_str ) //在str中用replace_str替换search_str
RPAD (string2 ,length ,pad) //在str后用pad补充,直到长度为length
RTRIM (string2 ) //去除后端�I�格
STRCMP (string1 ,string2 ) //逐字�W�比较两字串大小,
SUBSTRING (str , position [,length ]) //从str的position开�?取length个字�W?
注：(x��)mysql中处理字�W�串�Ӟ��默认�W�一个字�W�下标�ؓ(f��)1�Q�即参数position必须大于�{�于1

mysql> select substring(’abcd’,0,2);
+——————�?#8211;+
| substring(’abcd’,0,2) |
+——————�?#8211;+
|                       |
+——————�?#8211;+
1 row in set (0.00 sec)

mysql> select substring(’abcd’,1,2);
+——————�?#8211;+
| substring(’abcd’,1,2) |
+——————�?#8211;+
| ab                    |
+——————�?#8211;+
1 row in set (0.02 sec)

TRIM([[BOTH|LEADING|TRAILING] [padding] FROM]string2) //去除指定位置的指定字�W?br /> UCASE (string2 ) //转换成大�?br /> RIGHT(string2,length) //取string2最后length个字�W?br /> SPACE(count) //生成count个空�?nbsp;

�?数学�c?/span>

ABS (number2 ) //�l�对�?br /> BIN (decimal_number ) //十进制�{二进�?br /> CEILING (number2 ) //向上取整
CONV(number2,from_base,to_base) //�q�制转换
FLOOR (number2 ) //向下取整
FORMAT (number,decimal_places ) //保留��数位数
HEX (DecimalNumber ) //转十六进�?br /> 注：(x��)HEX()中可传入字符�Ԍ��则返回其ASC-11码，如HEX(’DEF’)�q�回4142143
也可以传入十�q�制整数�Q�返回其十六�q�制�~�码�Q�如HEX(25)�q�回19
LEAST (number , number2 [,..]) //求最��?br /> MOD (numerator ,denominator ) //求余
POWER (number ,power ) //求指�?br /> RAND([seed]) //随机�?br /> ROUND (number [,decimals ]) //四舍五入,decimals为小��C��数]

注：(x��)�q�回�c�d��q��均�ؓ(f��)整数�Q�如�Q?br /> (1)默认变�(sh��)ؓ(f��)整�Ş�?br /> mysql> select round(1.23);
+———�?+
| round(1.23) |
+———�?+
|           1 |
+———�?+
1 row in set (0.00 sec)

mysql> select round(1.56);
+———�?+
| round(1.56) |
+———�?+
|           2 |
+———�?+
1 row in set (0.00 sec)

(2)可以讑֮��数位数�Q�返回��Q点型数据
mysql> select round(1.567,2);
+————�?+
| round(1.567,2) |
+————�?+
|           1.57 |
+————�?+
1 row in set (0.00 sec)

SIGN (number2 ) //�q�回�W�号,正负�?
SQRT(number2) //开�q�x(ch��ng)��

�?日期旉��c?/span>

ADDTIME (date2 ,time_interval ) //��time_interval加到date2
CONVERT_TZ (datetime2 ,fromTZ ,toTZ ) //转换时区
CURRENT_DATE ( ) //当前日期
CURRENT_TIME ( ) //当前旉��
CURRENT_TIMESTAMP ( ) //当前旉��?br /> DATE (datetime ) //�q�回datetime的日期部�?br /> DATE_ADD (date2 , INTERVAL d_value d_type ) //在date2中加上日期或旉��
DATE_FORMAT (datetime ,FormatCodes ) //使用formatcodes格式昄��datetime
DATE_SUB (date2 , INTERVAL d_value d_type ) //在date2上减��M��个时�?br /> DATEDIFF (date1 ,date2 ) //两个日期�?br /> DAY (date ) //�q�回日期的天
DAYNAME (date ) //英文星期
DAYOFWEEK (date ) //星期(1-7) ,1为星期天
DAYOFYEAR (date ) //一�q�中的第几天
EXTRACT (interval_name FROM date ) //从date中提取日期的指定部分
MAKEDATE (year ,day ) //�l�出�q�及(qi��ng)�q�中的第几天,生成日期�?br /> MAKETIME (hour ,minute ,second ) //生成旉��?br /> MONTHNAME (date ) //英文月䆾�?br /> NOW ( ) //当前旉��
SEC_TO_TIME (seconds ) //�U�数转成旉��
STR_TO_DATE (string ,format ) //字串转成旉��,以format格式昄��
TIMEDIFF (datetime1 ,datetime2 ) //两个旉��?br /> TIME_TO_SEC (time ) //旉��转秒数]
WEEK (date_time [,start_of_week ]) //�W�几�?br /> YEAR (datetime ) //�q�䆾
DAYOFMONTH(datetime) //月的�W�几�?br /> HOUR(datetime) //��时
LAST_DAY(date) //date的月的最后日�?br /> MICROSECOND(datetime) //微秒
MONTH(datetime) //�?br /> MINUTE(datetime) //�?/div>

�?可用在INTERVAL中的�c�d��
DAY ,DAY_HOUR ,DAY_MINUTE ,DAY_SECOND ,HOUR ,HOUR_MINUTE ,HOUR_SECOND ,MINUTE ,MINUTE_SECOND,MONTH ,SECOND ,YEAR

lk 2007-09-25 12:02 发表评论

mysql 语法�Q�陆�l�补充）(j��)

lk — Tue, 25 Sep 2007 03:48:00 GMT
查询MySQL版本�Q�有两种�Ҏ(gu��)��Q?br />
SHOW VARIABLES LIKE 'version';
or
SELECT VERSION();

SHOW TABLES FROM database;     查看数据库里面所有的表，
执行    desc table_name;     或�?nbsp;
show columns from talbe_name;     查看表中的所有的�?br />
查看数据�?br /> show databases;
查看�?br /> show tables;
show create table table_name;

�l�计一个表的字�D�|��
select count(*) from syscolumns A inner join sysobjects B on A.id=B.id
where B.name='表名'
(注：(x��)�q�个lcs没看懂，有明白的��L(f��ng)��解释一�?/span>)

=======================

1.如何�l�标识列插入�?/p>
表中�W�一个字�D�id为标识列
insert into table values (null,'aa',1)

2.如果表存在删除表

drop table if exists tablename

3.date too long for column 解决�Ҏ(gu��)��

我用的是5.1�Q�昨天把mysql,php,phpmyadmin的字�W�集都改成utf8后，用load data infile 命��o(h��)插入数据时��L��出现�q�样的错误提�C�：(x��)data too long for column 'cname' at row 1;�|�上搜一下，大都说set character_set=utf8之类的，但还是不行，最后找��C��(ji��n)一个：(x��)
修改my.ini文�g�Q�将
sql-mode=STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION
注释掉，ok�Q?br /> Update:mysql5在phpmyadmin无法�q�接时执行的语句�Q?br /> SET PASSWORD FOR ‘root’@'localhost’ = OLD_PASSWORD(’[newpassword]‘);

刚才在导入数据的时候，navicat报错:
Data too long for column ‘ip’ at row 1
提示数据对于ip字段太长

如果数据�c�d��不正��?也会(x��)出错,而不�?.*那样自动转换:
sendQuery:Incorrect datetime value: ‘未知’ for column ‘date’ at row 1

如果是数据x (int 11)�c�d��的可能有些奇�?
insert into a (x) values (’a')
出现:
Out of range value adjusted for column ‘x’ at row 1

insert into a (x) values (’11a’)
出现:
Data truncated for column ‘x’ at row 1

解决办法:
在my.ini里找�?br /> sql-mode=”STRICT_TRANS_TABLES,NO_AUTO_Create_USER,NO_ENGINE_SUBSTITUTION”
把其中的
STRICT_TRANS_TABLES,
��L��,然后重启mysql��ok�?/p>
4.分页语句
select * from table where ... order by ... limit n,n

5.mysql 5.0 中文��q��问题
解决mysql5.0的中文�ؕ码问题，只要按下面三步做��可以了(ji��n)�Q?br /> 　1.�W�一步，修改MySql的配�|�文件my.ini�Q?br />      在安装好Mysql后，在Mysql所在的目录下有一个my.ini文�g�Q�修改这个my.ini文�g�Q�修�Ҏ(gu��)��式如下：(x��)
　　　1.1 在[client] 的后面加一�?default-character-set=gb2312
      2.2 把[mysql] 的后�?default-character-set=latin1 �Ҏ(gu��)�� default-character-set=gb2312
      2.3 把[mysqd] 的后�?default-character-set=latin1 �Ҏ(gu��)�� default-character-set=gb2312
      2.4 在改�?ji��n)上面三处后�Q�后面还?sh��)��个default-character-set=latin1,�q�个default-character-set的作用是指定在创建新的表或数据库

�Ӟ��所使用的默认字�W�编�?��Z��(ji��n)方便创徏新的表或数据库，��把定�?default-character-set也改成gb2312�?/p>
2.�W�二步，讄��与数据库�q�接的字�W�串�Q?br />        在连接字�W�串(URL)后加�?useUnicode=true&characterEncoding=gb2312�q�一句，具体如下�Q?br /> 　　 class="org.springframework.jdbc.datasource.DriverManagerDataSource">

   com.mysql.jdbc.Driver

   jdbc:mysql://localhost:3306/数据库名?useUnicode=true&characterEncoding=gb2312

   用户�?lt;/value>

   密码

   3.�W�三步，在java代码�Q�把SQL语句转换成gb2312的编码，然后再执行该SQL.
       3.1 把字�W�串转换成gb2312的编码的方式如下�Q?br />              public static String GB2312Converter(String str) {
if (str == null) {
   str = "";
} else {
   try {
    str = new String(str.getBytes("gb2312"), "gb2312");
   } catch (Exception ex) {
    ex.printStackTrace();
   }
}
return str;
      }

         3.2 获取gb2312�~�码的sql语句�Q?br />                String sql = "select name from user ";
               sql = GB2312Converter(sql); // 获取gb2312�~�码的sql语句,然后��可以执行该sql语句�?ji��n)�?/p>

===============
Show index from b (subs)

------
EXPLAIN SELECT *
FROM items, subs
WHERE items.channel_id = subs.channel_id
AND subs.user_id =3
ORDER BY items.created_at
LIMIT 20 ;

=============================
一句话实现乱序查询

select * from a ORDER by rand()

lk 2007-09-25 11:48 发表评论

Id	A	B	C	D
1	11	a	34	bvb
2	22	a	35	fgfg
3	33	d	ht	sdf
4	44	a	345	de
5	55	c	sfsf	sscv
6	66	b	rt	fg

国产亚洲精品a在线观看,18亚洲男同志videos网站,亚洲1区2区3区精华液

数据表损坏的修复�Ҏ(gu��)��(�l�极完美�?!!!!)[转]

如何修复损坏的MySQL数据表[转]

java执行存储�q�程

���量数据�Q�数据量比较大时�Q�的处理分析

完全优化MySQL数据库性能的八大��y�Ҏ(gu��)��

完全优化MySQL数据库性能的八大��y�Ҏ(gu��)��

MYSQL使用索引的方�?

查询数据库中的重复记�?集合但没整理)

ODBC方式动态连接数据库

mysql 5.0存储�q�程学习(f��n)�ȝ��

mysql存储�q�程学习(f��n)�ȝ���Q�操作符

mysql存储�q�程基本函数

mysql 语法�Q�陆�l�补充）(j��)

��量数据�Q�数据量比较大时�Q�的处理分析

mysql存储�q�程学习(f��n)�ȝ��Q�操作符