ehxz 发表于 2006-12-18 22:16:37

重建索引提高SQL Server性能

  大多数SQL Server表需要索引来提高数据的访问速度,如果没有索引,SQL Server要进行表格扫描读取表中的每一个记录才能找到索要的数据。索引可以分为簇索引和非簇索引,簇索引通过重排表中的数据来提高数据的访问速度,而非簇索引则通过维护表中的数据指针来提高数据的索引。<br />  <br />  <b>索引的体系结构:</b><br />  <br />  为什么要不断的维护表的索引?首先,简单介绍一下索引的体系结构。SQL Server在硬盘中用8KB页面在数据库文件内存放数据。缺省情况下这些页面及其包含的数据是无组织的。为了使混乱变为有序,就要生成索引。生成索引后,就有了索引页和数据页,数据页保存用户写入的数据信息。索引页存放用于检索列的数据值清单(关键字)和索引表中该值所在纪录的地址指针。索引分为簇索引和非簇索引,簇索引实质上是将表中的数据排序,就好像是字典的索引目录。非簇索引不对数据排序,它只保存了数据的指针地址。向一个带簇索引的表中插入数据,当数据页达到100%时,由于页面没有空间插入新的的纪录,这时就会发生分页,SQL Server 将大约一半的数据从满页中移到空页中,从而生成两个半的满页。这样就有大量的数据空间。簇索引是双向链表,在每一页的头部保存了前一页、后一页地址以及分页后数据移动的地址,由于新页可能在数据库文件中的任何地方,因此页面的链接不一定指向磁盘的下一个物理页,链接可能指向了另一个区域,这就形成了分块,从而减慢了系统的速度。对于带簇索引和非簇索引的表来说,非簇索引的关键字是指向簇索引的,而不是指向数据页的本身。<br />  <br />  为了克服数据分块带来的负面影响,需要重构表的索引,这是非常费时的,因此只能在需要时进行。可以通过DBCC SHOWCONTIG来确定是否需要重构表的索引。下面举例来说明DBCC SHOWCONTIG和DBCC REDBINDEX的使用方法。以SQL Server自带的northwind数据作为例子<br />  <br />  带开SQL Server的Query analyzer输入命令:<br />  <br />  use pubs<br />  <br />  declare @table_id int<br />  <br />  set @table_id=object_id('tbldlvinfoback')<br />  <br />  dbcc showcontig(@table_id)<br />  <br />  这个命令显示pubs数据库中的tbldlvinfoback表的分块情况,结果如下:<br />  <br />  DBCC SHOWCONTIG 正在扫描 'tblDlvInfoback' 表&#46;&#46;&#46;<br />  表: 'tblDlvInfoback'(1797581442);索引 ID: 0,数据库 ID: 5<br />  已执行 TABLE 级别的扫描。<br />  - 扫描页数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 197214<br />  - 扫描扩展盘区数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 24659<br />  - 扩展盘区开关数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 24658<br />  - 每个扩展盘区上的平均页数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 8&#46;0<br />  - 扫描密度[最佳值:实际值]&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 99&#46;97%[24652:24659]<br />  - 扩展盘区扫描碎片&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 15&#46;46%<br />  - 每页上的平均可用字节数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 374&#46;6<br />  - 平均页密度(完整)&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 95&#46;37%<br />  DBCC 执行完毕。如果 DBCC 输出了错误信息,请与系统管理员联系。<br />  <br />  通过分析这些结果可以知道该表的索引是否需要重构。表1&#46;1描述了每一行的意义描述<br />  <br />  Pages Scanned          表或索引中的长页数<br />  <br />  Extents Scanned         表或索引中的长区页数<br />  <br />  Extent Switches         DBCC遍历页时从一个区域到另<br />  <br />  一个区域的次数<br />  <br />  Avg&#46; Pages per Extent            相关区域中的页数<br />  <br />  Scan Density                  Best Count是连续链接时的理想区<br />  <br />          域改变数,Actual Count是实际区<br />  <br />  域改变数,Scan Density为100%<br />  <br />  表示没有分块。<br />  <br />  Logical Scan Fragmentation      扫描索引页中失序页的百分比<br />  <br />  Extent Scan Fragmentation        不实际相邻和包含链路中所有链<br />  <br />  接页的区域数<br />  <br />  Avg&#46; Bytes Free per Page         扫描页面中平均自由字节数<br />  <br />  Avg&#46; Page Density (full)           平均页密度,表示页有多满<br />  <br />  从上面命令的执行结果可以看的出来,Best count为3 而Actual Count为5这表明orders表有分块需要重构表索引。下面通过DBCC DBREINDEX来重构表的簇索引。<br />  <br />  同样在Query Analyzer中输入命令:<br />  <br />  use northwind<br />  <br />  dbcc dbreindex('northwind&#46;dbo&#46;orders',pk_orders,90)<br />  <br />  <b>执行结果:</b><br />  <br />  DBCC execution completed&#46; If DBCC printed error messages, contact your system administrator&#46;<br />  <br />  Dbcc dbreindex参数说明:第一个参数为要重构的表明。第二个参数为需要重构的索引表识,‘’表示所有的索引。第三个参数为页的填充因子,填充因子越大,页越满。<br />  <br />  然后再用DBCC SHOWCONTIG查看重构簇索引后的结果:<br />  <br />  use northwind<br />  <br />  declare @table_id int<br />  <br />  set @table_id=object_id('orders')<br />  <br />  dbcc showcontig(@table_id)<br />  <br />  返回结果如下:<br />  <br />  DBCC SHOWCONTIG scanning 'Orders' table&#46;&#46;&#46;<br />  <br />  Table: 'Orders' (21575115); index ID: 1, database ID: 6<br />  <br />  TABLE level scan performed&#46;<br />  <br />  - Pages Scanned&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 22<br />  <br />  - Extents Scanned&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 3<br />  <br />  - Extent Switches&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 2<br />  <br />  - Avg&#46; Pages per Extent&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 7&#46;3<br />  <br />  - Scan Density &#46;&#46;&#46;&#46;&#46;&#46;&#46;: 100&#46;00% <br />  <br />  - Logical Scan Fragmentation &#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 0&#46;00%<br />  <br />  - Extent Scan Fragmentation &#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 33&#46;33%<br />  <br />  - Avg&#46; Bytes Free per Page&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 869&#46;2<br />  <br />  - Avg&#46; Page Density (full)&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 89&#46;26%<br />  <br />  DBCC execution completed&#46; If DBCC printed error messages, contact your system administrator&#46;<br />  <br />  通过结果我们可以看到Scan Denity为100%表没有分块不需要重构表索引了。如果重构表的簇索引Scan Denity还小于100%的话可以重构表的全部索引。命令如下:<br />  <br />  --use northwind<br />  <br />  --dbcc dbreindex('northwind&#46;dbo&#46;orders',’’,90)<br />  <br />  使用作业定时重构索引:<br />  <br />  如果你的数据库访问非常频繁的话,非常容易出现数据分块的现象,因此你可以利用作业来帮你在系统相对空闲的时候重构你的索引。<br />  <br />  为什么要不断的维护表的索引?首先,简单介绍一下索引的体系结构。SQL Server在硬盘中用8KB页面在数据库文件内存放数据。缺省情况下这些页面及其包含的数据是无组织的。为了使混乱变为有序,就要生成索引。生成索引后,就有了索引页和数据页,数据页保存用户写入的数据信息。索引页存放用于检索列的数据值清单(关键字)和索引表中该值所在纪录的地址指针。索引分为簇索引和非簇索引,簇索引实质上是将表中的数据排序,就好像是字典的索引目录。非簇索引不对数据排序,它只保存了数据的指针地址。向一个带簇索引的表中插入数据,当数据页达到100%时,由于页面没有空间插入新的的纪录,这时就会发生分页,SQL Server 将大约一半的数据从满页中移到空页中,从而生成两个半的满页。这样就有大量的数据空间。簇索引是双向链表,在每一页的头部保存了前一页、后一页地址以及分页后数据移动的地址,由于新页可能在数据库文件中的任何地方,因此页面的链接不一定指向磁盘的下一个物理页,链接可能指向了另一个区域,这就形成了分块,从而减慢了系统的速度。对于带簇索引和非簇索引的表来说,非簇索引的关键字是指向簇索引的,而不是指向数据页的本身。<br />  <br />  为了克服数据分块带来的负面影响,需要重构表的索引,这是非常费时的,因此只能在需要时进行。可以通过DBCC SHOWCONTIG来确定是否需要重构表的索引。下面举例来说明DBCC SHOWCONTIG和DBCC REDBINDEX的使用方法。以SQL Server自带的northwind数据作为例子<br />  <br />  带开SQL Server的Query analyzer输入命令:<br />  <br />  use pubs<br />  <br />  declare @table_id int<br />  <br />  set @table_id=object_id('tbldlvinfoback')<br />  <br />  dbcc showcontig(@table_id)<br />  <br />  这个命令显示pubs数据库中的tbldlvinfoback表的分块情况,结果如下:<br />  <br />  DBCC SHOWCONTIG 正在扫描 'tblDlvInfoback' 表&#46;&#46;&#46;<br />  表: 'tblDlvInfoback'(1797581442);索引 ID: 0,数据库 ID: 5<br />  已执行 TABLE 级别的扫描。<br />  - 扫描页数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 197214<br />  - 扫描扩展盘区数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 24659<br />  - 扩展盘区开关数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 24658<br />  - 每个扩展盘区上的平均页数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 8&#46;0<br />  - 扫描密度[最佳值:实际值]&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 99&#46;97%[24652:24659]<br />  - 扩展盘区扫描碎片&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 15&#46;46%<br />  - 每页上的平均可用字节数&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 374&#46;6<br />  - 平均页密度(完整)&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;&#46;: 95&#46;37
页: [1]
查看完整版本: 重建索引提高SQL Server性能