一、测试目的
为了客观评价各种中文检索功能和性能指标,作为国家数字图书馆检索系统选型的依据,特公开邀请各检索系统供应商参加此项测试。
二、测试时间
经初筛后,另行通知候选参测单位。
三、测试要求
针对国家图书馆二期工程暨国家数字图书馆工程的数据情况,建立适当的检索系统。要求该检索系统:
(1)支持二次文献(元数据)的字段检索、字段级的“与或非”组合检索以及全文检索;
(2)建立2千万条元数据,1千个并发检索用户的计算机体系结构进行测试,根据测试结果推演5.5亿条元数据,1万个并发检索用户的情况下,秒级响应所需要的的计算机体系结构;
(3)具有良好的可扩展性和推演能力;
(4)支持Unicode 4.0/ISO10646:2003标准字符集;
(5)能够从各种字符集标准自动转换成Unicode 4.0/ISO10646:2003标准字符集。
(6)支持集群系统。
四、测试环境
1、硬件平台
曙光4000 H,由2个服务器节点(带硬盘)和16个刀片服务器(无硬盘)构成,配置分别如下:
4000H节点的配置(2个节点)
2颗 CPU Intel(R) Xeon(TM) 2.80GHz,cache size 512KB
内存 8GB
硬盘 133GB
刀片服务器(16个节点)
无盘工作站
2颗CPU Intel(R) Xeon(TM) 2.80GHz,cache size 512KB
内存4GB
2、测试数据
国家图书馆提供的数据总量为2千万条元数据,包括:
(1) 中文目次数据(数据格式ISO 2709)(GBK)
(2) 西文目次数据(数据格式SGML)
(3) EBSCO数据(数据格式SGML)
(4) CNMARC数据(数据格式ISO 2709)
(5) USMARC数据(数据格式ISO 2709)
(6) 全文数据(数据格式GB 2312)
注意:测试厂商需要事前转换数据到utf-8编码。
五、测试方法与步骤
1、测试步骤
(1) 愿意参加测试的供应商请填写测试申请表(见附件),同时提供其软件的主要功能、性能、应用接口情况、数据格式和标准、外部接口等说明;提供主要用户名单,及用户联系方式,并对数据规模,系统部署结构,遵循的标准规范等进行说明;
(2) 国家图书馆对测试申请表及提交的其他资料进行初筛。将从软件功能、使用情况、数据规模的经验、使用方式的相似性、系统部署结构的能力等方面进行考察,选择参加实际测试试验的单位;
(3) 向通过初筛的参测单位发《工程检索系统测试方案》,召开测试方法说明会,并安排进入测试现场的顺序,在指定的测试系统上现场测试,每个测试单位的测试时间控制在五个工作日之内;
(4) 分别与各参测单位讨论测试结果集和系统构成方案;
(5) 根据数据检索能力、系统结构、推演结果、扩充的方式与方法等方面,最终评定各参测单位软件测试结果的优劣顺序。
2、说明
(1) 递交申请截止日期为2005年6月15日;
(2) 测试地点设在中国科学院计算技术研究所;
(3) 测试方法详见《工程检索系统测试方案》。
|