您的位置:首页 > 重点项目 > 国家数字图书馆工程 > 标准规范
 

汉 字 处 理 规 范

·汉字属性字典

    汉字属性字典规范要求处理的汉字范围为GB 18030-2005(UNICODE、ISO 10646-2003)所包括的全部汉字。汉字属性字典规范的基本内容是汉字字型标准化、汉字标准发音、字型特征(包括汉字总笔画数量、汉字起笔至末笔笔形值、部首笔画数量、部首序号、部首外起笔至末笔笔形值、异体字数量、异体字字型等)、各种编码(包括四角号码、输入编码、其他汉字字符集编码等)以及构词和使用频度等。
    委托研制单位:中华书局
    预计完成时间:2008年9月

 

·中文文献全文版式还原与全文输入XML规范

    中文文献全文版式还原与全文输入XML规范要求能够对全部中文文献进行详细标记说明(主要用于古籍文献,兼顾普通文献),形成中文文献全文版式还原与全文输入XML规范格式,能够实现在互联网上全方位、实时再现中文文献原貌(重点是古籍),能够支持系统字与系统外字描述,能够提供全文检索所需信息,能够进行中文文献长期存储与保存。
    委托研制单位:北京中易中标电子信息技术有限公司
    预计完成时间:2008年9月

·古籍用字规范(计算机用字标准)

    古籍用字规范要求处理的汉字范围大于GB 18030-2005(UNICODE、ISO 10646-2003),要求处理与古籍相关的全部汉字(超出部分需要造字)。古籍用字规范的基本内容是汉字字型标准化、汉字发音(包括标准发音、上古音、中古音、近古音)、字型特征(包括汉字总笔画数量、汉字起笔至末笔笔形值、部首笔画数量、部首序号、部首外起笔至末笔笔形值、异体字数量、异体字字型等)、各种编码(包括四角号码、输入编码、其他汉字字符集编码等)以及构词和使用频度等。
    委托研制单位:中华书局
    预计完成时间:2008年9月

·计算机中文信息处理规范

    计算机中文信息处理规范要求处理的汉字范围为GB 18030-2005(UNICODE、ISO 10646-2003)所包括的全部汉字。计算机中文信息处理规范的基本内容是对文件格式、存储格式、传输格式、文献排序规则、检索处理能力、全文显示能力的规范等。
    委托研制单位:北京中易中标电子信息技术有限公司
    预计完成时间:2008年9月

·生僻字、避讳字处理规范

    生僻字、避讳字处理规范要求处理的汉字范围大于GB 18030-2005(UNICODE、ISO 10646-2003),要求处理与生僻字、避讳字相关的全部汉字。生僻字、避讳字处理规范的基本内容是汉字字型标准化、汉字发音(包括标准发音、上古音、中古音、近古音)、字型特征(包括汉字总笔画数量、汉字起笔至末笔笔形值、部首笔画数量、部首序号、部首外起笔至末笔笔形值、异体字数量、异体字字型等)、各种编码(包括四角号码、输入编码、其他汉字字符集编码等)以及构词和使用频度等。
    委托研制单位:中华书局
    预计完成时间:2008年9月

 

 
国家图书馆版权所有