国家图书馆关于季士妍等2人赴克罗地亚参加2019年国际互联网保存联盟年会的情况报告

  2019年6月5日至7日,2019年国际互联网保存联盟年会在克罗地亚首都萨格勒布市举行。经文化和旅游部批准,国家图书馆代表团应邀赴克参会。代表团由数字资源部副研究馆员季士妍和信息技术部高级工程师高宏组成。代表团此次会议圆满完成了学习、交流的任务。现总结如下:

  一、基本情况

  国际互联网保存联盟(International Internet Preservation Consortium,简称IIPC)于2003年,由澳大利亚、加拿大、丹麦、芬兰、法国、冰岛、意大利、挪威、瑞典、英国等国的国家图书馆,美国国会图书馆和美国互联网档案馆等12个机构联合组成的。它对全球网络信息资源保存的建设与发展起着非常重要的作用,它采用责任平等的合作机制,鼓励世界范围内的文化遗产保护机构一起参与网络信息资源保存的工作。其成员由来自全球45个国家56个单位构成,国家图书馆馆于2007年7月加入成为会员并开展相关工作。

  为促进全球网络信息资源保存的建设与发展,提供成员展示交流学习的机会,IIPC每年均会举办年会。2019年国际互联网保存联盟年会(Web Archiving Conference 2019)于6月5日至7日在克罗地亚首都萨格勒布市举行。会议以“网络存档社区:共同成熟的实践”为主题开展研讨。作为IIPC会员,同时也为进一步增进国家图书馆在网络信息资源保存系统结构、标准规范等方面与国际同行的交流与合作,国家图书馆派数字资源部副研究馆员季士妍、信息技术部高级工程师高宏一行2人于2019年6月4日至8日赴克罗地亚参加2019年国际互联网保存联盟年会。

  年会为期三天,第一天(6月5日)为限定IIPC会员参加的IIPC会员年会(IIPC GENERAL ASSEMBLY (iipcGA19))。后两天(6月6日至7日)为面向会议注册人员开放的IIPC网络保存会议(IIPC WEB ARCHIVING CONFERENCE (iipcWAC19) )。本次年会所有参会代表来自39个国家,约150人。71%的参会代表是IIPC 会员,28%的参会代表是非IIPC会员;从参会代表所属的地区来分类,欧洲代表占78%,北美洲占13%,亚洲占4%,其次是非洲占3%、拉丁美洲占3%。本次参会代表来自78个组织,其中59%的组织是IIPC会员,41%的组织是非IIPC会员。

  二、会议报告情况

  (一)IIPC 会员年会(iipcGA19)

  于2019年6月5日全天举行的iipcGA19,限定只可IIPC会员参加。会议分上下午举办,上午为全体参会人员一同参加的讨论和集中报告;下午安排了4个主题同时进行,以“工作组”的模式开展。iipcGA19会议参会人员约60人。其中亚洲地区的代表包括中国国家图书馆(2人)、日本国立国会图书馆(2人)、韩国国家图书馆(2人)、新加坡国际图书馆管理局(2人)。

  iipcGA19上午的议程包括欢迎致辞、小组讨论及新会员报告几个环节。首先由萨格勒布国家和大学图书馆总干事Petrić女士和Holub女士致欢迎辞,然后由来自瑞士国家图书馆的IIPC主席Locher先生致辞。接下来就是所有与会者分组讨论环节。大家分为10个小组,每组5至7人不等,针对参与IIPC组织的目的,对IIPC组织起到的作用、工作内容以及期待可以获得的帮助和可以参与的活动进行了开放性讨论。总的来说,与会者对IIPC的组织模式、作用及已经开展的工作给予了肯定,同时,大家也都提出了较有建议性、发展性的建议。针对参与IIPC组织的主要原因,大家集中于学习分享最新技术和发展、成员间合作交流和共同发展。针对IIPC组织可以起到的作用,成员比较倾向于网络采集技术的分享、网络信息资源存档相关标准的发展和推广以及通用性开源性软件的开发等方面,也提到了对培训工作的期待以及希望有更多的激励机制以促进更多的人投入到网络采集的工作中来。针对IIPC组织的任务和目标,大家提出了较好的建议,包括提供项目基金支持网络采集事业发展、制定多种语言适用的标准规范、组织成员间更多更深入地合作发展以及有经济援助的培训计划等。最后,与会者对期待参与的IIPC组织的活动发表了自己的观点,62.5%的与会者选择“推广会员网络存档的活动”以及“出版物(白皮书、报告、会议记录)”;37.5%的与会者选择“存档办法发展”以及“网络存档意识的提高”;25%的与会者选择“网络工作”;12.5%的与会者选择“培训”“社区主导式工具和方法的发展”以及“参与研究”。随后是新加入IIPC会员的成员介绍。先后由ROYAL LIBRARY OF BELGIUM(比利时皇家图书馆)、NATIONAL LIBRARY OF HUNGARY(匈牙利国家图书馆)、NATIONAL LIBRARY OF NORWAY(挪威国家图书馆)介绍了本机构在网络信息资源采集方面的情况。

  iipcGA19下午的会议以不同的主题分为4个“工作组”同时开展,共分为:采集内容工作组、技术工作组(Heritrix3、OpenWayBack Update、Automated quality assurance)、Web Curator Tool (WCT)工作组、保存工作组。每个工作组的活动安排,以主讲人与参与人随时讨论的模式开展。主讲人讲解本工作的进展,参与人会提出自己在工作中遇到的问题,大家随即展开对问题的讨论。总的来说,工作小组的讨论内容很专业性、技术性、实践性,讨论的氛围很轻松和友好。以国家图书馆代表团参与的技术工作组为例,参与开发Heritrix3(网络采集的开源软件)的工作组成员介绍Heritrix3的功能,参与者会提出在程序开发中遇到的问题,大家随即对问题进行讨论。在工作组休息期间,开发人员还会彼此针对具体问题进行更深入的沟通,甚至是针对程序代码来进行具体问题的讨论。

  (二)IIPC 网络保存会议 (iipcWAC19)

  面向会议注册人员开放的IIPC网络保存会议共计2天(6月6日至7日)。每日上午均有一个全体成员参与的“特邀报告”和“快速发言”,其余时间安排了分主题、多个会场同时开展的主题报告、座谈以及工作组。国家图书馆数字资源部副研究馆员季士妍受邀在6月6日网络存档会议第一天的“LIGHTNING TALKS快速发言”环节作了题为“The Key Technologies of Web archiving Service Platform”的快速发言。同时,季士妍也在2天的会议期间做了此内容的“poster海报展示”。在会议期间,与来自大英图书馆、荷兰国家图书馆、新加坡国家图书馆委员会、日本国立图书馆、斯洛伐克图书馆、伦敦皇家大学、西班牙的Arquivo.pt等多位参会人员进行了业务交流,相互沟通了各自机构在网络信息资源采集与保存方面的工作和方法。

  1.特邀报告

  会议邀请了Europeana平台运营商欧洲基金会执行董事Harry Verwayen做题为《我们用文化改变世界》的主题报告。Europeana平台支持博物馆、美术馆和档案馆进行数字化改造,使其数字收藏尽可能广泛地提供,以便人们能够找到并使用它们。该平台包括艺术、图片、地图、历史、新闻以及电影等资源,支持的资源格式包括图片、文本、音频、视频和3D,支持35种语言。Harry先生以Europeana平台为例,介绍了网络存档在图书馆和档案保存工作中成为越来越重要的组成部分,在当前和未来网络存档的可预见机会是什么,以及如何成功地适应这些机会。以色列开放大学社会学、政治学和传播系的高级讲师、开放媒体和信息实验室的共同创始人Anat Ben David博士做了题为《作为记忆的网络存档:对网络历史来源和方法的批判性思考》的主题报告。Ben-David博士将网络存档视为与软件和硬件类似的第三类记忆软件(memoryware),这个memoryware包括软件和硬件,还包括爬虫,机器人,采集人以及用户的特定形式的保存技术。Ben-David博士对Web存档本身以及使用Web存档构建的特定历史类型进行批判性关注,进而对网络存档的研究提出新的挑战。

  2.分会场主题报告及座谈

  为期2天的iipcWAC19主题报告特别多,内容非常丰富,时间也安排得非常紧凑。所有主题报告都是以“主题”为组织方式,以主讲人发言、听众提问的形式开展。同一时间段内开展2-3个分会场,共有以下几个主题:学术环境、机器学习项目、国家保存、东南欧的网络信息保存、国家级网络信息采集、研究使用、构建(和重建)网络信息采集项目、管理者的策略、技术基础设施、访问政策、规划可持续性、采集主题和格式、爬取网页的策略和工具、培训和影响力、欧盟和《通用数据保护条例》。

  3.工作组

  iipcWAC19组织了“工作组”的模式,让与会者可以以小组学习和讨论的形式深入参与到具体的主题学习中,便于大家互相交换自己的见解和建议,也便于大家就某一个问题展开讨论进而更好地解决实践问题。本次会议在同一时间同时开展两个“工作组”:由法国国家图书馆主持的“WARC文件格式:最新成品的更新和交换”;由大英图书馆主持的“反思我们如何在网络存档中培训新的入门者”。

  三、主要成果及工作建议

  1.本次出访参加的2019年国际互联网保存联盟年会(iipcGA19& iipcWAC19)是国际网络信息资源保存业界较权威的学术性会议。在3天的会议时间里,从早上9点到下午6点的9个小时里面安排了非常丰富的会议内容,不但有政策法律的探讨、技术方法策略的分享还有培训管理的指导;不但有特约发言、主题发言、专题座谈,还有海报展示和工作组学习,会议组织者通过多种模式为与会者提供了一个学习、交流的环境。国家图书馆代表团顺利参会,并在本次会议上做了发言,让所有与会者了解到中国国家图书馆在网络信息资源保存方面的工作开展历程,了解到中国非常重视网络信息资源的采集和保存,国家图书馆已经开展了16年的网络信息资源保存工作,并联合全国公共图书馆共同开展和推进该项工作发展。同时,国家图书馆代表团也通过“海报展示”的方式,详细讲述了目前国家图书馆建设的分布式云存储架构的“网络资源采集与服务平台”的关键技术。参加会议并作出自己工作的分享,是IIPC联盟倡导并鼓励的行为,也体现了中国在网络信息资源保存事业发展中的积极态度和发展成果。国际互联网保存联盟年会每年均会举办,希望可以支持国家图书馆的代表团每年均可以去参会,进而促进我国的网络信息资源保存事业与国际发展同步和共享。

  2.本次年会参会人员包括IIPC会员以及众多国家图书馆、国家档案馆、大学以及研究机构等,所有参会人员均是从事网络信息资源保存工作的实际工作者或者从事相关工作的学术研究者和技术研发工程师。在开会期间,随处可见不同国家、不同机构的从业者就自己关心的问题、不解的问题进行讨论。这次会议提供给所有网络信息资源保存的从业人员一个学习交流的平台。国家图书馆代表团在本次会议上,与多个国家图书馆、大学和机构的从业人员直接面对面交流了工作经验、分享了各自的工作成效,有利于国际业界对中国的网络信息资源保存事业发展的了解,也有利于国家图书馆实际工作人员业务能力的提升。通过本次会议,中国国家图书馆的代表也与众多国家的从业者建立了邮件、论坛等模式的联系,为今后大家共享最新技术、最新标准以及行业发展动态提供了顺畅的渠道。此外,通过会议,部分国家图书馆、机构或者大学的从业者对中国的网络信息采集工作非常感兴趣 ,也表达了进一步了解和合作的意愿。希望可以支持国家图书馆与国际范围内的图书馆、档案馆、大学、科研及技术机构等开展合作交流,包括人员交流学习、项目建设以及技术研发等,进而促进中国的网络信息资源采集和保存事业的发展。

  3.此次会议的成功举办除会议主办方的努力之外,有赖于众多IIPC会员的支持和参与。会议内容非常丰富,有赖于参会者积极投稿并做好了充分准备;会议形式多样、会议气氛轻松、讨论范围广泛而深入,体现了会议承办方的细致周到,也体现了参会者严谨的学术态度和对会议的重视程度。国家图书馆代表团此次参会,积累了国际学术会议的参会经验,为今后我们举办类似会议提供了可参考和借鉴的经验。