国家科技文献中心多语言信息服务研究及其应用
□ 张满年 高影繁 徐红姣 张均胜 王惠临 / 中国科学技术信息研究所 北京 100038
摘要:如何提高多语言信息服务质量已成为数字图书馆等科技信息服务领域的重要研究问题。文章首先介绍了国内外多语言信息服务相关研究,然后具体从跨语言信息检索和机器翻译两个方面介绍了国家科技文献中心多语言信息服务研究成果在国家科技文献在线服务系统中的应用。将跨语言信息检索功能和文摘翻译服务功能引入数字图书馆在线查询系统,在国内数字图书馆信息服务领域尚属探索性尝试,可以为进一步提高数字图书馆多语言信息服务质量提供经验。
关键词:多语言信息服务,跨语言信息检索,数字图书馆,机器翻译
DOI:10.3772/j.issn.1673—2286.2011.12.003
1 引言
因特网和万维网的普及与迅猛发展使得信息获取变得更加快捷与方便。物理空间距离不再是信息交流与传递的主要障碍,而多语言信息交流问题已逐步成为阻碍人类交流的主要障碍。数字图书馆作为数字信息的收藏者和信息交流港口,在信息与知识传播中起到越来越重要的作用。数字图书馆领域中同样存在多语言文献信息服务问题。数字图书馆中的文献信息表示语言可以是多种自然语言,如汉语、英语、法语、德语、西班牙语、俄语、日语、葡萄牙语、韩语等等。虽然有些学者与科学家能够掌握多种外语,并且可以熟练地在多语文献中获取信息,但是大多数科学家仅能够熟练使用一到三种外语,难以有效地了解其他语种的文献信息,难以避免信息调查片面,对科技信息决策与研究产生不利影响。为此,急需在科技文献数字图书馆领域开展多语言信息服务研究,并在数字图书馆网络服务系统中加以应用,满足广大科技工作者的多语言信息获取需求。目前国内主要数字图书馆网络服务系统中,主要通过分语种检索的方式提供信息检索服务。在国家科技图书文献中心(National Science and Technology Library,NSTL)网络信息服务系统中首次加入跨语言信息检索词推荐及英文文献标题及文摘信息翻译服务。本文在调研分析国内外多语言信息服务研究的基础上,重点介绍NSTL网络系统中的多语言信息服务应用及相关的技术研究,并对国内数字图书馆领域多语言信息服务未来发展方向进行探讨。
2 相关工作
跨语言信息检索服务研究起源于多语言信息检索。1996年,在ACM SIGIR Workshop for MultilingualInformat ion Ret r ieval会议上,与会人员经讨论提出跨语言信息检索(Cross-Language Information Retrieval,CLIR)。Jian-Yun Nie[1]将多语言信息检索(Multilingual Information Retrieval)和跨语言信息检索(Cross-Language Information Retrieval)分别定义为“retrieval of documents in several languagesf rom a que r y”和“ret r ieval of document s in alanguage different from that of a query”。在利用一种语言检索另外一种语言的文献时,后者的描述更为精准。查询所用语言称为源语言(Source Language),文档所用语言称为目标语言(Target Language)。如何将繁多的网络资源用不同的语言提供给用户,如何用可互换的语言形式描述相同或相似内容的信息资源,成为近年来信息检索研究领域中的前沿课题。从时间上划分,CLIR的研究历程主要分为三个阶段[2-5]:
全文下载:upload/国家科技文献中心多语言信息服务研究及其应用.pdf
转载自:http://www.dlf.net.cn/newsshow2.asp?ArticleID=1846&bigclassname=%B1%BE%C6%DA%BB%B0%CC%E2
摘要:如何提高多语言信息服务质量已成为数字图书馆等科技信息服务领域的重要研究问题。文章首先介绍了国内外多语言信息服务相关研究,然后具体从跨语言信息检索和机器翻译两个方面介绍了国家科技文献中心多语言信息服务研究成果在国家科技文献在线服务系统中的应用。将跨语言信息检索功能和文摘翻译服务功能引入数字图书馆在线查询系统,在国内数字图书馆信息服务领域尚属探索性尝试,可以为进一步提高数字图书馆多语言信息服务质量提供经验。
关键词:多语言信息服务,跨语言信息检索,数字图书馆,机器翻译
DOI:10.3772/j.issn.1673—2286.2011.12.003
1 引言
因特网和万维网的普及与迅猛发展使得信息获取变得更加快捷与方便。物理空间距离不再是信息交流与传递的主要障碍,而多语言信息交流问题已逐步成为阻碍人类交流的主要障碍。数字图书馆作为数字信息的收藏者和信息交流港口,在信息与知识传播中起到越来越重要的作用。数字图书馆领域中同样存在多语言文献信息服务问题。数字图书馆中的文献信息表示语言可以是多种自然语言,如汉语、英语、法语、德语、西班牙语、俄语、日语、葡萄牙语、韩语等等。虽然有些学者与科学家能够掌握多种外语,并且可以熟练地在多语文献中获取信息,但是大多数科学家仅能够熟练使用一到三种外语,难以有效地了解其他语种的文献信息,难以避免信息调查片面,对科技信息决策与研究产生不利影响。为此,急需在科技文献数字图书馆领域开展多语言信息服务研究,并在数字图书馆网络服务系统中加以应用,满足广大科技工作者的多语言信息获取需求。目前国内主要数字图书馆网络服务系统中,主要通过分语种检索的方式提供信息检索服务。在国家科技图书文献中心(National Science and Technology Library,NSTL)网络信息服务系统中首次加入跨语言信息检索词推荐及英文文献标题及文摘信息翻译服务。本文在调研分析国内外多语言信息服务研究的基础上,重点介绍NSTL网络系统中的多语言信息服务应用及相关的技术研究,并对国内数字图书馆领域多语言信息服务未来发展方向进行探讨。
2 相关工作
跨语言信息检索服务研究起源于多语言信息检索。1996年,在ACM SIGIR Workshop for MultilingualInformat ion Ret r ieval会议上,与会人员经讨论提出跨语言信息检索(Cross-Language Information Retrieval,CLIR)。Jian-Yun Nie[1]将多语言信息检索(Multilingual Information Retrieval)和跨语言信息检索(Cross-Language Information Retrieval)分别定义为“retrieval of documents in several languagesf rom a que r y”和“ret r ieval of document s in alanguage different from that of a query”。在利用一种语言检索另外一种语言的文献时,后者的描述更为精准。查询所用语言称为源语言(Source Language),文档所用语言称为目标语言(Target Language)。如何将繁多的网络资源用不同的语言提供给用户,如何用可互换的语言形式描述相同或相似内容的信息资源,成为近年来信息检索研究领域中的前沿课题。从时间上划分,CLIR的研究历程主要分为三个阶段[2-5]:
全文下载:upload/国家科技文献中心多语言信息服务研究及其应用.pdf
转载自:http://www.dlf.net.cn/newsshow2.asp?ArticleID=1846&bigclassname=%B1%BE%C6%DA%BB%B0%CC%E2
声明:本网站为非盈利网站,大多信息来源于网友推荐。如果作者或其他版权所有人认为违反了您的权益,请告知我们,我们会在24小时内删除。