□ 李琳娜 张志平 乔晓东 / 中国科学技术信息研究所 北京 100038
刘春霞 / 郑州铁路职业技术学院 郑州 450052
摘要:随着数字图书馆的文献数量和种类高速增长,数字图书馆用户迫切需要有效的个性化推荐工具来帮助其在众多文献中发现对其有价值的文献。协同过滤方法是推荐系统广泛采用的推荐技术,但数据稀疏性是影响其推荐效果的关键因素之一。在文献推荐领域,这一问题更加显著。文章提出了一个利用文献间共被引关系的协同过滤文献推荐方法。实验表明所提方法具有较好的推荐性能。
关键词:数字图书馆,个性化推荐,协同过滤,共被引关系
DOI:10.3772/j.issn.1673—2286.2012.03.008
1 引言
个性化推荐技术能够有效解决信息过载问题,多年来已经在研究上取得了丰富成果,特别是在电子商务领域已取得了很好的应用效果。根据具体的推荐策略,推荐系统一般分为基于内容的推荐系统、协同过滤推荐系统两类,后者是目前应用最广泛的推荐技术,其具体的推荐策略为:向用户推荐与其偏好相似的其他用户选择的项目。由于用户打过分的项目在整个项目空间中通常占少数,因此在发现相似用户群时,会出现相似度计算偏差,从而极大地影响推荐效果。故数据稀疏性(Sparseness)是协同过滤方法需要解决的核心问题[1]。
数字图书馆个性化推荐技术能够面向个体用户,提供符合其个人偏好的数字图书馆内容和服务,减少图书馆内容和个人信息需求之间的差距,已经成为数字图书馆技术发展的重要组成部分和前沿课题。作者面向文献推荐,利用文献计量学知识,提出了利用文献间共
被引关系的协同过滤方法,有效地解决了数据稀疏性问题。具体地,基于一个用户的原始打分信息,利用文献间的共被引关系,预测用户对关系文献的打分,磨平原始打分矩阵,提升用户打分矩阵的密度,进而使用协同过滤技术完成推荐。
2 相关工作
数字图书馆个性化推荐系统研究已经存在一些研究成果。作者将这些研究成果大概归结为如下几类:
(1)基于网络结构的推荐技术。Sullivan等首次提出将激活-扩散模型应用到文献推荐领域[2]。文献[3]提出了基于图模型的文献推荐系统,具体的推荐策略是图搜索技术。Wat anabe等开发了文献支持系统Papits[4]。该系统基于用户的浏览记录用scale-free网络构建用户模型,然后采用基于内容的推荐技术。文献[5]首先用FPT(Frequent-Pattern-Time)树发现用户的共同兴趣,然后基于神经网络的向后传播算法进行推荐。Gori和Pucci根据文献间的引用关系构建文献图,然后使用改进的pagerank算法进行推荐[6]。文献[7]提出了将本体和扩散激活模型融合的推荐技术。
(2)基于数据挖掘的推荐技术。Agarwal等提出了基于子空间聚类算法的文献推荐方法[8]。文献[9]和文献[10]都使用基于关联规则的推荐技术。但前者采用蚁群算法对用户聚类;后者根据用户的背景知识使用自适应共振理论将用户聚类。
(3)基于本体的推荐技术。文献[11]提出了利用搜索主题的本体进行推荐的技术。Liao等人提出了文献推荐系统PORE[12-14]。该系统以图书馆本体基础,根据用户的浏览记录构建用户个性化本体,从而完成个性化推荐。Ferran等根据用户的使用记录建构个性化本
体,然后基于该个性化本体进行推荐[15]。
(4)基于文献计量学的推荐技术。Cit e s e e r系统利用文献间的引用关系发现相关文献[16]。McNee等提出了将引文网络和CF算法融合的推荐技术[17]。Strohman等认为单纯的基于文本的推荐方法或者基于引文的推荐方法都有各自的缺陷,提出了将二者融合的推荐技术[18]。
(5)基于向量空间模型的推荐技术。文献[19]基于中图分类法和子网对向量的每个元素在歧义层、同义词层和上下位层进行扩展。文献[20]根据审稿人的发表记录,采用发表文献的标题、摘要、关键词及作者信息将其偏好表示为向量空间模型,然后采用基于内容的推荐技术。Gauch等人提出的推荐系统本质上是一个基于内容的推荐[21,22]。但是不再基于向量空间模型表示文献,而是基于概念树。文献[23]实现了文献推荐系统Scienstein,该系统是一个集成引文分析、作者分析、源分析、隐式打分、显式打分等多方面信息的混合推荐系统。文献[24]提出了将评审人的多种信息及论文的多种信息融合的推荐技术。
全文下载:http://www.dlf.net.cn/newsshow2.asp?ArticleID=1875&bigclassname=%CC%D8%B1%F0%B9%D8%D7%A2