大数据环境下的情报学
发布人:编辑 发布时间:2012/12/21 10:03:13  浏览次数:4822次
分享到:

                                    □ 贺德方 / 中国科学技术信息研究所 北京 100038


    摘要:大数据已经成为国际国内研究关注的热点话题和重要方向。文章从大数据的内涵出发,阐释了大数据问题的内在价值与现实意义,分析了大数据在数据质量、对技术的要求、信息服务以及信息安全、隐私保护等方面给传统情报学带来的挑战,也分析了大数据的发展给情报学学科发展和情报事业发展带来的新机遇。最后文章也建议情报学与情报工作应利用既有优势和成果积极参与到大数据的研究和发展中去,以大数据的研究为契机实现情报学的大发展。
    关键词:大数据,情报学,情报事业
    DOI:10.3772/j.issn.1673—2286.2012.11.002

    随着信息通讯技术的不断发展、科学与整个社会对于计算的依赖,人们在日常工作和生活中使用计算机、手机以及其他各类技术设备的过程中,都产生出大量的数据,其规模和复杂性超越了传统技术手段所能处理的范围,这种情况催生了大数据(Big Data)相关的研究和发展,世界范围内IBM、Oracle等IT企业巨头纷纷投身于大数据业务。今年3月,美国奥巴马政府宣布启动“大数据研究和发展计划”,六个联邦政府部门和机构将投资2亿美元,用于提高从大量数据中访问、组织、收集、发现信息的工具和技术水平,这也意味着大数据技术从市场行为正式上升为美国的国家科技战略[1]。

    大数据的快速发展反映的是定量化的思维方式,这与我国情报界这些年一直倡导的“事实数据+工具方法+专家智慧”的情报研究思路与情报实践方法也不谋而合。尽管大数据问题的出现会给传统的情报学研究带来不少新问题、新挑战,但大数据实质上是对数据资源的开发利用,这也给情报学的发展带来了前所未有的战略机遇。

    1 大数据的内涵与价值
   
   
1.1 大数据的内涵
    一般认为,大数据是指数据规模与复杂性超过了传统关系数据库处理能力的数据[2,3],其特征可以概括为“3V”:即数量(Volume)、速度(Velocity)和多样(Variety)[4]。Volume指大数据容量和规模远超过传统数据;Velocity指速度,Oracle公司将其解释为数据产生的速度极快[5],IBM公司则将其理解为需要快速地对数据进行处理[6];Variety是指数据的类型多样,大数据包括不同结构、不同来源、不同媒体形态的各种数据。除3V之外,IBM公司和Oracle公司还指出大数据的特征还应该包括第四个V:价值(Value),意指大数据蕴含着重要的经济价值和社会价值。

    大数据的4V特征给数据获取、数据监护[7](Data Curation,又译为数据监管[8])、数据存储、数据搜索、数据共享、数据分析和数据可视化等领域的既有技术方法带来了极大挑战,因此大数据发展的最初阶段集中表现为大数据相关技术的研发和进步。

全文下载:
http://www.dlf.net.cn/manager/manage/photo/admin201211002.pdf


声明:本网站为非盈利网站,大多信息来源于网友推荐。如果作者或其他版权所有人认为违反了您的权益,请告知我们,我们会在24小时内删除。