在北美高校图书馆界,大数据智能可视化已经在多方面引发了广泛关注,无论是在数字人文研究、服务数据挖掘,还是服务评估方面,都获得了快速发展。大数据智能可视化正在成为北美高校图书馆转型发展中不可忽视的新型驱动力。

一、大数据智能可视化在北美高校图书馆的应用领域

1、在数字人文研究方面的应用

人文社会学科领域中的大量文献资料已经实现数字化,学者们将数字计算技术、计算机技术引入相关研究中,改变传统研究范式并逐渐形成一个新的研究领域——数字人文。丰富的馆藏资源、成熟的数据处理技术及保存传播历史文化的社会功能奠定了高校图书馆在数字人文研究领域的特殊地位。

据美国图书馆协会统计,2012年全世界设立的近 100 所数字人文中心约一半在美国,美国一半的数字人文中心设立在图书馆,另外还有大约四分之一与图书馆联合创立。北美高校图书馆在积极参与数字人文项目研究的同时,依托各类数字馆藏资源、开放存取技术及大数据智能可视化工具开展了大量有益的探索和实践。

1)创新研究方法,丰富研究成果展示形式。

除了数字化的文献、档案资源外,在数字人文研究领域中,随着Twitter等社交平台的大力发展,大量鲜活的正在发生的社会事件也成为其重要的研究对象。北美高校图书馆员利用大数据智能可视化技术充分挖掘社交网络资源和数字人文平台上的开放存储信息,通过资源组织、数据加工、可视化分析、演示等实践工作参与到跨学科、跨部门甚至跨国界的协同服务中,为大数据时代高校图书馆主动创新研究方法、丰富研究成果展示做出了有益的尝试。

马里兰大学的人文技术研究所是由该校图书馆和艺术与人文学院共同创建的数字人文平台研究机构。平台支持的“记录当下”是一个为社会网络媒体档案信息提供基于学术角度的分析、存储并提供访问和利用的数字人文研究项目。

馆员从Twitter、Web 等公共网络收集社会事件元数据信息,运用D3.js 等多种大数据分析和智能可视化工具,通过深度标引、采集知识本体、关联元数据等数据资源组织方式,实现社会事件中的时空关系可视化、社会关系可视化、词频主题分析可视化等。

馆员不仅承担数据资源收集与保障者的角色,还提供支持数字学术研究的服务,并丰富研究成果的展示形式,不断提升用户使用满意度。此外,据邓要然等学者的调查统计,美国排在前100名的高校拥有14个运作成熟稳定的著名数字人文中心,在研项目共计189个,其中开展了大数据智能可视化与图形化的项目约30个,涉及文学、社会学、语言学、人类学和考古学等多个学科研究领域。

2)促进大数据时代高校图书馆功能转型

自20 世纪90 年代开始的数字图书馆建设积累了大量的数字化资源,经过20 余年的发展,高校图书馆在利用互联网技术进行资源描述、知识组织、移动应用等智慧服务方面的能力不断提升,各类新的数字信息技术都会第一时间在高校图书馆得到应用,如云计算技术、语义网技术、大数据技术等。大数据智能可视化技术更是获得了新的发展方向,在传统文本分析的基础之上,大数据智能可视化技术的时空分析、社会关系分析等已经成为众多高校图书馆数字人文平台的基本服务功能和常用研究方法。

马里兰大学的数字人文项目“改变加勒比黑人的世界”,建立了一个描述加勒比地区黑人劳工1903 — 1920 年移民情况的数据平台。馆员运用D3.js 和GIS 等大数据智能可视化工具对性别、人种、迁移地理分布等大数据信息进行智能可视化展示,方便用户结合历史背景充分了解黑人劳工迁移的历史过程。马里兰大学图书馆不仅提供原始数字文献资源,而且提供编程支持、大数据智能可视化团队及数据分析挖掘工具(SPSS),还依靠知识机构库的不断积累,为更多的研究人员提供知识共享服务。高校数字图书馆正逐步转型成为馆员深度参与的大数据时代数字人文实验室。

2、在服务数据挖掘方面的应用

大数据时代,高校图书馆各种服务数据不仅规模剧增,而且数据类型更加多元化,数据结构更加丰富,数据关联性更加复杂。大数据智能可视化充分挖掘其背后的价值,为知识服务的传播、共享和利用提供有力支持。

俄亥俄州立大学是美国历史悠久的公立大学之一,被誉为“公立常春藤”。该校图书馆由20余个分馆组成,各类馆藏资源丰富,与全美各地公共图书馆进行网络联机,提供馆际互借服务。2013年该馆成立了一支5人项目组,利用大数据智能可视化工具开展馆际互借服务大数据智能可视化研究。项目组由资源评估馆员、馆际互借负责人、学科馆员共同组成。

项目组首先以服务开展过程为中心收集该馆各年度馆际互借服务的大数据,采用问答方式分解服务流程并理顺馆际互借业务的维度及逻辑关系。在此基础上通过大数据智能可视化工具Tableau 的仪表盘表述各类服务维度之间的逻辑关系,形成可视化图表,并将此过程开发成为一个可嵌入Web 的服务项目,方便馆员或其他研究人员随时查询。

项目组还利用Tableau 工具的地理趋势分析功能,创建不同地区馆藏流通的交互式地图,利用地图筛选可视化视图功能,帮助馆员了解更多的资源流通细节,迅速锁定需要关注的区域、资源类型、资源流向等问题,为该馆馆际互借服务提供技术和决策支持。

3、在服务评估方面的应用

大数据时代,高校图书馆的各类服务评估数据具有数量庞大、结构关系复杂、类型多样等特点,传统方式的折线图、饼状图、散点图、气泡图等图形统计工具,只能静态地表达资源使用、服务负载、阅读行为等一元信息。而不能从动态、全面的角度反映高校图书馆评估大数据的知识关联和数据价值。大数据智能可视化的数据采集与分析处理优势,为大数据环境下高校图书馆馆藏资源使用、服务质量评估等提供了更科学的支持。

(1) 电子资源使用评估的大数据智能可视化

马萨诸塞大学阿默斯特分校图书馆服务于全校28 000余名本科生、研究生和1 170 多名教职科研人员,每年电子资源建设经费约6 000 000 美元,下属有5个分馆。2012年起,将大数据智能可视化分析技术应用于该馆的电子资源评估项目COUNTER和MINES当中。COUNTER和MINES 两种电子资源测评工具都是从用户角度开展评估。C O U N T E R 的数据收割模式采用固定的报告格式。

MINES 则通过随机抽取在线用户,在指定时间内完成1份包含5个有关图书馆电子资源使用方面问题的选择问卷。

由于MINES采用了更细的信息粒度且没有固定的标准,每次测试都需要维护、操作大量的电子表格,因此,其数据整理、挖掘的负担大,工作效率低,所以阿默斯特分校图书馆仅在2009 年实施过一次MINES 测试。同时鉴于电子资源使用评估的长效性和即时性要求,在选择大数据智能可视化工具时,交互性强、易操作和人性化的界面成为选择的重要标准。

经过大量的比对分析,该馆选择了Tableau工具,借助其强大的分析能力和易操作性,现阿默斯特分校图书馆在完成对电子资源C O U N T E R 和M I N E S 测试的同时,还能够轻松实现海量测试结果的大数据智能可视化展示,方便图书馆直观地了解评估结果。

(2)服务质量测评的大数据智能可视化

英属哥伦比亚大学是加拿大最著名的公立研究型大学,属于“加拿大常春藤联盟”,该校图书馆也是一所具有悠久历史和丰富数字馆藏的多分馆综合性研究型高校图书馆。LibQUAL +是一套基于征集、追踪、了解用户对图书馆服务质量意见,并以此为据进行服务质量改进的专业质量评估工具。作为高校图书馆及用户之间沟通的纽带,它通过对评估数据的纵向、横向对比借鉴,总结服务最佳实践模型,推动服务质量的持续优化。在ARL 的推广和组织下,全球1 200 多个图书馆都在使用LibQUAL +评估工具。

2012年起,英属哥伦比亚大学图书馆评估馆员Jeremy开始着手大数据智能可视化在该馆LibQUAL + 评估中的应用研究。他利用大数据智能可视化工具Tableau 对2007年、2010 年及2013 年的LibQUAL + 评估数据进行纵向可视化演示,实现了对“最低容忍值在理想预期值间的区域”“用户实际感知估值”等多种较抽象评估指标的同框对比分析。将该馆在l4 个服务领域内的评估信息、服务差距整合在一张图表中,轻松实现了对LibQUAL + 评估数据的动态智能可视化展示,为该校图书馆改进服务工作提供了可靠的数据基础支持。

二、大数据智能可视化在北美高校图书馆应用的特征分析及启示

1、积极开展大数据智能可视化研究,注重跨学科、跨领域的研究型合作。

大数据时代,数据正在取代传统文献成为科学探索的素材和媒介。通过智能可视化对大数据价值的挖掘分析成为北美高校图书馆提升自身核心竞争力、优化学科服务结构、服务转型发展的重要途径。北美高校图书馆通过大数据智能可视化技术积极参与并主动发起跨学科、跨领域的研究型合作。

杜克大学图书馆系统地开展了大数据分析与智能可视化服务,在图书馆网站主页建立面向不同学科的数据咨询、数据智能可视化等项目模块,并由学科馆员联合专业数据分析人员组成的工作组专门提供在线咨询服务。

马里兰大学图书馆开展的数字人文项目研究,在平台基础之上提供各类分析处理和大数据智能可视化工具,开发增值服务,吸引更多跨学科、跨领域甚至跨国界的学者参与到研究工作中。

我国高校图书馆相关研究开展较少,国内高校图书馆应充分利用近年来在知识机构库中积累的大量数字资源,充分发挥馆员在知识组织方面的专业特长,以更加开放的心态关注技术领域的发展,注重大数据智能可视化技术、大数据分析工具的应用,积极开展数字人文等优化学科服务结构的研究工作。

2、注重图书馆员大数据智能可视化能力的培养和训练

熟练掌握并灵活运用大数据分析和智能可视化技术是大数据时代高校图书馆员信息设计能力的新要求。

俄亥俄州立大学图书馆要求数据分析馆员在对业务流程充分调研和理解分析的基础之上,加强功能性思维意识的培养和训练,不断提高信息可视化界面的设计能力,实现对各项复杂业务流程功能与内容的智能化、精准化和可视化的完美呈现。

亚利桑那州立大学图书馆和卡尔顿大学图书馆均要求其从事数据管理服务的馆员具有较高的大数据智能可视化技术的应用能力,熟练掌握主流大数据智能可视化工具,打破传统统计工具以数据为中心的分析思维模式,形成以用户和业务活动为中心的数据价值挖掘模式。

近年来,我国高校图书馆也非常注重馆员数据分析能力的培养与提高,但较多侧重于要求馆员掌握数据挖掘技术、工具的操作使用技能。北美高校图书馆对馆员在信息可视化的设计能力方面的培养和训练值得国内高校图书馆借鉴与学习。

3、注重建设虚拟的和物理的学术及实践交流社区

我国高校图书馆应借鉴学习北美高校图书馆在大力开展自身大数据价值挖掘的同时,积极投身到各种相关虚拟社区和物理平台的交流活动中的实践经验,如利用美国研究图书馆协会等学术机构创建的各类虚拟社区和物理平台,通过学术专题会议、在线联盟和Workshop 等多种途径分享传播经验,加强交流创新,不断推进地区性的发展和共同进步。

(作者:张宸、吴廷照、戴平,四川大学图书馆;Ralph B.Gabbard、刘倩,美国亚利桑那州立大学图书馆。本文系节选,选自《图书馆建设》。)

声明:本网站转载文章出于非商业性的教育和科研目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系我们,我们会予以更改或删除相关文章,保证您的权利。