2013年开始,我国很多研究者开始开展大数据技术在教育领域的应用研究,徐鹏、沈学珺等多名学者都开始关注教育与大数据技术的关系和面临的挑战等问题。而从2014年开始,“教育大数据”首次作为文章关键词出现在众多研究文献中。

蒋东兴、王晓光等大量学者也将教育大数据研究的重点开始转向数据如何深度应用和推进教学改革等课题上。而在近年来教育数据应用和实践过程中,仍然存在着现有数据标准不统一、数据孤岛现象突出、数据资源利用不到位等问题。因此,本文所提校园大数据应用的研究内容主要包括以下几个方面。

(一)整合高校基础数据资源。对高校基础数据进行有效整合,建设各类标准数据库,包括学生信息、教师信息、一卡通消费数据、图书馆借阅数据等基础数据的整合。

(二)实现对全校各类信息资源的共享。打破学校内部各职能部门之间的信息壁垒。建立规范化的数据共享协同机制,优化资源在部门间的转换、调度。

(三)开展校园大数据深度应用。对各类学校教学和管理数据进行多维度的复杂应用、分析、挖掘和展示,将这些数据精细化地分析、系统化地归类,利用这些数据找到真正影响教育的重要因素,进而提供更加科学合理的教学指导和管理服务。

校园大数据分析平台

为研究解决以上关键问题,校园大数据分析平台采用多层架构,将大数据处理、数据交换与共享、基于关系型和统计型大数据存储、权限管理、大数据分析挖掘进行有效整合,贯通校园大数据管理和应用的各个环节,从而适应于多维异构环境下校园大数据处理要求,实现海量数据的高效管理。

如图1所示,在统一的分布式存储之上数据平台通过YARN(Hadoop 资源管理器)提供统一的资源管理调度,结合LDAP(Lightweight Directory AccessProtocol),轻量目录访问协议)提供完备的权限管理控制,不同的部门可以按需创建计算集群访问其授权数据,包括基于Spark计算框架的SQL类统计分析应用与数据挖掘类应用,以及基于MapReduce计算框架的应用等。

同时,平台通过使用Hbase结合SQL计算执行引擎,为用户提供基于SQL的高并发的查询以及分析能力。在数据导入与交换方面,数据平台提供多样的数据导入与交换形式,包括Sqoop提供与关系型数据库的数据交换以及Kafka消息队列集群接收实时流数据。

校园大数据分析平台具备以下大数据服务能力

(一)从不同异构数据源同步数据的能力,例如学校各部门系统的建设技术方案和技术路线不尽相同,需要有能力汇聚数据且方法简易可行;

(二)向异构数据源共享数据的能力,能适应学校各部门的不同需求,根据共享数据的分类用不同的方式共享数据;

(三)易于在线扩容的能力,在建设初期的投入成本可控,随着项目后期需求的增加,容易扩展系统容量和处理能力;

(四)处理海量数据分析的能力,例如能基于海量一卡通消费信息统计分析出学生的用餐、打水、洗澡等行为规律,从门禁数据中分析出行异常行为,以便更好地服务;

(五)进行海量数据挖掘的能力,例如能挖掘出具有异常行为特征的学生之间的关联关系和关键重点人群的联系网络图;

(六)海量数据高并发查询检索的能力,例如提供基础数据给学校各部门查询检索,能支持同时几千人在线查询;

(七)支持实时流数据接入与分析能力,例如根据门禁刷卡数据和人脸识别数据分析人流密度变化与预警;

(八)平台有开放性,能支持各种主流标准接口,例如标准SQL2003PL/SQL便于应用开发和应用移植。

依托校园大数据分析平台,本文构建了一种以学生日常行为的五个关键指标为分析维度的学生行为分析模型,并基于学生个性化行为序列节点分析方法开展校园大数据应用。

学生行为分析模型

本文所采用的学生个性化行为序列节点分析方法首先以个性心理学和学习分析理论等为基础,构建学生行为分析模型,并通过基于频繁模式树的数据挖掘算法分析挖掘出每一位学生的知识掌握水平、学习方式偏好、课外兴趣、娱乐生活等个性化情况,从而实现更加个性化的校园管理和服务。具体来说,通过对中、美、英三国高校学生事务管理的对比研究,依托个性心理学、学习分析理论和大学生事务管理学等相关理论,我们构建了多维时空下基于校园时空大数据的学生行为分析模型(如图2所示)


该模型涵盖学生在校期间的吃、住、行、学、娱等个人行为关键信息,从而为教育、服务和管理等高校学生事务管理提供科学的数据支撑。学生个性化行为序列节点分析法则是基于该模型中的学生基本信息、课堂学习、课外学习、校园生活、娱乐五个维度来评估和分析每一名学生的日常行为情况,依托相关的系统数据库,对学生行为信息进行分类汇聚,并运用校园大数据技术进行离散点分析和聚类分析,从而形成实现更加科学合理的校园综合治理。

如表1所示,学生行为分析模型中的每个分析维度都有相应的评价指标,同时通过对应数据库提供数据支撑。以学生课堂学习维度为例,依托选课数据、上课数据、作业数据、课程平时成绩、课程期末成绩和互动交流评价数据等数据资源,将学生知识掌握水平、综合素质和成绩评价等作为课堂学习行为分析项。其中,学生的知识掌握水平则重点分析学生对于所学课程的掌握和应用的能力和水平,兼顾其图书借阅信息的分析;综合素质则包含学生科研能力、创新能力、艺术修养、心理健康、班级活动等。学生的成绩评价基于课程平时成绩、期末成绩、试验成绩以及实习成绩综合评判。通过对学生课堂学习行为的分析,将具有相同学习兴趣和能力水平的学生进行聚类,从而为不同民族、不同学习偏好、不同能力水平的学生提供差异化、个性化的课堂教学辅导服务、学习推荐以及校园优质服务。



应用分析

通过在北京某高校开展智慧校园建设的实践,我们以该校良乡校区作为试验对象,采用本文所提出的基于学生行为分析模型的校园大数据分析方法,开展校园大数据应用。通过整合该校相关数据资源(如表2所示),我们开展了以下几个方面高校智慧校园教育大数据的挖掘分析与应用。


()为学校发展决策提供科学依据

通过对该校的历年高基表数据进行提取、清洗、去噪、整合等,形成能够支持高基表数据分析应用的数据仓库,为校领导日常管理及对外信息发布提供统一、规范、准确、及时的统计数据,为学校双一流学科建设、高层次人才培养、海外人才引进、专业课程设置、重大科研创新等战略管理决策提供数据支撑(如图3所示)

以近10年教职工职称变化情况为例(如图4所示),通过大数据分析可以发现,该校专任教师数量逐年增加,教辅人员及工勤人员逐年递减,这要求学校应加大对科研教育方面的投入,做好教师教育的保障工作。


()实现科学化校园管理和服务

通过对该校1400多万条一卡通消费流水数据进行数据挖掘和关联分析(如图5所示),可以从学生消费频次、图书馆刷卡次数、学生教室刷卡打水时间、宿舍门禁刷卡数据等一卡通的海量数据中挖掘分析出一个学生的在校和外出习惯、图书借阅、晚自习时间等有价值的行为信息,使学校对学生的学习生活情况有了更加理性、清晰的认识,引导高校形成健康科学的学生培养模式和教学生活管理方式。

以该校学生生活习惯分析结果为例,学校可在学生早餐、中餐、晚餐和打水洗澡的高峰时段,通过增加窗口、延长营业时间、设立人流疏导屏等方式来减少人员聚集、等待时间过长等现象。此外,我们基于门禁数据对学生夜间未按时归校、长时间离校未归等异常情况进行预警;基于学生一卡通消费数据分析出受欢迎菜品、餐厅及窗口等学生就餐喜好情况,从而为相关食堂改进提供更加科学合理的建议。

()个性化的教学和管理

我们通过对该校师生教学互动和学生学习过程的大数据进行数据挖掘和关联分析,挖掘分析出一个学生的学习生活行为信息,勾勒出每一名学生的“个性化行为画像”(如图6所示),从而指导学校按照依据每一名学生的“个性化行为画像”,针对每一名学生提供个性化的教学和管理,不断优化完善教学方式和指导方法。


()贫困学生分析与资助

在个性化管理服务方面,通过校园大数据技术,我们开展了自动筛选受资助对象等大数据应用服务,如图7所示。在该应用实践中,我们通过设定相应的受资助对象寻找策略,基于该校61961名学生在去年3月至5月的一卡通消费数据,依托两个关键参数(消费金额小于10元,消费次数大于10) 找寻该校受资助对象。

通过数据分析,可以发现345月份都是刷卡消费的金额小于等于10元且消费总次数大于10次为1人,因此推测受资助对象为生命科学学院的一名专业硕士。以此为依据,通过学校学生工作处对该名学生的情况进行核实,开展诸如经济资助、心理疏导等关爱行动,提供勤工助学岗位,避免学生因生活费用不足引起的就读困难或心理问题的发生。通过以上措施,该名贫困生的学习生活状况得到了很大的改善。

在该校智慧校园建设和实践过程中,学校也逐步建立了一套完整的校园数据应用管理制度体系,同时明确由数字校园管理中心负责校园大数据的汇聚、共享和应用管理工作,其它各部门和院系则按权限开展相关应用工作。这些规章制度的建立,也为校园教育大数据的应用提供了有力的制度保障。

经在该校应用试验效果看,基于学生行为分析模型的高校智慧校园教育大数据应用值得在教育领域普遍推广。

结语

众多高校都把智慧校园作为其信息化建设的重点内容,校园大数据技术作为最重要的技术支撑,可有效提升校园信息化建设水平和建设效果。本文所提出的基于学生行为分析模型的校园大数据应用,对海量、异构、多维的校园数据进行清洗、整合、挖掘和应用,从中提取出潜在的、有价值、极具潜在应用价值的信息,为学校的教学、科研、后勤、管理、安保等各项工作提供科学的数据支撑,这对于实现教育强国梦想具有重要的现实意义。

(作者:李有增、曾浩,首都师范大学、中国航天科技集团有限公司物联网技术应用研究院;来源:《中国电化教育》。本文系节选。)

声明:本网站转载文章出于非商业性的教育和科研目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系我们,我们会予以更改或删除相关文章,保证您的权利。