首页 >教育信息化 >本期目录>正文

基于知识图谱和LightGBM的线上教育分析

来源:本站 作者:皮建宏 苏丽敏 杨晓慧 河南大学数学与统计学院 发表于:2022.06.30  283浏览

皮建宏

/皮建宏 河南大学数学与统计学院研究生

苏丽敏 河南大学数学与统计学院讲师

杨晓慧 河南大学数学与统计学院教授


一、研究背景

十八大以来,党中央高度重视教育问题,习近平总书记多次强调发展教育的重要意义,指明教育强国的发展方向。随着互联网的发展,线上教育也逐渐得到认可,成为重要的教学方式。2020年初新冠疫情暴发,为阻隔疫情向校园传播,教育部发布通知要求春季学期延期开学,教师可以通过网络平台指导学生统筹利用各科学习资源。

疫情发生给线上教育带来怎样的影响,研究热点发生了如何的变化,目前在线教育的形式,教师和研究者应该着重关注哪些方面,这些都是需要我们探讨和总结的问题。本文旨在运用知识图谱可视化和LightGBM算法对线上教育进行初步分析,以期发现线上教育的关注点和影响线上教育学生成绩的因素,探讨如何进一步提升线上教育的学习效果。

二、研究方法

1CiteSpace工具

文章采用CiteSpace可视化工具分析线上教育的演进方向和研究热点。CiteSpace是由美国德雷塞尔大学教授陈超美运用JAVA语言开发的知识图谱软件,可以通过可视化的手段来呈现科学知识的结构、规律和分布情况。

2LightGBM算法

LightGBM(Light Gradient Boosting Machine[1]算法是2016年微软提出的一个实现GBDTGradient Boosting Decision Tree)思想的机器学习算法。本文所选用的数据集包含不同属性的变量,考虑到LightGBM在处理分类型变量上的优势,用其来预测线上教育学生水平并对影响学习效果的因素进行排序,可以进行学业预判,提升在线学习效果。

三、基于知识图谱的线上教育疫情前后对比分析

1、数据来源

数据来源于CNKI中国知网数据库,检索的关键词设定为“线上教育”,检索时间设为200711日至20211231日。一共检索到2449篇文献,除去无效文献,最终选定疫情之前275篇、疫情之后1026篇共1301篇进行可视化分析。

2、文献计量分析

1)发文量分析

对于不同的学科领域,该领域所发表的论文及其他成果的数量能够衡量其发展趋势。由图1发文趋势图可以看出,2012年之前线上教育发文基本呈水平状态,关注程度不高;2012年至2019年,电子设备逐渐完善、新兴科技与教育事业的结合,使得线上教育的研究平稳增长;2020年疫情暴发,当年关于线上教育研究的文献数量达到顶峰,而2021年有所回落。以上表明疫情事件推动了线上教育的发展,且线上教育与时代进步、科技发展以及重大公共卫生事件都有关联。

1线上教育研究期刊发文趋势图

2)高产出作者及合作分析

图2疫情之前线上教育研究作者共现图

图3疫情之后线上教育研究作者共现图

核心作者是指在本领域中进行学术研究发文数量多且贡献较大的研究者,衡量共现图中节点大小的指标为发文量。结合图2和图3分析,可以看出研究线上教育的作者合作较少,作者之间协同研究程度较低,在疫情之后核心作者增多,但疫情之前的核心作者并没有在疫情后持续关注教育发展,没有形成连续的体系,此后可以加强交流合作进行持续研究。

3、疫情前后研究热点分析

1)关键词共现对比分析

关键词是一篇文献中的重点词汇,能够简单明了地表达作者的观点和主要研究方向。通过CiteSpace运行后得出关键词共现图。关键词的大小表示词出现的频率,连线表示共现关系,线条粗细表示相互之间的关系强弱。

图4疫情之前关键词共现图

图5疫情之后关键词共现图

疫情之前由图4可以看出线上教育的热点集中在在线教育平台、互联网+、教学改革、K12、混合式教学、教育信息化等。疫情发生之后由图5可以看出线上教育的热点集中在疫情防控、家园共育、自主学习以及教育模式。疫情发生前后关于线上教育的研究存在相同之处,也有明显的差异:相同之处在于都比较关注教育革新问题,探讨线上教育的模式转变;不同之处在于疫情发生之后线上教育更加普遍,关注点在于自主学习及家园共育。研究热点发生明显转变,探讨的核心是提升线上教育学习的效果,因此提高学生自主学习能力是十分必要的,同时家长也应起到监督引导作用。

2)关键词时区图发展趋势分析

通过图6关键词时区图分析发展趋势,反映了不同时段的研究热点及推进过程。线上教育的发展路径是:早期是线上教育的提出和发展;中期经历了对线上教育的模式改革,探讨了多种方式结合的教学开展方法;近期是疫情防控背景下线上教育的开展。

6关键词时区图

4、线上教育进展

疫情发生以来,线上授课的方式受到青睐,通过知识图谱也可以看出热点聚焦在自主学习和家园共育。网上教学形式多样,因此在进行线上学习时,自主显得较为重要。未来线上教育将会进一步与传统教育融合发展,在这场教育变革中,家长起到了重要的监督作用。总结线上教育的核心在于提升学习效果。

四、基于LightGBM算法的线上教育学习效果影响因素分析

1、数据来源

前面运用CiteSpace可视化软件对线上教育的文献进行梳理分析,探讨了线上教育的研究热点,2020年疫情期间的全面线上教学加速了信息技术的渗透,但也触发了更多关于学习者、信息技术以及学习效果之间本质关系的反思与探讨[2]。如何提升学习效果是大家较为关注的重点,接下来使用e-Learning学业成绩数据集(x API-Edu-Data,数据来源:https://www.kaggle.com/aljarah/x API-Edu-Data)探讨线上教育学习中影响学习效果的因素。数据集共有480条记录和16个行为变量,根据变量属性划分为:个人基本特征、学习行为特征、父母行为特征、学习背景特征。依据最终成绩将学习者划分为三个层次,70分以下为L低水平,70~89分为M中等水平 ,90分以上为H高水平。

2、实验设计

文章采用LightGBM算法可以直接处理分类型变量,模型选取五分之四作为训练集,其余作为测试集,采用5折交叉验证,利用网格搜索的方法寻求最优的参数,如表1所示。

1 LightGBM算法参数设置表

3、结果分析

实验结果显示模型对学生学习水平的分类准确率为83.33%,其准确率高于决策树、逻辑回归、随机森林等,说明运用LightGBM算法来预判学生的学习水平有较强的可信度。此外LightGBM算法可以对变量的重要性做出排名,由图7可以看出,对线上教育学生成绩影响较大的因素有查看资源次数、举手次数、查看公告次数、学生缺课天数、讨论情况、所学科目、学生由谁负责等,将变量综合来看影响最大的是学习行为特征。

7特征重要性排序图

1)学习行为对成绩的影响

数据集中学习行为特征是四个数值型变量,因此可以探索相关关系情况。对变量进行处理,添加一个包含加权变量的新列,并命名为success表示学习效果,分别计算各变量之间的相关系数,并进行可视化展示。由图8相关系数热图可以明显地从颜色变化看出,学习效果与学习行为之间存在关系,与VisITedResources(访问资源)之间关系最大,其次是raisedhands(举手次数)、AnnouncementsView(查看公告)以及Discussion(课堂讨论)。因此要调动学生的学习积极性,养成良好的学习行为习惯。

8相关系数热图

2)父母行为对学生成绩的影响

通过图9可以看出父母参与学校问卷调查情况影响学生的成绩。因此要转变传统思想,清晰定位家长的角色,增强家长的积极主动性,推动线上教育高效率开展。家长也要充分认识到自己的举动对子女的影响,加强陪伴并进行有效沟通,为子女的教育赋能。

9父母参与问卷调查情况图

3)学习背景对学生成绩的影响

在学习背景特征中,缺课天数对学习水平影响最大。通过图10可以直观看出缺课超过7天的学生多是处于低水平和中等水平。学生缺课将影响到新知识的吸收,无法做好前后衔接,对学习成绩影响较大。因此需要家校合作,共同管理学生。

10学生缺课情况图

4)个人基本特征对学生成绩的影响

个人基本特征整体对学习水平的影响不大,而其中学生由谁负责这一变量对学习有轻微影响。通过图11可以看出,在本数据集中父亲负责孩子的学习情况更多,但是母亲负责孩子的学习效果会更好。在实际教育中,父母双方都要注重给予学习陪伴。

11父母负责情况图

五、结语

本文运用CiteSpace可视化软件工具,对中国知网数据库中线上教育的文献期刊进行可视化分析,梳理出线上教育的研究热点和趋势。根据LightGBM算法对影响学生在线学习水平的变量进行排序,依据变量重要性排名以及分类预测结果可以实施学业预警。

结合研究热点、当前背景和数据分析,对线上教育的推进提出以下建议:第一,激发学习动机,增加学习投入。学习行为与学习投入密切相关,因此要引导学生建立自主学习的意识。第二,转变传统思想,增强家校合作。家长在线上教育中扮演了重要的角色,要增强家长的积极主动性,推动线上教育高效率开展。第三,管控课堂纪律,营造良好氛围,保证学生能够高效学习。第四,提升教师信息化教学能力。

展望未来,要深刻把握互联网信息及科技蓬勃发展的时代趋势,全面深化信息技术与教育教学的深度融合,全面打造优质的线上教育课程[3]

参考文献:

[1]Kadiyala A, Kumar A. Applications of Python to Evaluate the Performance of Decisiontree - Based Boosting Algorithms [J]. Environmental Progress & Sustainable Energy, 2018, (37):618-623 .

[2]郭娇.数字鸿沟的演变: 从网络接入到心智投入——基于疫情期间大学生在线学习的调查[J].华东师范大学学报(教育科学版), 2021, 39(07): 16-26.

[3]刘振天,刘强.在线教学如何助力高校课堂革命?——疫情之下大规模在线教学行动的理性认知[J].华东师范大学学报,2020, 38(07), 31-41.

相关阅读