首页 >教育信息化 >本期目录>正文

大数据时代教育隐私保护三重维度研究

来源:华中师范大学教育信息技术学院 作者:周孟 段智宸 上超望 发表于:2018.09.29  1073浏览

科学技术是一把双刃剑,大数据所引发的安全问题与其带来的价值同样引人注目。大量事实表明,大数据未被妥善处理会对用户的隐私造成极大的侵害。文章由此从教育数据流程、安全、利益相关者三个维度对大数据时代的教育隐私保护进行分析并提出教育隐私保护的策略。

一、教育大数据的隐私保护内涵

从表面上看教育大数据的隐私保护就是保护学生的学习行为数据、学习内容数据以及虚拟社交网络数据的安全。其实从深层次来看,教育大数据隐私保护范围的本质是保护学生对教育数据的信息采集知情权、信息所有权、信息采集选择权和信息控制权。

教育隐私权利主要包括:信息采集知情权、信息所有权和信息控制权。其中信息采集知情权是学生用户有权知道学校、政府或者第三方合作机构对自身哪些信息进行采集。信息所有权是指学生用户拥有这些数据,不仅是指本身数据,还有蕴藏在数据里面的信息。信息控制权是学生用户对相关数据在合理合法的前提下能够有增、删、改、查等权限。

二、教育隐私保护三维度分析

美国《通过教育数据挖掘和学习分析促进教与学》报告指出大数据在应用过程如果没有很好处理数据安全这一问题,大数据的应用将会举步维艰。文章针对教育大数据的隐私保护从以下几个维度进行阐述 (见图 1)。

1、隐私安全基本需求维度

数据的安全保护亟需提出一个有效的解决方案笔者将隐私安全基本需求分为机密性、完整性、可限制性、可用性、可审计和可控性六个部分。

机密性是指教育数据在收集到最终的数据销毁过程中,都要严格的保护措施,对无权访问的用户都要限制乃至禁止其对数据的操作,防止数据泄漏

完整性是指教育数据不能随意进行修改,保证数据在其生命周期中保持一致性

可限制性是允许某些特殊用户在教育数据操作许可下,有一定对教育数据操作的权限,但是越过这个许可就不能进行教育数据操作

可用性是指教育数据能够保证其是安全的,具有完整性、一致性,并且教育数据的所有者不会受到隐私伤害的前提下,其对科研教学等活动有实用价值

可审计是指教育平台或其他终端乃至服务器受到恶意访问对数据进行操作等,系统会对访问者信息进行记录,追溯到访问者,事态严重可追究其法律责任

可控性需要对教育数据的访问配置访问权限,过分的强调数据安全、隐私保护,大数据的研究就失去其本身的意义。

2、隐私等级设置维度

笔者将教育隐私设置为不开放、部分开放、限定对象开放、隐私限定以及完全开放五个等级。

不开放是指学生与教育教学无关的数据信息禁止教师等角色访问,如身份证号户籍等

部分开放是指学生所处地区、所在学校专业等能够支持科研的数据,但这些数据在对外开放时需要进行加密、数据屏蔽等操作,防止信息泄漏;

限定对象开放是指基于角色的访问,教师和主任分配角色,对角色进行授权;

隐私限定是指学生用户根据个人情况对个人数据进行隐私界定;

完全开放是指学生可以根据需求部分公布数据,供学生与学生之间、教师与学生之间的交流互动。

3、隐私安全风险维度

隐私安全风险是大数据在教育应用中非常重要的一环。主要基础设施、数据处理、数据管理、技术漏洞、数据可信度和其他风险六个方面,涉及面广,复杂程度高并且难以维护。

基础设施方面,庞大的数据使传统的存储、传输以及计算等设备难以支持。所以教育大数据中的主要基础设施一部分是学校教育信息化设备,一部分是第三方公司设备。校内的基础设施需要专业的人员进行维护与检测,第三方公司则需要签订三方协议保证数据的安全。

数据处理是指对教育数据通过一定的方法 (如聚类分析) 进行数据挖掘分析。教育数据本身没有价值,有价值的是数据之间的关系——由数据间的关系研究变量间相关关系,得出一定的结论。正是因为这种数据间的组合、分析导致用户信息还原追踪,使得用户隐私遭到侵犯。

数据管理,是指在实际的应用过程中,对检测、收集的数据进行管理维护。数据泄漏的风险一般由于管理不当造成,如管理员业务操作不熟练造成的非恶意的数据泄漏,也有经济利益促使造成恶意售卖学生用户数据等等。

技术漏洞教育大数据在不断发展,传统的技术难以确保系统流畅运行时数据的绝对安全维护的难度也将呈现非线性的增加。技术方面必须满足安全防护和数据的实时监控,防止黑客等恶意篡改盗取数据信息。

数据的可信度是指数据直接使用,以及部分人为对数据的干预,导致数据失真,进而影响整个数据库的安全。以学习时间为例,学生可以通过挂机等手段“骗过”计算机。

其他风险,笔者认为主要包括现有的政策法规、三方自律、个人隐私意识等方面。

、隐私保护策略

大数据行业已经崛起,数据安全也得到学者专家的关注教育领域中的数据安全同样需要引起足够的重视,因为数据安全是教育大数据可持续发展的必要条件。

1避免对用户信息无限制的采集和使用

大数据分析主要是利用数据变量间的相关关系,得出相关结果,这是建立在高价值密度和高数据量的前提下。

保证个人的合法权益。比如个人数据的知情权和控制权,哪些数据被收集被用于做什么等,组织机构有义务告知,并且用户有对数据的控制权,对一些数据如与学习关联不大的信息有权不提供等等。

培训相关工作人员的法律意识。保证在数据采集、存储、分析等环节中不会出现过度挖掘。

2通过立法规范方对用户隐私数据使用的行为

教育大数据通过数据分析信息整合与挖掘对所有师生用户开展了精准解读和个性化服务,也可以通过从这些数据获取身份信息进行金融诈骗或者通过贩卖数据给专业公司或机构来获取暴利。因此,完善教育信息数据安全保护策略已迫在眉睫。

1要明确收集个人教育数据保证个人对数据享有知情权和控制权。组织机构收集教育数据应根据工作职责需要来定,第三方合作机构收集需要经过学生等当事人的同意。

2确定教育数据收集范围比如学校与第三方机构合作,需要明确什么数据可以被收集,哪些数据不能或者需要进行加密匿名等处理后才能被收集,并且这些数据被收集时须经学生的同意。但是由于教育行业的特殊性,需要对教师赋予一定权利,对学生的某些数据收集有不告知权,比如对与家校合作的数据,与学生家长交流的数据,有些对于学生来说是敏感信息,不利于学生心理发展,教师有权利对学生的教育隐私数据的范围进行适度调整界定。

3)针对互联网环境下,建立健全互联网教育数据相关法律法规制度体系规定权利主体和义务主体,义务主体应包括政府、企业、事业单位、社会团体组织、个人等;规定侵害网络教育隐私权行为的种类以及侵权行为的认定;规定隐私权侵权责任的承担以及各种补救措施等等。

4注意立法与科技的结合现在,有的工作人员懂技术不懂法,有的懂法不懂技术,应加强立法者与技术人员的沟通,制定合理有效的网络法规。

3加强对采集数据的清洗

有效保障数据的安全,对所采集的数据进行筛选、删减、归类、标记、连接等操作也是非常必要的方法,同时最后对清洗的数据进行价值密度分析评估,完善清洗策略。学校应该根据自身的建设发展需要选择性收集数据,增加数据的完整性和准确性。数据共享时应清洗个人的数据关系,降低数据中的个人相关性,尤其是对个体利益的相关数据加以清洗。

4强化技术保护

最终教育隐私数据的保护是落到技术的实现,技术担任整个安全维护的主要角色。

1政府需要加大资金的投入在校内与校外网络之间设置安全措施,如防火墙、病毒库等防止校园网络受到攻击,维持其正常运作。

2强化校园一卡通的功能将学生信息进行电子认证,并对其资料进行统一的加密处理,采取公匙、私匙加密传送教育隐私数据的方法,在充分采集学生数据的同时,以确保学生身份和教育隐私数据信息的安全性。  

3)教育隐私数据采集标准化。简单来说,标准化是为了促进学校之间的数据交流,不仅能促进国家对于整个教育领域隐私数据的维护,还可以获得海量的数据。

4学生个人学习数据存入教育信息资源库对学生个人学习数据进行加密处理,以难识别编码方式编码资源库,进行备份处理,记录与安全隐私相关的操作,并且落实到绑定具体管理员基本信息。

文章从三个维度对大数据的隐私保护提出笔者的一些想法,旨在能够使得教育大数据在教育变革中发挥出更重要的作用。大数据在教育的应用中虽然存在问题亟需我们去解决,但是大数据在教育领域中作用是瑕不掩瑜的科技是一把双刃剑,没有百分百的权利也没有百分百的义务,剩下给我们的就是针对大数据在教育应用中存在的问题,提出切实的解决方案,使得大数据在教育领域中的效益最大化,这才是我们所追求的目标。(《广西广播电视大学学报》。本文系节选。

相关阅读