用户画像技术助推高校精准思政教育路径研究

(浙江传媒学院,浙江杭州 310018) 赵云旎

摘要:高校精准思政基于对学生特点的精准把握。用户画像技术通过学生数据信息的采集、清洗、加工、重构,完成对学生个体或者特定群体的数字画像,并依据不同思政工作场景呈现给思政工作者,为高校精准思政提供数据支持和决策依据。因此,高校要构建大学生全量数据中心系统、实时动态描绘学生画像、精准供给思政内容、精准选择思政方法、精准评估思政效果,进而实现从数据到大数据、从定性量化到过程优化、从差异化指导到个性化成长的高校精准思政的目标。

关键词:用户画像;大数据;精准思政

引言:

大数据时代改变了人类生产、生活方式,也加快了教育行业的系统性革新和数字化重塑,更催生了高校思政教育工作新的模式——精准思政。精准思维是以习近平同志为核心的党中央治国理政的鲜明特征。《教育部思想政治工作司2020 年工作要点》九次提到了“精准”一词:“精准思政” “精准滴灌”“精准供给能力”“提升问题精准把握、政策精准制定、队伍精准建设、责任精准落实、成效精准评价能力”等。在以大数据为基础的人工智能时代,用户画像技术使用一些无结构约束的关键词或标注词来描述一个信息的属性和内容,带有明显的用户兴趣信息,为个性化推荐提供了重要的指导作用。在教育领域,用户画像技术可以通过系统地收集与分析学生的学习、生活等行为信息数据,抽象出学生个人或者特定群体的标签和特性,实现从数据到大数据再到定性信息量化的目标,从而为高校精准思政提供数据支持,助推高校精准思政有效性和针对性路径探索。

一、数据采集:大学生行为端数据来源

党的十九届四中全会首次提出将“数据”作为生产要素,反映了在大数据时代下,数据已然成为新的生产资料,全方位重构了我们生活的社会空间。在数字化高校进程中,当代大学生的校园生活必然产生在校行为端的多源数据,如:考勤打卡系统的考勤记录、奖学金系统中的绩点数据和排名情况等学习数据;一卡通系统中食堂消费记录、资助系统的申请记录、财务系统学费缴纳情况等经济信息;网络登录频率、时长等校园网络行为数据;运动打卡、体育场馆预约、体质测试水平、校医院挂号记录、心理普测结果、心理咨询预约等身心健康状况数据。这些多源的动态数据和学生的静态信息一起勾勒出了大学生在校行为轨迹,展现出学生的个体属性、个性标签、行为趋向,为高校精准思政提供了更具有区分性和动态性的教育对象、教育场景和教育目标。

如何全面采集大学生在校行为端数据是高校学生用户画像技术的前提。一是以事推进,从解决学生报道入学、毕业离校再到在校学习生活的高频事务,经每一个具体问题的解决,推进学工、教务、后勤、安保等重点部门实现数据地全流程实时融通,实现学生信息从碎片到系统、从相对静止到全域流通,完成从数据到大数据的转型升级。二是抓住关键环节。以学校考勤系统为核心,融合挂科、补考、平时作业和成绩等数据,建立每个学生的学业预警系统,针对性推送给学生、辅导员、管理者等;以学生心理陪伴系统为核心,联合学业预警、校园消费记录、门禁打卡、就医记录等动态关注学生心理状况,精准识别心理危机。三是访谈录入。针对一些无法产生数据记录的、非结构化的学生信息,如网络参与的内容、社交习惯、家庭沟通、室友关系等,要设计针对性的访谈提纲或者调查问卷,通过个体访谈或者问卷调查得到相关数据,并在数据系统中录入,用以完善大学生用户画像可靠的数据库。

二、数据清洗:数据标签化

以学生校园行为为逻辑基础而产生的行为端数据具有海量化、碎片性、无序性等特点,无法直接用于学生画像。数据标签化就是在清洗无效数据的基础上,对原始数据进行逐级分析,从事实罗列、归纳总结,再到动态联动分析,逐步从相关的事实数据中抽象出定性化标签模型。

一级分析是指对学生原始数据进行列表式分析,通过计算公式罗列出客观事实,得出初步结论。如设计一个成绩计算公式,高于 90 分的科目成绩定义为优秀,80-90 定义为良好,60-79 为合格,60 分以下为不合格,从而总结出各科成绩高低、绩点高低、班级年级排名前后等。一级分析具有数据多元性、客观性、直接性等特点,思政工作者能够通过一级分析了解个体或者特定群体在各数据模块的基本情况。

二级分析是指在一级分析的基础上,通过计算公式对事实数据和初步结论进行归纳总结,得到二级标签。如通过总绩点高低、各科平均分高低、班级排名等总结出“学霸”“理科强”“偏科”等学业标签;通过体质健康分数、锻炼强度、就医次数等归纳出“体质差”“偏胖”“体能差”等健康标签。二级分析是在原始数据基础上的总结和归纳,具有抽象性的特征,思政工作者能够通过二级分析了解个体或者特定群体的基本特点。

三级分析是指在一级和二级分析的基础上,对不同模块的数据结论和归纳结果进行横向联动和纵向动态的分析。如在学习成绩数据模块中,通过学期等纵向数据得到个体学业的动态变化,通过与考勤数据模块、体育健康数据模块等联动分析,得出近三个学期体质健康下降、心理动态波动与成绩连续下滑之间的关系;身体疾病与心理问题的联动分析;学业成绩与请假次数的联动分析等。三级分析展示了学生多方位、全过程的数据形象,思政工作者能够由此得出个体或者特定群体在各方面的基本画像以及更高层次的目标性结论。

三、数据重构:学生成长数字模型

对原始数据完成三级分析能够得到高校学生在各数据模块的基本画像,完成对个体或特定群体的标签化描述,但这些标签仍具有杂乱性、分散性等特点。从用户画像技术助推高校精准思政的角度上来看,高校学生画像应是标签化描述在某个思政教育场景的聚焦。也就是说,我们需要通过学生成长数字模型的构建,对各模块数据的分析结论进行数据重构,从而根据不同的思政教育场景需求得出相应的学生画像。

图 1 学生数字画像过程

学生成长数字模型是对学生各模块数据的分析结论进行数据重构,从而完成学生画像的主要工具模型,它建立在学生成长维度建构的基础上。亓俊忠等从构建大数据大学生成长质量评价体系角度出发,用学校可攫取的数据类别来界定学生成长维度。王英姿认为收集高校学生信息具体内容可分为五类 :学习特征、生活特征、行为特征、兴趣爱好和人际交往。笔者认为,高校学生成长维度的核心是如何围绕思政工作需求来归纳设置学生在学期间所产生的所有行为痕迹和意志状态,它依托于学生相关数据信息和数据片段的收集。因此学生成长数字模型应分为学业、身心健康、生活、社交、网络、发展六个方面,它既来源于学生自行产生的数据,又服务于学生的数字画像。

学生成长数字模型六个方面的结论来源于不同数据模块标签的整合和联动。如学业维度包括学生成绩系统、选课系统、考勤系统、科研系统、毕业论文系统、学科竞赛系统和评奖评优系统等;身心健康维度包括体质测试系统、校园运动记录、体育成绩、心理普测和心理咨询预约系统等;生活维度包括学生基本信息、食堂消费记录、寝室门禁系统、水电网络费用缴纳系统、经济困难生管理系统、勤工助学系统等;社交维度包括担任职务情况、谈心谈话系统、室友关系、出行频率、班级活动出勤等;网络维度包括网络登录次数时长、网络费用、网络表达和参与特点等;发展维度包括学业生涯系统、职业生涯系统等。其中社交、网络等维度中的非结构化信息需要通过思政工作者人为访谈录入,因此应该接入以非结构化信息录入为核心的学生成长陪伴系统。

四、数据可视化:学生画像的呈现

用户画像作为一种计算方式,无法直接为用户提供需要的信息,需要通过数据可视化等技术将数据结论呈现为可视化图表,从而实现直观、全面、动态的信息呈现。数据可视化是用户画像技术在应用层面的延申。通过数据可视化与 web 开发等技术结合,将不同结构、不同分类的学生数据转化为适当的可视化图表,为思政工作者提供快速直观的了解学生现状和发展趋势的平台,从而为精准思政奠定决策基础。数据可视化有以下三种方式:

一是关键词式呈现。通过计算公式对数据源进行三级分析,得出标签化文字结论,再根据不同思政工作场景通过文本挖掘技术对关键词进行词云统计,最后通过图像形式展现给用户。

二是列表式呈现。将标签化结论通过学生成长数字模型进行分类归纳,形成某学生个体或者某学生群体的可视化表格。用户可以直接通过表格查询到目标信息。

三是融合式呈现。打造学生画像可视化平台,通过多维度自主搜索,多方位展现个体或特定群体全面、动态的画像结论。

结束语:

在利用用户画像技术助推高校精准思政的过程中,数据安全和数据伦理两个方面的风险仍然是值得我们关注的。从数据到大数据,从单一系统到全量数据中心系统,意味着学生信息数据更广的开放度和更高的共享度,如何保证学生数据安全,保护学生个人隐私是需要进一步思考的问题。同时,如何明晰不同思政工作者对学生数据的使用权限和边界,避免网络舆论、数字伦理问题的衍生也是需要进一步探讨的话题。

参考文献:

【1】郑东风.以精准思维推动高质量发展[N].中国纪检监察报, 2019-07-11(5).
【2】袁芳.数字经济背景下精准思政的特点、动因和发展策略[J]. 思想理论教育,2020.12
【3】亓俊忠,沈一民,石静等.基于大数据的学生成长质量评价体系构建研究[N].山东商业职业技术学院学报 2018(12).

About Author /

Leave a Comment

Your email address will not be published.

Start typing and press Enter to search