摘 要:教师资源配置状况一定程度上反应区域教育均衡化水平。在师资配置多属性指标定量化的基础上,利用数据聚类模型,对中部某省的义务教育师资配置进行分析挖掘,揭示区域配置水平及差异性特点。分别采用基于划分聚类的K-means算法及基于密度聚类的DBSCAN算法,对定量化师资配置属性特征集进行迭代聚类,获得区域范围内不同等级的师资综合配置水平。此外,论文比较了K-means和DBSCAN两种聚类算法对师资配置的聚类效果,探讨了它们的适用范围。
关键词:数据挖掘;教师聚类;K-means;DBSCAN
Research on Regional Compulsory Education Teachers Allocation Based on Cluster Analysis
——Take a province in central as an example
LI Jiawen1,LIU Limin1,2,3
(1.Hubei University of Education,School of computer science,Wuhan 430205,China;2.Hubei collaborative innovation center of basic education information technology services,Wuhan 430205,China;3. Hubei Education cloud service engineering technology center,Wuhan 430205,China)
Abstract:The allocation of teacher resources reflects the level of regional education balance to a certain extent. Using a single index to evaluate the allocation of teachers has certain limitations. Under the multi-source index system,how to effectively carry out the comprehensive evaluation of the allocation of teachers is an important research content. On the basis of the quantification of multi-attribute indicators of teacher allocation,the data clustering model is used to analyze and mine the allocation of compulsory education teachers in a province in the central region,revealing the level of regional allocation and differences. The K-means algorithm based on partition clustering and the DBSCAN algorithm based on density clustering are used to perform iterative clustering on the attribute feature set of quantitative teacher allocation to obtain the comprehensive allocation level of teachers at different levels in the region. In addition,the paper compares the clustering effects of K-means and DBSCAN on the allocation of teachers,and discusses their scope of application.
Keywords:Data mining;Teacherclustering;K-means;DBSCAN
0 引 言
随着教育事业和教师队伍的快速发展,教师质量水平和教育质量水平关系紧密,掌握教育师资的配置现状有利于进一步实现教育均衡和配置优化。如何对师资队伍配置多源指标评价是我们急需解决的重要问题,目前教师综合素质和专业化水平以及创新能力急需数字化手段进行评估,所以需要对其进行研究,譬如本文研究的主题就是教师资源配置的综合评价问题,通过该方法可以清楚的了解哪些城市的教师队伍发展状况相似。
本文在某省中小学教师队伍发展水平评价研究项目组的指导下,聚集计算机科学、统计学、教育学、情报学等多学科研究人员,开展中小学教师队伍发展水平评价工作。为了更好的解释区域差异化的教师配置和比较多种算法下的聚类情况,通过更加细化的标准评价区域下的教师配置差异以及聚类情况,在此背景下本文进行探讨。
以往的教资评价都是先基于国标进行打分后计算所得,较少考虑城乡师资存在的差异和具体地区评价体系的差别,本文研究的必要性在于在结合国标和省标的基础上考虑具体项目存在的评价标准并同时计算出在城乡差异存在的情况下实际的教师配置情况,将具体的评价项目更加细化。使用两种聚类算法可得到更优的聚类结果。系统梳理有关中小学教师队伍发展评价指标,结合现有数据,确立评价的重难点及实施的具体方案。
当前从教师质量结构,教师数量结构和教师培训情况按照一定量的比例进行加权其中包含教师职称,学历,学科结构人数,年龄占比等,包含指标众多。已有的研究一般以单一指标进行评价,而具有多指标属性的综合评价,现在研究相对较少;而综合评价恰恰又是一个有意义的研究思路。用K-means及DBSCAN做聚类的研究,这两种算法在实验中能获得好的聚类效果。
鉴于此,本文主要进行教师资源配置多指标的定量化,以及定量化研究基础上利用K-means及DBSCAN聚类算法进行聚类分析;并得到新的综合评价结果。
1 K-MEANS及DBSCAN聚类算法
1.1 K-means算法
K-means算法由初始聚类中心组成的k个随机点,并计算出每个点到聚类中心的距离大小,并把得到的距离结果将样本归并到离它最近的那个聚类中点。完成一次迭代后的新类再计算新的聚类中心,多次迭代后若相邻两次的聚类中心差值变化很小说明样本聚类结束,聚类准则函数收敛。相比于DBSCAN算法,当数据量增大时,所需的内存消耗较小,当空间聚类的密度不均匀时,聚类质量较好。
作者简介:李佳雯(1998—),女,汉族,湖北宜昌人,学生,研究方向:计算机应用;刘利敏(1988—),女,汉族,河南驻马店人,讲师,博士,研究方向:大数据智能分析。