数学建模--企业同工同酬案例分析.docx
企业同工同酬案例分析东南大学 MPC 【摘要】:现代企业的工资制度应是一套完整的体系,它具有着补偿职能、激励 职能、调节职能以及效益职能。工资制度的合理性与科学性是激励职工的劳动积极性,提高劳动效率的重要因素。因而通过建立数学模型,分析影响企业员工工资的因素,对于了解以及完善企业工资制度具有建设性意义。我们根据附表所给出的被解释变量平均日工资,以及解释变量性别、工龄等七个因素,进行合理的模型假设,并按照多元线性回归的方法建模。首先用Matlab软件拟合出平均日工资随工龄的变化曲线,根据图形的变化趋势,选取函数进行第一次建模。通过在交互式画面中对因素的逐条检验,判定工龄和受教育状况为显著性影响因素,并且利用Matlab统计功能工具箱中的rcoplot(r,rint)命令剔除数据中的异常点,修正模型。最终得到平均日工资随工龄和受教育状况变化的关系式。 现代社会,女性的社会地位随着自我价值的实现而日益提高。在企业层面上,女性的自我价值是否得到与男性的同等评价仍是众多学者研究的论题。我们在分析了总体的工资模型后,又将数据按性别分为男、女两类,分别按照上述方法进行建模,通过对比进行分析了解是否存在“区别待遇”。以同样的方法再次对已婚与未婚女性进行建模分析,了解婚姻状况对平均日工资的影响,探讨差异存在是否合理。我们在第一次模型的基础上进行第二次修正,即通过剔除异常值,减少非相关因素,对线性回归相关系数进行进一步的修正,使得R向1趋近,使模型更加完善。最后,我们回归实际,从实际情况中分析模型的合理性,对模型进行第三次修正,即重新分配了受教育情况对工资影响的权重,使得模型更加精确更加符合实际。相信通过我们的研究分析,此次数学建模对于企业的工资制度具有参考性意义。【关键词】:多元线性回归 分类建模 Matlab统计工具箱 模型修正 误差分析 一问题重述职工工资可以说是人们最为关切、议论最多的部分,因此也常常是最受重视的部分。一般说来,现代企业的工资具有补偿职能、激励职能、调节职能、效益职能。科学合理的工资制度,是激励职工的劳动积极性,提高劳动效率的重要手段,正确运用工资的杠杆作用在调动员工积极性方面会起到事半功倍的效果。此外,对于企业中的各种不同的“特殊职务族”,是否要制定和执行专门的倾斜与优惠政策,如对管理干部、高级专家、女工等,也是需要重点考虑的问题。附件(Adata.xls)随机抽取了某企业若干职工的相关数据。请建立适当的数学模型研究下列问题:1.分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切;2.考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入;3.继续改进你的模型,并给出模型误差分析。二问题分析本问题是关于企业职工同工同酬问题的研究分析问题一、我们以日平均工资为被解释变量,以员工性别、工龄、女性婚姻状况、员工受教育状况、工作部门性质、一线工作情况以及培训情况这些因素为解释变量,分析研究出相应的数据模型。从数据模型中观察平均日工资与哪些因素关系密切。问题二、把总体数据分为男女两个类别,根据两个类别的数据分别研究出相应的数据模型,根据两个模型的差异分析,判断女工是否受到不公正待遇。然后把女性类别的数据按照已婚和未婚分为两类,分别研究出两个数据模型,根据它们的差异分析,判断女性婚姻状况是否影响其收入。问题三、通过观察由预测值和实际值得出的残差值,不断修正数据模型,使得相关系数趋向于1。在已完善的数据模型的基础上,研究讨论误差因素,比如:异常值、无相关变量,从而进行误差分析。三模型假设1.在实际情况中,企业计算工资公式应该对于每位职工都一样,本模型就是为了求解这个计算工资公式。2.在实际情况中,企业职工的工资应该与他的工龄成正比,即工龄越大,其相应的工资越多,而且可以确定工龄就是工资的主要影响因素。3.对于受教育程度的影响,按照实际经验,在其他同等的条件下,本科,硕士,博士,博士后享有的工资呈递增趋势。4.以上两个变量(工龄,受教育程度)可以看成模拟连续变量,而对于性别(男或女)、工作部门(管理或技术)、一线工作情况(有或没有)、培训(有或没有)这些因素来说,它们不能随机取值,因此可以用bool值0、1来处理。 5.根据实际情况,工资计算公式应该是各个变量因素的多项式的线性相加的结果,具体模型公式见下面变量符号说明。四变量符号说明 1. 性别变量用表示,其对应的表示该变量产生的工资。2. 工龄变量用表示,其对应的表示该变量产生的工资。3. 婚姻状况变量用表示,其对应的表示该变量产生的工资。4. 受教育状况变量用表示,其对应的表示该变量产生的工资。5. 工作部门变量用表示,其对应的表示该变量产生的工资。6. 一线工作情况变量用表示,其对应的表示该变量产生的工资7. 培训情况变量用表示,其对应的表示该变量产生的工资。则职工工资 ,其计算公式可以表示为:五模型的建立1.首先用Matlab软件拟合出平均日工资随工龄的变化曲线,如图所示:2.观察上图,选取函数进行建模(令,从而转化为关于的线性运算,为方便起见,以下均用表示工龄变量);由于其他几个自变量非随机连续变量,先假设符合线性关系,建立模型,分析并进行修正。而对于这一修正也符合实际,因为将之后,可以判断出方程的斜率越来越小,既满足上图,又符合实际,因为在实际中,随着工龄的增长,不可能工资永远持续增长下去,而且当工龄小的时候它的斜率反而大说明刚刚进入单位的年轻人的工资增长很快,这样就能充分调动年轻人的工作热情,为企业注入活力,这样的很符合实际,因此很有必要地做这样的模型修正。六数据处理1 表示性别,男性用“0”表示,女性用“1”表示;2 表示工龄变量;3 表示婚姻状况,男性用“0”表示,已婚女性用“1”表示,未婚 女性用“2”表示;4 表示受教育状况,本科用“0”表示,硕士用“1”,博士用“2”表示,博士后用“3”表示;5 表示工作部门,技术岗位用“0”表示,管理岗位用“1”表示;6 表示一线工作情况,“0”表示没有参加,“1”表示参加;7 表示培训情况,“0”表示未受培训,“1”表示经受培训。8 实验数据组数n=90;七模型求解1. 利用Matlab统计工具箱,在工作区间中导入矩阵X和Y,输入命令:b,bint,r,rint,stats=regress(Y,X,0.05)其中,0.05为alpha,输出b为的估计值,bint为b的置信区间,r为残差向量,rint为r的置信区间,stats为回归模型的检验统计量。stats有三个值:回归方程的决定系数(是相关系数);统计量值;与统计量值相关的概率;按照上述步骤得到结果: b =bint =26.090319.4684 32.71220.2844-6.6886 7.25732.3447-5.4847 3.6484-0.91815.1955 13.50089.3482-3.2266 3.55760.1655-4.9466 2.7665-1.0901-4.0906 9.35162.6305-4.1254 6.9823stats =统计量值0.842862.781202.为了检测7个变量是否对工资有显著性影响,我们用stepwise函数,在Matlab工作空间中输入命令:stepwise (X,Y,8,0.05)其中8表示矩阵X的列数,0.05为显著性水平alpha值;得到交互式画面:其中蓝色表示较显著性因子,其他表示次要因子,在修正模型时可忽略。上图中的即为表示工龄变量, 即为受教育情况变量,而且可以从数据中观察出,完全随着的变化而变化,为0则也为0,为非0则也为1,可见带来的影响完全可以用来替代表示,因此在修正模型时只考虑这两个变量,则有现在令则可以得到3.在Matlab中利用rcoplot函数查找数据之中的异常点,输入命令:rcoplot(r,rint)得到异常值分布图,如下所示:其中红色表示异常值点,即第43、47、52、60、61、67、90组数据,故在进一步修正时可以忽略。将剩余83组数据重新带入,进行计算,在Matlab中输入命令:b,bint,r,rint,stats=regress(Y,X,0.05)则得到该回归方程的线性回归系数:b =bint =24.270821.4404 27.10122.44912.2274 2.67099.8825 8.0432 11.7218stats =统计量值0.8947339.71490可以看出,修正后回归方程的决定系数为0.8947,相关系数值为0.9459,比修正前模型更准确。可以说明这样的修正是符合实际的,进而得到修正后回归方程为:4.下面研究其他次要因素的影响:为分析性别对工资的影响,将数据按性别分为男、女两类,分别按照上述方法进行建模,通过对比进行分析。通过Matlab计算,得到男性工资方程回归系数:b =bint =25.121019.9498 30.29222.34291.9575 2.728210.35537.7065 13.0041 stats =统计量值0.8939134.83170.0000因此回归方程为:对于女性,用同样的方法得到工资方程的回归系数:b =bint =24.651321.1729 28.12962.36392.0626 2.665210.06546.9160 13.2148stats =统计量值0.8791149.01230.0000因此回归方程为:根据男女两类的线性回归方程,比较可知男性和女性平均日工资关于三个主要变量的影响因素相差很小,只是存在着细微差别,例如最工龄变量的回归系数,男性为2.4491,女性为2.3639,男性略占优势;受教育情况变量的回归系数,男性为9.8825,女性为10.0654,女性略占优势。二者稍微有些差别,并不存在男女工资待遇不平等现象。为研究婚姻状况对于女性工资的影响:将女性数据按照婚姻状况分为已婚和未婚两类,依次建立模型,比较分析婚姻状况对平均日工资的影响。得出已婚的工资方程的回归系数:b =bint =23.144819.4950 26.79452.49432.1935 2.795116.595111.5552 21.6349stats =统计量值0.9185169.07520.0000 该回归方程为: 未婚女性的工资方程的回归系数为:b =bint =27.290522.0915 32.48942.12311.7345 2.51176.72033.1526 10.2879 stats =统计量值0.932776.24390.0000 该回归方程为:对比这两条回归方程:可见未婚女性的工资的第一部分,要比已婚女性的高出4.14,而第二部分的斜率系数要低于已婚女性0.38,可见只要当工龄大于118月,就出现未婚比已婚的低收入了,而未婚女硕士及未婚女博士的收入明显要低于同等条件的已婚女性。联系实际,该企业可能对工龄相对较小的未婚女性给予一定的补偿措施,毕竟她们还未成家,只有自己一个人的经济收入,这符合实际情况。但是对工龄相对较大的未婚女性,在工龄及受教育情况相同时,与已婚女性相竞争明显处于劣势。在实际情况中,某些企业因考虑未婚女性将来结婚生子要有产假以及其他因素,往往倾向于选择已婚女性作为长期职工。所以该模型与实际情况也是相符的。可见,婚姻状况对女性平均日工资还是有影响的。当然以上两因素都是次要因素,对于工资回归方程的影响很小,在建立整体模型时是可以忽略的,但是研究一下它们所隐含着的平等问题还是有意义的。八模型进一步修正在第一次模型修正(将)和第二次模型修正(进行显著性因子检验,忽略次要因素,同时剔除异常值,得到)的基础上,进行第三次的模型修正,尽量使模型得到进一步改善。我们在第二次修正时考虑的是:对应本科,硕士,博士,博士后时分别取0,1,2,3;当时这样的做法只是为了便于查看出所代表的受教育程度对于工资的显著影响,从而做出的较为简单的线性假设,而实际情况是本科,硕士,博士,博士后的待遇并非按照0,1,2,3这样的线性等差的递增,它们的递增关系应该是非线性的,这里就引入了一个较大的人为误差因素了,我们第三次修正就是围绕着这样的考虑来进行的。经过反复试验,与第二次修正模型的对比,找出(0,12.8,19.8,45)分别来表示本科,硕士,博士,博士后对应的待遇,其中由于博士后只有一人,他的45这个值只做参考,没有线性回归研究价值。此时的方程就可以修正为:此刻我们对比第二次修正的模型,主要从线性回归相关系数的角度来分析。下面列出对比表格:第二次修正第三次修正statsF统计量PF统计量P总工资0.94588580.8947339.714900.95152510.9054382.82500男性工资0.94546280.8939134.831700.94899950.9006144.89090女性工资0.93760330.8791149.012300.94957880.9017206.38850已婚女性0.95838410.9185169.075200.95848840.9187175.12320未婚女性0.96576390.932776.243900.96384650.929071.95400可见,经过第三次修正之后,线性回归相关系数明显更加趋近于1了,由此可见第三次修正的模型是更加接近于实际的。九模型检验及误差分析通过第三次修正后的模型回归方程为: 即将其代入原来工资表格,与90组实际数据相对比,得出下列表格:工号日平均工资 (元/天)性别工龄(月)女性婚姻状况受教育状况工作部门性质一线工作情况培训情况模型试验值绝对误差相对误差133女7已婚本科技术岗位0030.93692.0630970.062518234男14男性本科技术岗位0033.512940.487060.014325334男18男性本科管理岗位0034.69055-0.690550.02031442男19男性本科技术岗位0034.963837.0361720.167528534女19未婚本科管理岗位0034.96383-0.963830.028348634女19已婚本科技术岗位0034.96383-0.963830.028348734女27已婚本科技术岗位1036.93188-2.931880.086232836女30已婚本科技术岗位0037.59257-1.592570.044238943男30男性本科技术岗位0037.592575.4074340.1257541040女30未婚本科技术岗位0037.592572.4074340.0601861145女31未婚硕士技术岗位0150.33915-5.339150.1186481240女31已婚本科管理岗位0037.805392.1946130.0548651337女38已婚本科技术岗位0039.20787-2.207870.0596721437男41男性本科技术岗位0039.76898-2.768980.0748371538女42已婚本科技术岗位0039.95143-1.951430.0513531642男42男性本科管理岗位0039.951432.0485710.0487751738男42男性本科技术岗位0039.95143-1.951430.0513531838女42已婚本科管理岗位0039.95143-1.951430.0513531937女47已婚本科技术岗位1040.8327-3.83270.1035872037女52已婚本科技术岗位1041.66822-4.668220.1261682149女52未婚硕士技术岗位0154.20198-5.201980.1061632239男54男性本科技术岗位0041.99111-2.991110.0766952347女54已婚本科管理岗位0041.991115.0088880.1065722439女54已婚本科技术岗位0041.99111-2.991110.0766952553男55男性硕士管理岗位0154.68408-1.684080.0317752649女66已婚本科管理岗位0043.814165.1858350.1058332741男67男性本科管理岗位0043.95829-2.958290.0721532841女67未婚本科管理岗位0043.95829-2.958290.0721532950女75未婚本科技术岗位0045.074594.9254070.0985083047男78男性本科管理岗位0045.477741.5222630.0323893147女79未婚本科技术岗位0045.610391.389610.0295663245男91男性本科管理岗位0047.14109-2.141090.047583345女92已婚本科技术岗位1047.26396-2.263960.050313444女94已婚本科管理岗位0047.50771-3.507710.0797213560女103已婚硕士管理岗位0161.10754-1.107540.0184593651女103已婚本科技术岗位0048.573782.4262150.0475733748男103男性本科技术岗位0048.57378-0.573780.0119543848男111男性本科管理岗位0049.48291-1.482910.0308943965男114男性博士管理岗位0169.2035-4.20350.0646694074男114男性博士管理岗位0169.20354.79650.0648184161男114男性博士管理岗位1169.2035-8.20350.1344844247女117已婚本科技术岗位1050.14343-3.143430.0668814368男139男性本科管理岗位0052.4309715.569030.2289564470女140已婚硕士管理岗位1165.064234.9357660.0705114575女154已婚硕士管理岗位1166.421748.5782610.1143774673男158男性博士技术岗位1173.65254-0.652540.00893947100男159男性博士后管理岗位1198.421741.5782620.0157834857女162未婚本科技术岗位0054.636052.3639460.0414734960男167男性本科管理岗位0055.094254.9057540.0817635056女172已婚本科技术岗位1055.545630.454370.0081145161女174已婚本科技术岗位1055.724345.2756560.0864865287男175男性硕士管理岗位0168.3470818.652920.2144015357女199未婚本科技术岗位0057.87709-0.877090.0153885457女209已婚本科技术岗位0058.70003-1.700030.0298255572女209未婚博士管理岗位0078.08819-6.088190.0845585662女210未婚本科技术岗位0058.781233.218770.0519165770男213男性本科管理岗位0059.0236810.976320.1568055862女220已婚本科技术岗位1059.582832.4171680.0389875962女222已婚本科技术岗位0059.740952.2590490.0364366074男222男性本科技术岗位0059.7409514.259050.192696176女223未婚本科技术岗位0059.8197416.180260.2128986268男223男性本科技术岗位0059.819748.1802560.1202986362女227已婚本科管理岗位0060.133161.866840.030116462女232已婚本科技术岗位1060.521071.4789270.0238546567女235已婚本科技术岗位1060.751826.2481840.0932566687男245男性博士管理岗位0180.898676.101330.070136777男253男性本科管理岗位0062.1063814.893620.1934246862女257已婚本科技术岗位1062.40078-0.400780.0064646968女260已婚本科技术岗位0062.620095.3799140.0791167087男284男性博士管理岗位0183.718983.2810250.0377137165男287男性本科技术岗位0064.539490.4605110.0070857257女290未婚本科技术岗位0064.74708-7.747080.1359147387男308男性硕士管理岗位0178.504428.4955770.097657462男309男性本科管理岗位1066.03758-4.037580.0651227565女319已婚本科管理岗位0066.70086-1.700860.0261677668男325男性本科技术岗位0067.093840.9061560.0133267765男326男性本科管理岗位0067.15899-2.158990.0332157857男329男性本科管理岗位0067.35382-10.35380.1816467968女337已婚本科技术岗位0067.869080.130920.0019258078男346男性硕士管理岗位1180.97525-2.975250.0381448157女355已婚本科技术岗位1069.0065-12.00650.210648265男357男性本科技术岗位0069.13108-4.131080.0635558371男380男性硕士管理岗位1183.07319-12.07320.1700458491男387男性硕士管理岗位1183.49337.5066950.0824918591男403男性硕士管理岗位1184.439536.5604740.0720938665男406男性本科管理岗位0072.08108-7.081080.108948776女437未婚本科技术岗位0073.856022.1439770.028218881女453已婚本科技术岗位0074.747496.2525080.0771918969女458未婚本科技术岗位0075.02284-6.022840.0872879067男464男性硕士管理岗位0187.88503-20.8850.311717由上表可见,除去一些异常点(第43、47、52、60、61、67、90组数据,见表格阴影部分)以外,其它多组数据残差和,在合理的误差范围之内,可见本次模型拟合是较为成功的,这样本模型可以在实际中进行推广和利用。十、模型评价最终的到的模型经过三次修正,并剔除了异常值,同时进行了显著性因子检验,最终只保留了七个影响因素中的2个显著性因素,使模型大大简化,准确度也进一步提高。得到的模型回归方程的决定系数为0.9054,相关系数R值为0.9515,统计量值为382.8250。相关系数R比较接近于1,故得到方程的线性相关程度比较高。利用该模型能合理地解释性别以及女性婚姻状况对平均日工资的影响,并分析工资的主要影响因素,有助于企业建立合理的工资制度,从而激励职工的劳动积极性,提高工作效率,因而具有重要的实际意义。参考文献: 【1】 数学模型及其应用 戴明强 李卫军 杨鹏飞主编【2】计量经济学(第二版) 谢识予 主编 高等教育出版社【3】随机数学基础曹振华 编 高等教育出版社18