2022机器学习公式详解.docx
《2022机器学习公式详解.docx》由会员分享,可在线阅读,更多相关《2022机器学习公式详解.docx(151页珍藏版)》请在三一办公上搜索。
1、机器学习公式详解1 .第1章绪论2 .第2章模型评估与选择3 .第3章线性模型4 .第4章决策树5 .第5章神经网络6 .第6章支持向量机7 .第7章贝叶斯分类器8 .第8章集成学习第9章案类10:第10章降维与度量学习11 .第11章特征选择与稀疏学习12 .第12章计算学习理论13 .第13章半监督学习14 .第14章概率图模型15 .第15章规则学习16 .第16章强化学习第1章绪论式(LI)(iXJ)-EP3)I(M)“)PSX,2o)AcJ*-Y参见式(1.2)式(1.2)EeC)EEEP(Z)Kh(X)/(x)P(hIXX)/UT-E小)psx,&)El(MN)”(N)d/=EP(
2、三)EPmI、).;/,*-*A=权即P(三)EPslX)-2MiyP(X).1K显然成立解析g:EEER)I(Mn)/(N)P(MX,匕)/ut-EP(N)EEl(MN)P伍IX)4f-X/A=EP(x)X;P(h|X,.)521(Mx)/W)aX-Xa,T:首先要知道此时我们假设f是任何能将样本映射到01的函数.存在不止一个/时,服从均匀分布,即每个,出现的概率相等.例如样本空间只有两个样本时,二(4H2)M=Z那么所有可能的真实目标函数,如下:A:/l(Nl)-OJI(XJ)-0;h/2(x1)三O,(a)-1;h:(三)三lf3(2)O;/4:1)=1.0.23.+).(.0.15.-
3、)此处用表示样本,以和坐标(WS作出区分其中,和分别表示样本为正例和为反例,数字表示学习器/预测该样本为正例的概率,例如对于反例球说,当前学习器/()预测它是正例的概率为ns?.上面给出的预测结果已经按照预测值从大到小排序根据“西瓜书”上给出的绘制方法,首先需要对所有测试样本按照学习器给出的预测结果进行排序,接着将分类阈值设为一个不可能取到的最大值.显然,此时所有样本预测为正例的概率都一定小于分类阈值,那么预测为正例的样本个数为0,相应的真正例率和假正例率也都为0,所以我们可以在坐标00)处标记一个点.接下来需要把分类阈值从大到小依次设为每个样本的预测值,也就是依次设为077,0.62,0.5
4、8,0.47,0.33,0.23,0.15,然后分别计算真正例率和假正例率,再在相应的坐标上标记点,最后再将各个点用直线连接,即可得到RCC曲线.需要注意的是,在统计预测结果时,预测值等于分类阈值的样本也被算作预测为正例.例如,当分类阈值为C力时,测试样本/被预测为正例,由于它的真实标记也是正例,所以此时叫是一个真正例.为了便于绘图,我们将T轴(假正例率轴)的“步长”定为二,珊由(真正例率轴)的“步长”定为;根据真正例率和假正例率的定义可知,每次变动分类阈值时,若新增个假正例,那么相应的T轴坐标也就增加若新增j个真正例,那么相应的畸Ii坐标也就增加高.按照以上讲述的绘制流程,最终我们可以绘制出
5、如图2/所示的RCC曲线.图2-1RoC曲线示意注:表示红色线段;表示蓝色线段;一表示绿色线段在这里,为了能在解析式(2.21)时复用此图,我们没有写上具体的数值,转而用其数学符号代替.其中绿色线段表示在分类阈值变动的过程中只新增了真正例,红色线段表示只新增了假正例,蓝色线段表示既新增了真正例也新增了假正例.根据AUa直的定义可知,此时的AlM值其实就是所有红色线段和蓝色线段与7轴围成的面积之和.观察图2-1可知,红色线段与了轴围成的图形恒为矩形,蓝色线段与了轴围成的图形恒为梯形.由于梯形面积式既能算梯形面积,也能算矩形面积,所以无论是红色线段还是蓝色线段,其与轴围成的面积都能用梯形公式来计算
6、:-TJ(弘+16+1)其中,一4为”高、的为“上底”,为“下底”.那么对所有红色线段和蓝色线段与7轴围成的面积进行求和,则有11l一rE(Th4-,)(的物.t=l此即AUC式(2.21)X=焉E(l(x)/(z-)I(z)=/(X-)解析按照我们上述对式(2.20)的解析思路,La可以看作是所有绿色线段和蓝色线段与1/轴围成的面积之和,但从式(2.21)中很难一眼看出其面积的具体计算方式,因此我们进行恒等变形如下:J-(1(/(*),l*-*D-/=F1(x+)(x)+i(x+)=(x)三+*ZHLe-CD-*11-=!W(n)一=5,卫Z1(x)(x)2m+mu/M.小I()-(x)1.
7、,n-在变动分类阈值的过程当中,如果有新增真正例,那么图21就会相应地增加一条绿色线段或蓝色线段,所以上式中的.K可以看作是在累加所有绿色和蓝色线段,相应地,后面的内容便是在求绿色线段或者蓝色线段与“轴围成的面积,即:y)三r,D-一,-与式(2.20)中的求解思路相同,不论是绿色线段还是蓝色线段,其与Q轴围成的图形面积都1可以用梯形公式来进行计算,所以上式表示的依旧是一个梯形的面积公式.其中U即梯形的“高”,中括号内便是“上底+下底,下面我们来分别推导一下“上底”(较短的底)和“下底”(较长的底).由于在绘制RCr曲线的过程中,每新增一个假正例时T坐标也就新增一个步长,所以对于1“上底”,也
8、就是绿色或者蓝色线段的下端点到轴的距离,长度就等于U乘以预测值大于/(n的假正例的个数,即!E1(3)V/Gr)而对于“下底”,长度就等于二二乘以预测值大于等于人的假正例的个数,即m式(2.27)l(x)-/严4txmi/解析截至2018年12月“西瓜书”第1版第30次印刷,式Q.27)应当勘误为E = nunc (:)dWMmt /具体推导过程如下:由“西瓜书”中的上下文可知,对C“进行假设检验,等价于本章附注中所述的对P曲叁打假设检验,所以在“西瓜书”中求解最大错误率7等价于在附注中求C解事件最大发生频率由附注可知C=minCa.t.(:)曲f)所以A=Inin?(:)曲1一刖尸ral7)
9、式(2.41)E(/:D)=Epl/|z:Pl-yp2=ED(/(a)-7()+/M-yo)a=Eo(/(;D)一/(,)月+EDIV(Jr)-Jto/+ED2(fl.D)-fix)(7(X)ITd)=ED(/(室D)-f(x)s+Ed(/()-Vd)1=ED(/(;。)-7(*)a+I(7()-y+y-yp)a=%(/(z;D)-用)卉+%(/(X)-yt+ED电+2E(/(X)-J)(y-加)-%f(/(;D)-/(x)t+(7()一+如Rlto-一:减一个八公再加一个,属于简单的恒等变形-:同一样,减一个再加一个u属于简单的恒等变形()-:同一样,将最后一项利用期望的运算性质进行展开解析
10、-:首先将中括号内的式子展开,有ED(/(;D)-7(x)i+(7()-yo)i+2(/(室D)-/(x)(7()-yp).然后根据期望的运算性质EA-Y-EL:E1可将上式化为(;D)-)j(/()-Vd)1+ED2(f(x;D)-f(x)(f(x)-yo)l.一:再次利用期望的运算性质将第3步得到的式子的最后一项展开,有ED2(/3;D)-加)(/(x)-yo)l-Ed2(x;D)-/(x)-/()-Ed|2(/(;D)-/(x)皿.首先计算展开后得到的第1项,有ED2U(MD)_/()-,(到=Ed2(三;D)加)-2/()-f(x).由于N)是常量,所以由期望的运算性质:E1r.A-1
11、3.1EB(其中AB均为常量)可得Ed2U(MD)-7()7()-2f(x)%f(x;D)-2()f(x)由式(2.37)可知E(rD)l。0,所以Ep2(fx.D)-7(x1)f(*)=2.)fix)-2px)./(x)=(接着计算展开后得到的第二项ED2(j(xD)-f(x)yo=2E11j(xD)yp-2(z)EDd由于噪声和/无关,所以“工0和助是两个相互独立的随机变量.根据期望的运算性质EbVVl.EXEIW(其中讲口为相互独立的随机变量)可得ED2(/(工;D)-,)H=2Ed(z;。)2,(工)EDM=2E0/(*。)1EDfol-2/()EDyo三2/()EdFvdI-2f(x
12、)E11IvdI=0,所以“2(/3;0-,力)伊力-加)=%2(z;D)-/(z)f(x-Ed2(/3;D)-喇血=0+0nI:因为工)和U均为常量,根据期望的运算性质,有中的第2项En(/(*)y)=(,y)同理有中的最后一项(,一y)(y-沏)2(f(x)-y)Ep-y11.由于此时假定噪声的期望为零,BIJEnfe-IZDl-O,所以2Ed(/(n)-(V-刖)-2(7(x)-j)-0=0.附注二项分布参数加勺检验1设某事件发生的概率为,D未知.做E次独立试验,每次观察该事件是否发生,以Ti己该事件发生的次数,则Y服从二项分布由m.D),现根据Y检验如下假设:Hq:PAi;HI:p.由
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 机器 学习 公式 详解
链接地址:https://www.31ppt.com/p-6515909.html