技术标签: python
PS:以下来自人工智能头条公众号,支持向量机部分
约束问题分为等式约束和不等式约束,对于等式约束问题我们可以直接采用拉格朗日乘子法来解决,对于含有不等式约束的优化问题,可以转化为在满足 KKT 约束条件下应用拉格朗日乘子法求解.拉格朗日乘子法得到的解不一定是最优解,只有在函数是凸函数的条件下才能得到最优解.
一、关于拉格朗日乘子法和KKT条件
首先来了解拉格朗日乘子法,那么为什么需要拉格朗日乘子法?记住,有拉格朗日乘子法的地方,必然是一个组合优化问题。那么带约束的优化问题很好说,就比如说下面这个:
这是一个带等式约束的优化问题,有目标值,有约束条件。那么想想假设没有约束条件这个问题是怎么求解的呢?是不是直接f对各个x求导等于0,,解x就可以了,可以看到没有约束的话,求导为0,那么各个x均为0吧,这样f=0了,最小。但是x都为0不满足约束条件呀,那么问题就来了。这里在说一点的是,为什么上面说求导为0就可以呢?理论上多数问题是可以的,但是有的问题不可以。如果求导为0一定可以的话,那么f一定是个凸优化问题,什么是凸的呢?像下面这个左图:
凸的就是开口朝一个方向(向上或向下)。更准确的数学关系就是:
注意的是这个条件是对函数的任意x取值。如果满足第一个就是开口向上的凸,第二个是开口向下的凸。可以看到对于凸问题,你去求导的话,是不是只有一个极点,那么他就是最优点,很合理。类似的看看上图右边这个图,很明显这个条件对任意的x取值不满足,有时满足第一个关系,有时满足第二个关系,对应上面的两处取法就是,所以这种问题就不行,再看看你去对它求导,会得到好几个极点。然而从图上可以看到,只有其中一个极点是最优解,其他的是局部最优解,那么当真实问题的时候你选择那个?说了半天要说啥呢,就是拉格朗日法是一定适合于凸问题的,不一定适合于其他问题,还好我们最终的问题是凸问题。
回头再来看看有约束的问题,既然有了约束不能直接求导,那么如果把约束去掉不就可以了吗?怎么去掉呢?这才需要拉格朗日方法。既然是等式约束,那么我们把这个约束乘一个系数加到目标函数中去,这样就相当于既考虑了原目标函数,也考虑了约束条件,比如上面那个函数,加进去就变为:
这里可以看到与相乘的部分都为0,所以的取值为全体实数。现在这个优化目标函数就没有约束条件了吧,既然如此,求法就简单了,分别对x求导等于0,如下:
把它在带到约束条件中去,可以看到,2个变量两个等式,可以求解,最终可以得到,这样再带回去求x就可以了。那么一个带等式约束的优化问题就通过拉格朗日乘子法完美的解决了。那么更高一层的,带有不等式的约束问题怎么办?那么就需要用更一般化的拉格朗日乘子法即KKT条件来解决这种问题了。
继续讨论关于带等式以及不等式的约束条件的凸函数优化。任何原始问题约束条件无非最多3种,等式约束,大于号约束,小于号约束,而这三种最终通过将约束方程化简化为两类:约束方程等于0和约束方程小于0。再举个简单的方程为例,假设原始约束条件为下列所示:
那么把约束条件变个样子:
为什么都变成等号与小于号,方便后面的,反正式子的关系没有发生任何变化就行了。
现在将约束拿到目标函数中去就变成:
那么KKT条件的定理是什么呢?就是如果一个优化问题在转变完后变成
其中g是不等式约束,h是等式约束(像上面那个只有不等式约束,也可能有等式约束)。那么KKT条件就是函数的最优值必定满足下面条件:
这三个式子前两个好理解,重点是第三个式子不好理解,因为我们知道在约束条件变完后,所有的g(x)<=0,且,然后求和还要为0,无非就是告诉你,要么某个不等式,要么其对应的。那么为什么KKT的条件是这样的呢?
假设有一个目标函数,以及它的约束条件,形象的画出来就如下:
假设就这么几个吧,最终约束是把自变量约束在一定范围,而函数是在这个范围内寻找最优解。函数开始也不知道该取哪一个值是吧,那就随便取一个,假设某一次取得自变量集合为x1,发现一看,不满足约束,然后再换呀换,换到了x2,发现可以了,但是这个时候函数值不是最优的,并且x2使得g1(x)与g2(x)等于0了,而g3(x)还是小于0。
这个时候,我们发现在x2的基础上再寻找一组更优解要靠谁呢?当然是要靠约束条件g1(x)与g2(x),因为他们等于0了,很极限呀,一不小心,走错了就不满足它们两了,这个时候我们会选择g1(x)与g2(x)的梯度方向往下走,这样才能最大程度的拜托g1(x)与g2(x)=0的命运,使得他们满足小于0的约束条件对不对。至于这个时候需不需要管g3(x)呢?正常来说管不管都可以,如果管了,也取g3在x2处的梯度的话,因为g3已经满足了小于0的条件,这个时候在取在x2处的梯度,你能保证它是往好的变了还是往差的变了?答案是都有可能。运气好,往好的变了,可以更快得到结果,运气不好,往差的变了,反而适得其反。
那么如果不管呢?因为g1(x)与g2(x)已经在边缘了,所以取它的梯度是一定会让目标函数变好的。综合来看,这个时候我们就不选g3。那么再往下走,假设到了自变量优化到了x3,这个时候发现g2(x)与g3(x)等于0,也就是走到边了,而g1(x)小于0,可变化的空间绰绰有余,那么这个时候举要取g2(x)与g3(x)的梯度方向作为变化的方向,而不用管g1(x)。那么一直这样走呀走,最终找到最优解。可以看到的是,上述如果g1(x)、g2(x)=0的话,我们是需要优化它的,又因为他们本身的条件是小于0的,所以最终的公式推导上表明,是要乘以一个正系数作为他们梯度增长的倍数,而那些不需要管的g(x)为了统一表示,这个时候可以将这个系数设置为0,那么这一项在这一次的优化中就没有了。那么把这两种综合起来就可以表示为
也即是某次的g(x)在为最优解起作用,那么它的系数值(可以)不为0。如果某次g(x)没有为下一次的最优解x的获得起到作用,那么它的系数就必须为0,这就是这个公式的含义。
比如上面例子的目标值与约束:
将约束提到函数中有:
此时分别对x1、x2求导数:
而我们还有一个条件就是,那么也就是:
这样我们就去讨论下,要么g=0,要么,这里两个g两个,这样我们就需要讨论四种情况,可能你会说,这是约束条件少的情况,那么如果有10个约束条件,这样就有10个g和10个,你去给我讨论?多少种组合,不知道,但是换个思路,我们非得去10个一起去讨论?机智的学者想到一种方法,考虑到这个条件,那么我两个两个讨论不就可以了,比如现在我就讨论7,8,让其他的不变,为什么选或者至少选两个讨论呢,因为这个式子求和为0,改变一个显然是不行的,那就改变两个,你增我就减,这样和可以为0。再问为什么不讨论3个呢?也可以,这不是麻烦嘛,一个俗语怎么说来着,三个和尚没水喝,假设你改变了一个,另外两个你说谁去减或者加使得和为0,还是两个都变化一点呢?不好说吧,自然界都是成双成对的才和谐,没有成三成四的(有的话也少)。
这里顺便提一下后面会介绍到的内容,就是实现SVM算法的SMO方法,在哪里,会有很多,那么人们怎么解决的呢,就是随便选择两个去变化,看看结果好的话,就接受,不好的话就舍弃在选择两个,如此反复,后面介绍。
可以看到像这种简单的讨论完以后就可以得到解了。
x1=110/101=1.08;x2=90/101=0.89,那么它得到结果对不对呢?这里因为函数简单,可以在matlab下画出来,同时约束条件也可以画出来,那么原问题以及它的约束面画出来就如下所示:
这是截取下来的符合约束要求的目标面
可以看到最优解确实就是上面我们求的那个解。既然简单的问题可以这样解,那么复杂一点的只需要简单化,照样可以解,至此KKT条件解这类约束性问题就是这样,它对后续的SVM求解最优解至关重要。
博主个人公众号开通啦,平时主要分享一些机器学习、深度学习等的论文和方法,以及算法与数据结构、大厂经验贴等!欢迎大家关注,一起交流进步!
MATLAB自带函数实现经验模态分解MATLAB从2018a开始给出了内置函数来实现经验模式分解(EMD)与希尔伯特-黄变换(HHT),函数名分别是emd与hht,用户可以直接调用两个函数来实现经验模式分解以及与希尔伯特-黄变换。Syntax(语法)[imf,residual] = emd(X) returns intrinsic mode functions imf and residual signal residual corresponding to the empirical mode
1 工具 一台具有公网ip的服务器2 下载frp frp下载地址打开上面的frp下载地址公网服务器上 打开下载文件frps是服务端,在公网服务器上部署frpc是客户端,在需要内网穿透的电脑上部署1. frps配置 首先我这用的是win公网服务器 (linux和mac同样是编辑这个文件)里面的frps.ini文件[common]bind_addr = 0.0.0.0bind_port = 2534subdomain_host = xxx.xxx.xxxtoken =Y2SEsBAB
前两天调试Qt编写的程序的时候程序突然崩溃并在输出栏提示 : ASSERT: "isDetached()"in file /opt/qt5.12.2-qt-xcb/include/QtCore/qvector.h, line 386看了一下这个qvector.h,发现程序中断在了如下代码中:template <typename T>void QVector<T>::d...
一,Directory和DirectoryInfo的应用 在Asp,net的实际应用中,上传文件的实现过程中要用到有关目录的操作,来现实文件的上传工作.下面分析下用C#完成文件上传过程的核心代码,其中控件FileUpload用来获取文件/-------------代码段----------stringfilename=FileUploadFileName;//获...
HTTP1.0 HTTP 1.1主要区别长连接HTTP 1.0需要使用keep-alive参数来告知服务器端要建立一个长连接,而HTTP1.1默认支持长连接。HTTP是基于TCP/IP协议的,创建一个TCP连接是需要经过三次握手的,有一定的开销,如果每次通讯都要重新建立连接的话,对性能有影响。因此最好能维持一个长连接,可以用个长连接来发多个请求。节约带宽HTTP 1...
点击上方“大鱼机器人”,选择“置顶/星标公众号”福利干货,第一时间送达!01AC24V接口EMC设计标准电路02AC110V-220VEMC设计标准电路03 AC380V接口EMC设...
系列文章目录上篇:pyBullet学习笔记(1)环境搭建文章目录系列文章目录前言一、hello_pybullet.py二、代码分析总结前言pybullet网上可查到的资料并不多,大多都是对官方文档的机械翻译。pybullet官方文档官方文档对于新手是挺不友好的,文档本身更像是函数说明。其中有对于每个函数用法的参考例子,但是例子本身并不成系统,各个知识点的嵌套十分复杂,很难帮助理解。另外这份文档的另一个不足是对于函数用法的说明不够具体,有些参数只是说了一下干什么,没有具体解释意义,在使用的过程中难
原文链接:https://blog.csdn.net/qq_38977110/article/details/103384386。文件同步和共享工具-Resilio Sync https://www.getnas.com/resilio-sync/桌面日历软件-Rainlendar 2 http://www.rainlendar.net/cms/index.php。电脑文件搜索工具-Everything https://www.voidtools.com/zh-cn/,Mac 端相似产品推荐:iText。
点击关注公众号,利用碎片时间学习Java Lambda表达式的一个重要用法是简化某些匿名内部类(Anonymous Classes)的写法。实际上Lambda表达式并不仅仅是匿名内部类的语...
试题 基础练习 01字串资源限制时间限制:1.0s 内存限制:256.0MB问题描述对于长度为5位的一个01串,每一位都可能是0或1,一共有32种可能。它们的前几个是:0000000001000100001100100请按从小到大的顺序输出这32种01串输入格式本试题没有输入。输出格式输出32行,按从小到大的顺序每行一个长度为5的01串。样例输出00000000010001000011<以下部分省略>代码import java.util.*;pu
1.右击项目-打开属性2.在应用程序中选择或更改图标文件3.保存即可,之后打包生成的程序图标就会换成相应的文件,具体打包步骤看我另一篇博客。
目前网上虽然易语言可以通过一定方法获取和调用到64位进程里的一些Api函数来对64位进程进行内存读写,但是那些也仅限于ntdll.dll里面的函数而已,对64位程序里的其他64位dll,无法获取函数地址。也就易语言从而无法方便的进远程HOOK。所以今天我就给大家带来了,我新开发的一个功能,x64进程_取AP地址()这个函数用途非常广泛,作用非常大,它可以远程获取指定64位游戏进程里的指定系统dll的API函数入口地址的。通俗点说就是有了它后,将相当于为易语言对64位进程函数动态HOOK的大门,