R语言用HESSIAN-FREE 、NELDER-MEAD优化方法对数据进行参数估计-程序员宅基地

技术标签: r语言  开发语言  

原文链接:http://tecdat.cn/?p=22828 

主要优化方法的快速概述

我们介绍主要的优化方法。我们考虑以下问题 7a448a101f46a1ef340d9fd8baf3b680.png.

无导数优化方法

Nelder-Mead方法是最著名的无导数方法之一,它只使用f的值来搜索最小值。过程:

  1. 设置初始点x1,...,xn+1

  2. 对点进行排序,使得f(x1)≤f(x2)≤⋯≤f(xn+1)。

  3. 计算xo作为x1,...,xn的中心点。

  4. 反射

  • 计算反射点xr=xo+α(xo-xn+1)。

  • 如果f(x1)≤f(xr)<f(xn),那么用xr替换xn+1,转到步骤2。

  • 否则转到第5步。

扩展:

  • 如果f(xr)<f(x1),那么计算扩展点xe=xo+γ(xo−xn+1).

  • 如果f(xe)<f(xr),那么用xe替换xn+1,转到步骤2。

  • 否则用xr替换xn+1,转到第2步。

  • 否则转到第6步。

收缩:

  • 计算收缩点xc=xo+β(xo-xn+1).

  • 如果f(xc)<f(xn+1),那么用xc替换xn+1,进入第2步。

  • 否则转到第7步.

减少:

  • 对于i=2,...,n+1,计算xi=x1+σ(xi-x1).

Nelder-Mead方法在optim中可用。默认情况下,在optim中,α=1,β=1/2,γ=2,σ=1/2。

Hessian-free 优化方法

对于光滑的非线性函数,一般采用以下方法:局部方法结合直线搜索工作的方案xk+1=xk+tkdk,其中局部方法将指定方向dk,直线搜索将指定步长tk∈R。

基准

为了简化优化方法的基准,我们创建一个函数,用于计算所有优化方法的理想估计方法。

benchfit <- function(data, distr, ...)

β分布的数值说明

β分布的对数似然函数及其梯度

理论值

β分布的密度由以下公式给出

0f362adcb294bebc00d92395e43afbae.png

其中β表示β函数。我们记得β(a,b)=Γ(a)Γ(b)/Γ(a+b)。在这里,一组观测值(x1,...,xn)的对数似然性为

8c8657cb8fa1032844951e8dffe22ee9.png

与a和b有关的梯度为

f4fc75631750d705ca8008254376d583.png

R实现

我们最小化了对数似然的相反_数_:实现了梯度的相反_数_。对数似然和它的梯度都不被输出。

function(par) 
loglikelihood(par, fix.arg ,...)

样本的随机生成

#(1) beta分布
n <- 200
x <- rbeta(n, 3, 3/4)
lnl(c(3, 4), x) #检验
``````
hist(x, prob=TRUE)

3f6e445631c29d49facb9f8ea3daab25.png

拟合Beta分布

定义控制参数。

list(REPORT=1, maxit=1000)

用默认的优化函数调用,对于不同的优化方法,有梯度和无梯度。

fit(x, "beta", "mle", lower=0,...)

44a1a25693e70b7580520791b4a14851.png

在约束优化的情况下,我们通过使用对数障碍允许线性不平等约束。

使用形状参数δ1和δ2的exp/log变换,来确保形状参数严格为正。

#取起始值的对数
lapply(default(x, "beta"), log)
#为新的参数化重新定义梯度
exp <- function(par,...) beta(exp(par), obs) * exp(par)
fit(x, distr="beta2", method="mle")

5c21aabfe47630257b7dac589f1fe543.png

#返回到原始参数化
expopt <- exp(expopt)

然后,我们提取拟合参数的值、相应的对数似然值和要最小化的函数的计数及其梯度(无论是理论上的梯度还是数值上的近似值)。

数值调查的结果

结果显示在以下表格中。1)没有指定梯度的原始参数(-B代表有界版本),(2)具有(真实)梯度的原始参数(-B代表有界版本,-G代表梯度),(3)没有指定梯度的对数转换参数,(4)具有(真实)梯度的对数转换参数(-G代表梯度)。

e373c008e6cf81bc9da9cf0d75e6aa38.png

adf659e76e6e30818db62bd1e5fe0297.png 2cdb13138e90eb6bf79c725d3de8c701.png

357046103f059d98c953c61589cb49ce.png

我们绘制了真实值(蓝色)和拟合参数(红色)周围的对数似然曲面图。

llsurface(min.arg=c(0.1, 0.1), max.arg=c(7, 3), 
          plot.arg=c("shape1", "shape2"), nlev=25,
          plot.np=50, data=x, distr="beta", back.col = FALSE)
points(unconstropt\[1,"BFGS"\], unconstropt\[2,"BFGS"\], pch="+", col="red")
points(3, 3/4, pch="x", col="green")

f5a500d7ff5477c3a291a2ca716bdaae.png

我们可以用bootdist函数来模拟bootstrap 复制的情况。

boot(fit(x, "beta", method="mle", optim.method="BFGS"))

8b677b9fd79ae88a048ba9c7a03e57f2.png

plot(b1)
abline(v=3, h=3/4, col="red", lwd=1.5)

45c0cf32e568aea87654fd1b202d2ff2.png

负二项分布的演示

负二项分布的对数似然函数及其梯度

理论值

负二项分布的p.m.f.由以下公式给出

9d0d791a7b730b4594250db9845a3bbb.png

其中Γ表示β函数。存在另一种表示方法,即μ=m(1-p)/p或等价于p=m/(m+μ)。因此,一组观测值(x1,...,xn)的对数似然性是

59c8a8adae764b5051678535fa712c6c.png

相对于m和p的梯度是

b314894444b4e452c0bb3ec8c02e407c.png

R实现

我们最小化对数似然性的相反_数_:实现梯度的相反_数_。

m <- x\[1\]
  p <- x\[2\]
  c(sum(psigamma(obs+m)) - n\*psigamma(m) + n\*log(p),
    m*n/p - sum(obs)/(1-p))

样本的随机生成

#(1) β分布

trueval <- c("size"=10, "prob"=3/4, "mu"=10/3)
x <- rnbinom(n, trueval\["size"\], trueval\["prob"\])

hist(x, prob=TRUE, ylim=c(0, .3))

c1e00e1e665b5c34bc35121c31bcadf8.png

拟合负二项分布

定义控制参数并做基准。

list(trace=0, REPORT=1, maxit=1000)
fit(x, "nbinom", "mle", lower=0)

c67505a290a6c20dff231cbf1cab2101.png

在约束优化的情况下,我们通过使用对数障碍允许线性不平等约束。

使用形状参数δ1和δ2的exp/log变换,来确保形状参数严格为正。

#对起始值进行变换
mu <- size / (size+mu)
arg <- list(size=log(start), prob=log(start/(1-start)))

#为新的参数化重新定义梯度
function(x)
  c(exp(x\[1\]), plogis(x\[2\]))

fit(x, distr="nbinom2", method="mle")

7ded9d77e6ca8058a3ff664606f9b2d0.png

#返回到原始参数化
expo <- apply(expo, 2, Trans)

然后,我们提取拟合参数的值、相应的对数似然值和要最小化的函数的计数及其梯度(无论是理论上的梯度还是数值上的近似值)。

数值调查的结果

结果显示在以下表格中。1)没有指定梯度的原始参数(-B代表有界版本),(2)具有(真实)梯度的原始参数(-B代表有界版本,-G代表梯度),(3)没有指定梯度的对数转换参数,(4)具有(真实)梯度的对数转换参数(-G代表梯度)。

6a9ce403cd95f09036d9ced491c8463e.png 177e81977aa2864248d4ec0d60cf976c.png

b091792106567a0cba003bdb0b1ee15e.png

13ed0ca0312420abe7b95362c8b274a0.png

我们绘制了真实值(蓝色)和拟合参数(红色)周围的对数似然曲面图。

surface(min.arg=c(5, 0.3), max.arg=c(15, 1), 
         )
points(trueval , pch="x")

607318ee90393ccb73c561a207b2820e.png

我们可以用bootdist函数来模拟bootstrap 复制的情况。

boot(fit(x, "nbinom", method="mle")

a7063c82a2901a8c7c4935b577c0d729.png

plot(b1)
abline(v=trueval)

19b1a766b1c963af03892143127c2a60.png

结论

基于前面的两个例子,我们观察到所有的方法都收敛到了同一个点。

然而,不同方法的函数评价(和梯度评价)的结果是非常不同的。此外,指定对数似然性的真实梯度对拟合过程没有任何帮助,通常会减慢收敛速度。一般来说,最好的方法是标准BFGS方法或对参数进行指数变换的BFGS方法。由于指数函数是可微的,所以渐进特性仍被保留(通过Delta方法),但对于有限样本来说,这可能会产生一个小的偏差。


b54102cd75f88865b486c5b57140ff16.jpeg

最受欢迎的见解

点击标题查阅往期内容

Python基于粒子群优化的投资组合优化研究

R语言Fama-French三因子模型实际应用:优化投资组合

matlab使用贝叶斯优化的深度学习:卷积神经网络CNN

R语言最优化问题中的共轭函数

matlab使用Copula仿真优化市场风险数据VaR分析

matlab使用Copula仿真优化市场风险

R语言解决最优化运营研究问题-线性优化(LP)问题

R语言确定聚类的最佳簇数:3种聚类优化方法

matlab使用贝叶斯优化的深度学习

Python中基于网格搜索算法优化的深度学习模型分析糖尿病数据

R语言使用随机技术差分进化算法优化的Nelson-Siegel-Svensson模型

R语言非参数方法:使用核回归平滑估计和K-NN(K近邻算法)分类预测心脏病数据

R语言参数检验 :需要多少样本?如何选择样本数量

R语言非参数模型厘定保险费率:局部回归、广义相加模型GAM、样条回归

R语言用Rcpp加速Metropolis-Hastings抽样估计贝叶斯逻辑回归模型的参数

R语言Copula的贝叶斯非参数MCMC估计

欲阅读全文,请点击左下角“阅读原文”。

7c0340dade073f43843bb03b981f6705.gif

0dda43aaf587efdb5f969ab79a1611b7.png

8356c56d9c94c900ef238319f8f3cb33.jpeg

cb40fe5fe5179966e30d6f8ccac1bfe6.png

欲阅读全文,请点击左下角“阅读原文”。

0bf771cf5f1ae9577b1ad14fedad2063.gif

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/tecdat/article/details/129387449

智能推荐

JavaScript学习笔记_curry函数未定义-程序员宅基地

文章浏览阅读343次。五种原始的变量类型1.Undefined--未定义类型 例:var v;2.String -- ' '或" "3.Boolean4.Number5.Null--空类型 例: var v=null;Number中:NaN -- not a number非数本身是一个数字,但是它和任何数字都不相等,代表非数,它和自己都不相等判断是不是NaN不能用=_curry函数未定义

兑换码编码方案实践_优惠券编码规则-程序员宅基地

文章浏览阅读1.2w次,点赞2次,收藏17次。兑换码编码设计当前各个业务系统,只要涉及到产品销售,就离不开大大小小的运营活动需求,其中最普遍的就是兑换码需求,无论是线下活动或者是线上活动,都能起到良好的宣传效果。兑换码:由一系列字符组成,每一个兑换码对应系统中的一组信息,可以是优惠信息(优惠券),也可以是相关奖品信息。在实际的运营活动中,要求兑换码是唯一的,每一个兑换码对应一个优惠信息,而且需求量往往比较大(实际上的需求只有预期_优惠券编码规则

c语言周林答案,C语言程序设计实训教程教学课件作者周林ch04结构化程序设计课件.ppt...-程序员宅基地

文章浏览阅读45次。C语言程序设计实训教程教学课件作者周林ch04结构化程序设计课件.ppt* * 4.1 选择结构程序设计 4.2 循环结构程序设计 4.3 辅助控制语句 第四章 结构化程序设计 4.1 选择结构程序设计 在现实生活中,需要进行判断和选择的情况是很多的: 如果你在家,我去拜访你 如果考试不及格,要补考 如果遇到红灯,要停车等待 第四章 结构化程序设计 在现实生活中,需要进行判断和选择的情况..._在现实生活中遇到过条件判断的问

幻数使用说明_ioctl-number.txt幻数说明-程序员宅基地

文章浏览阅读999次。幻数使用说明 在驱动程序中实现的ioctl函数体内,实际上是有一个switch{case}结构,每一个case对应一个命令码,做出一些相应的操作。怎么实现这些操作,这是每一个程序员自己的事情。 因为设备都是特定的,这里也没法说。关键在于怎样组织命令码,因为在ioctl中命令码是唯一联系用户程序命令和驱动程序支持的途径 。 命令码的组织是有一些讲究的,因为我们一定要做到命令和设备是一一对应的,利_ioctl-number.txt幻数说明

ORB-SLAM3 + VScode:检测到 #include 错误。请更新 includePath。已为此翻译单元禁用波浪曲线_orb-slam3 include <system.h> 报错-程序员宅基地

文章浏览阅读399次。键盘按下“Shift+Ctrl+p” 输入: C++Configurations,选择JSON界面做如下改动:1.首先把 “/usr/include”,放在最前2.查看C++路径,终端输入gcc -v -E -x c++ - /usr/include/c++/5 /usr/include/x86_64-linux-gnu/c++/5 /usr/include/c++/5/backward /usr/lib/gcc/x86_64-linux-gnu/5/include /usr/local/_orb-slam3 include 报错

「Sqlserver」数据分析师有理由爱Sqlserver之十-Sqlserver自动化篇-程序员宅基地

文章浏览阅读129次。本系列的最后一篇,因未有精力写更多的入门教程,上篇已经抛出书单,有兴趣的朋友可阅读好书来成长,此系列主讲有理由爱Sqlserver的论证性文章,希望读者们看完后,可自行做出判断,Sqlserver是否真的合适自己,目的已达成。渴望自动化及使用场景笔者所最能接触到的群体为Excel、PowerBI用户群体,在Excel中,我们知道可以使用VBA、VSTO来给Excel带来自动化操作..._sqlsever 数据分析

随便推点

智慧校园智慧教育大数据平台(教育大脑)项目建设方案PPT_高校智慧大脑-程序员宅基地

文章浏览阅读294次,点赞6次,收藏4次。教育智脑)建立学校的全连接中台,对学校运营过程中的数据进行处理和标准化管理,挖掘数据的价值。能:一、原先孤立的系统聚合到一个统一的平台,实现单点登录,统一身份认证,方便管理;三、数据共享,盘活了教育大数据资源,通过对外提供数。的方式构建教育的通用服务能力平台,支撑教育核心服务能力的沉淀和共享。物联网将学校的各要素(人、机、料、法、环、测)全面互联,数据实时。智慧校园解决方案,赋能教学、管理和服务升级,智慧教育体系,该数据平台具有以下几大功。教育大数据平台底座:教育智脑。教育大数据平台,以中国联通。_高校智慧大脑

编程5大算法总结--概念加实例_算法概念实例-程序员宅基地

文章浏览阅读9.5k次,点赞2次,收藏27次。分治法,动态规划法,贪心算法这三者之间有类似之处,比如都需要将问题划分为一个个子问题,然后通过解决这些子问题来解决最终问题。但其实这三者之间的区别还是蛮大的。贪心是则可看成是链式结构回溯和分支界限为穷举式的搜索,其思想的差异是深度优先和广度优先一:分治算法一、基本概念在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两_算法概念实例

随笔—醒悟篇之考研调剂_考研调剂抑郁-程序员宅基地

文章浏览阅读5.6k次。考研篇emmmmm,这是我随笔篇章的第二更,原本计划是在中秋放假期间写好的,但是放假的时候被安排写一下单例模式,做了俩机试题目,还刷了下PAT的东西,emmmmm,最主要的还是因为我浪的很开心,没空出时间来写写东西。  距离我考研结束已经快两年了,距离今年的考研还有90天左右。  趁着这个机会回忆一下青春,这一篇会写的比较有趣,好玩,纯粹是为了记录一下当年考研中发生的有趣的事。  首先介绍..._考研调剂抑郁

SpringMVC_class org.springframework.web.filter.characterenco-程序员宅基地

文章浏览阅读438次。SpringMVC文章目录SpringMVC1、SpringMVC简介1.1 什么是MVC1.2 什么是SpringMVC1.3 SpringMVC的特点2、HelloWorld2.1 开发环境2.2 创建maven工程a>添加web模块b>打包方式:warc>引入依赖2.3 配置web.xml2.4 创建请求控制器2.5 创建SpringMVC的配置文件2.6 测试Helloworld2.7 总结3、@RequestMapping注解3.1 @RequestMapping注解的功能3._class org.springframework.web.filter.characterencodingfilter is not a jakart

gdb: Don‘t know how to run. Try “help target“._don't know how to run. try "help target".-程序员宅基地

文章浏览阅读4.9k次。gdb 远程调试的一个问题:Don't know how to run. Try "help target".它在抱怨不知道怎么跑,目标是什么. 你需要为它指定target remote 或target extended-remote例如:target extended-remote 192.168.1.136:1234指明target 是某IP的某端口完整示例如下:targ..._don't know how to run. try "help target".

c语言程序设计教程 郭浩志,C语言程序设计教程答案杨路明郭浩志-程序员宅基地

文章浏览阅读85次。习题 11、算法描述主要是用两种基本方法:第一是自然语言描述,第二是使用专用工具进行算法描述2、c 语言程序的结构如下:1、c 语言程序由函数组成,每个程序必须具有一个 main 函数作为程序的主控函数。2、“/*“与“*/“之间的内容构成 c 语言程序的注释部分。3、用预处理命令#include 可以包含有关文件的信息。4、大小写字母在 c 语言中是有区别的。5、除 main 函数和标准库函数以..._c语言语法0x1e