网上有关“神经网络的训练可以采用二阶优化方法吗”话题很是火热,小编也是针对神经网络的训练可以采用二阶优化方法吗寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。
1. 时间复杂度:使用二阶方法通常需要直接计算或者近似估计Hessian矩阵,这部分的时间损耗使得其相比一阶方法在收敛速度上带来的优势完全被抵消;
2. 某些非线性网络层很难(或不可能)使用二阶方法优化:如果这个情况为真,那是否可能针对每个网络层使用不同的优化方案,比如像Fully-Connected Layer这样的简单线性映射操作使用二阶方法,非线性网络层使用传统梯度下降方法?
3. 二阶方法容易被saddle points吸引,难以到达local minimal或者global minimal:NIPS 2014有篇论文([1406.2572] Identifying and attacking the saddle point problem in high-dimensional non-convex optimization)认为在高维情况下,神经网络优化最大的问题不是网络容易到达local minimal,而是容易被saddle points困住,因为在这种情况下,local minimal不管在loss值还是泛化能力上都与global minimal相差不大,反而是非常多的saddle points存在loss较高的空间中。
神经网络各个网络参数设定原则:
①、网络节点? 网络输入层神经元节点数就是系统的特征因子(自变量)个数,输出层神经元节点数就是系统目标个数。隐层节点选按经验选取,一般设为输入层节点数的75%。如果输入层有7个节点,输出层1个节点,那么隐含层可暂设为5个节点,即构成一个7-5-1 BP神经网络模型。在系统训练时,实际还要对不同的隐层节点数4、5、6个分别进行比较,最后确定出最合理的网络结构。
②、初始权值的确定? 初始权值是不应完全相等的一组值。已经证明,即便确定? 存在一组互不相等的使系统误差更小的权值,如果所设Wji的的初始值彼此相等,它们将在学习过程中始终保持相等。故而,在程序中,我们设计了一个随机发生器程序,产生一组一0.5~+0.5的随机数,作为网络的初始权值。
③、最小训练速率? 在经典的BP算法中,训练速率是由经验确定,训练速率越大,权重变化越大,收敛越快;但训练速率过大,会引起系统的振荡,因此,训练速率在不导致振荡前提下,越大越好。因此,在DPS中,训练速率会自动调整,并尽可能取大一些的值,但用户可规定一个最小训练速率。该值一般取0.9。
④、动态参数? 动态系数的选择也是经验性的,一般取0.6 ~0.8。
⑤、允许误差? 一般取0.001~0.00001,当2次迭代结果的误差小于该值时,系统结束迭代计算,给出结果。
⑥、迭代次数? 一般取1000次。由于神经网络计算并不能保证在各种参数配置下迭代结果收敛,当迭代结果不收敛时,允许最大的迭代次数。
⑦、Sigmoid参数 该参数调整神经元激励函数形式,一般取0.9~1.0之间。
⑧、数据转换。在DPS系统中,允许对输入层各个节点的数据进行转换,提供转换的方法有取对数、平方根转换和数据标准化转换。
扩展资料:
神经网络的研究内容相当广泛,反映了多学科交叉技术领域的特点。主要的研究工作集中在以下几个方面:
1.生物原型
从生理学、心理学、解剖学、脑科学、病理学等方面研究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。
2.建立模型
根据生物原型的研究,建立神经元、神经网络的理论模型。其中包括概念模型、知识模型、物理化学模型、数学模型等。
3.算法
在理论模型研究的基础上构作具体的神经网络模型,以实现计算机模拟或准备制作硬件,包括网络学习算法的研究。这方面的工作也称为技术模型研究。
神经网络用到的算法就是向量乘法,并且广泛采用符号函数及其各种逼近。并行、容错、可以硬件实现以及自我学习特性,是神经网络的几个基本优点,也是神经网络计算方法与传统方法的区别所在。
参考资料:
百度百科-神经网络(通信定义)关于“神经网络的训练可以采用二阶优化方法吗”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!
本文来自作者[邓嫁先]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/bpdc/202502-1506.html
评论列表(4条)
我是竹日号的签约作者“邓嫁先”!
希望本篇文章《神经网络的训练可以采用二阶优化方法吗》能对你有所帮助!
本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:网上有关“神经网络的训练可以采用二阶优化方法吗”话题很是火热,小编也是针对神经网络的训练可以采用二阶优化方法吗寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问...