梯度下降法ppt课件.pptx
《梯度下降法ppt课件.pptx》由会员分享,可在线阅读,更多相关《梯度下降法ppt课件.pptx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值梯度下降法阿育王2017.6.13资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值1.引言梯度下降(GD)是最小化风险函数、损失函数的一种常用方法。在应用机器学习算法时,通常采用梯度下降法来对采用的算法进行训练。资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值梯度下降法包含三种不同形式:批量梯度下降BGDBGD(Batch
2、 Gradient Descent)随机梯度下降SGDSGD(Stochastic Gradient Descent)小批量梯度下降法MBGDMBGD(Mini-Batch Gradient Descent)下文将以线性回归算法为例来对三种梯度下降法进行比较资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值2.先导知识一元线性回归(拟合曲线)假设这里存在m=6组数据(x,y)资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值从图上可以看出,大致数据
3、的大致走势是可以用线性模型y=kx+by=kx+b来表示的,为此我们建立一维线性回归模型。假设一维线性模型表达式如下:资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值其中:h h(x)(x)是假设函数,即要拟合的函数为待求解参数,即要迭代求解的值,求解出来了那最终要拟合的函数h(x)就确定了。n表示输入特征数,为方便计算,所有的样本都加入了x x0 0=1=1这个特征,所以维数为n+1n+1维维。资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值
4、对应的损失损失/误差函数误差函数,即估计值与真实值之间的差距,这里用2-范数表示为:其中:mm是训练集的样本个数样本个数1/2是为了后面求导计算方便资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值一个二维参数(0,1)组对应能量函数(描述整个系统的优化程度,随着网络的变化而减小,最终网络稳定时能量达到最小网络稳定时能量达到最小)的可视化图资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值3.批量梯度下降法BGD更新算法的目的:误差误差函数函数尽可
5、能小尽可能小,即求解参数使误差函数尽可能小。主要思想:首先,随机初始化参数随机初始化参数;然后,不断不断反复的反复的更新参数更新参数使得使得误差函数减小,误差函数减小,直到满足要求时停止。资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间价值梯度下降算法,利用初始化的参数并且反复更新参数:代表代表学习率学习率,表示每次每次向着向着函数函数J J最陡峭最陡峭的方向迈步的的方向迈步的大小(步长?)大小(步长?)资金是运动的价值,资金的价值是随时间变化而变化的,是时间的函数,随时间的推移而增值,其增值的这部分资金就是原有资金的时间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 梯度 下降 ppt 课件
限制150内