深度学习基础Mchapter1ALL (1).pdf
《深度学习基础Mchapter1ALL (1).pdf》由会员分享,可在线阅读,更多相关《深度学习基础Mchapter1ALL (1).pdf(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、(TheIntroductionofDeepLearning)深度学习的引出深度学习的引出1人类的学习2自行车自行车汽车汽车?自行车汽车什么是机器学习?3xy训练(求参数?,?,?的取值)举例:两类数据点,如何进行分类?机器学习(Machine Learning)是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数。并最终对数据进行预测和分析的一门学科。其基础主要是归纳和统计。?问题模型已明确分类结果的样本数据集(训练集)模型(参数?,?,?具有了最终的取值)分类/判别待分类的数据结果(待分类数据属于哪一类别的判断)(模型参数?,?,?的取值待确定)?,其中?1,?0,?,?表示阈
2、值4问题:根据繁华程度(?)、交通便利度(?)、与市中心距离(?)、楼层(?)预测房价的高低:输入输出?,?,?,?从简单线性分类器到深度学习(一)?5深度学习网络往往包含多个中间层(隐藏层),且网络结构要更复杂一些!加入中间层(隐藏层):输入层输出层输出:?,其中?1,?0,?,?表示阈值中间层输入:某样本的四个分量?,?,?,?从简单线性分类器到深度学习(二)什么是深度学习?深度学习(Deeplearning)是一种实现机器学习的技术,是机器学习重要的分支。其源于人工神经网络的研究。深度学习的模型结构是一种含多隐层的神经网络。通过组合低层特征形成更加抽象的高层特征。6机器学习深度学习输入层
3、(InputLayer)隐藏层(HiddenLayer)输出层(OutputLayer)隐藏层(HiddenLayer)深度学习的来历 受到了人脑神经元工作机理的启发:典型神经元的结构深度学习的多层神经网络结构1995年支持向量机1969年Minsky 神经网络的三起两落:72012年深度学习2006年Hinton1986年Hinton1958年Rosenblatt深度学习领域“三驾马车”8Geoffery HintonGeoffery HintonYannLeCunYoshua Bengio LeCun提出了一种神经网络模型(卷积神经网络),用于手写字符图像识别。开创了将神经网络应用于自然语
4、言处理的先河。深度学习工具 Theano 的开发者。深度学习之父。2006年在Science发表文章,提出深度学习的概念。深度学习的应用领域910数据集拆分性能评价循环神经网络梯度计算信息熵特征工程回归问题正则化卷积神经网络递归神经网络课程后续内容安排生成式神经网络有监督模型无监督模型xyThanks!哈尔滨工业大学计算机学院 刘远超11(DataSetandItsSplit)数据集及其拆分数据集及其拆分12Iris(鸢尾花)数据集变色鸢尾(Iris versicolor)山鸢尾(Iris setosa)维吉尼亚鸢尾(iris virginica)分类特征:分类特征:花萼(sepal)和花瓣(
5、petal)的宽度和长度13二维表sepallength sepalwidth petallength petalwidthclass5.13.51.40.214.931.40.2173.24.71.426.43.24.51.526.33.362.535.82.75.11.93每个样本包含4个特征(单位:cm),1个类别标签(类别编码)。共有150个样本,3类,每类50个样本。Iris(鸢尾花)数据集(续)14数据集(dataset)的数学表示sepallength sepalwidth petallength petalwidthclass5.13.51.40.214.931.40.2173
6、.24.71.426.43.24.51.526.33.362.535.82.75.11.9315数据集在数学上通常表示为?,?,?,?,?,?,?,?的形式,其中?为样本特征。由于样本一般有多个特征,因而?,?,?。而?表示样本 的类别标签。类别标签的groundtruth与goldstandard ground truth:可翻译为地面实况等。在机器学习领域一般用于表示真实值、标准答案等,表示通过直接观察收集到的真实结果。gold standard:可翻译为金标准。医学上一般指诊断疾病公认的最可靠的方法。在机器学习领域,更倾向于使用“ground truth”。而如果用 gold stand
7、ard这个词,则表示其可以很好地代表ground truth。16数据集与有监督学习 有监督学习中数据通常分成训练集、测试集两部分。训练集(trainingset)用来训练模型,即被用来学习得到系统的参数取值。测试集(testingset)用于最终报告模型的评价结果,因此在训练阶段测试集中的样本应该是unseen的。有时对训练集做进一步划分为训练集和验证集(validationset)。验证集与测试集类似,也是用于评估模型的性能。区别是验证集主要用于模型选择和调整超参数,因而一般不用于报告最终结果。训练预测模型?,?)?比较17训练集=测试集=?,?,?,?,?,?,?,?训练集、测试集的拆分
8、可以使用sklearn(即scikitlearn)进行训练集、测试集的拆分。如何安装sklearn:anaconda是一个开源的Python发行版本,其包含了很多科学包及其依赖项,也包含sklearn。网址:https:/ 留出法(HoldOutMethod)数据拆分步骤:1.将数据随机分为两组,一组做为训练集,一组做为测试集2.利用训练集训练分类器,然后利用测试集评估模型,记录最后的分类准确率为此分类器的性能指标 留出法的优点是处理简单。而不足之处是在测试集上的预测性能的高低与数据集拆分情况有很大的关系,所以基于这种数据集拆分基础上的性能评价结果不够稳定。19训练集测试集数据集K折交叉验证
9、K折交叉验证的上述做法有助于提高评估结果的稳定性Round1D1D2D3D4D5Round2D1D2D3D4D5Round3D1D2D3D4D5Round4D1D2D3D4D5Round5D1D2D3D4D5TrainsetTestset5折交叉验证示意图测试结果1测试结果2测试结果3测试结果4测试结果5返回平均值20过程:1.数据集被分成K份(K通常取5或者10)2.不重复地每次取其中一份做测试集,用其他K1份做训练集训练,这样会得到K个评价模型3.将上述步骤2中的K次评价的性能均值作为最后评价结果分层抽样策略(分层抽样策略(StratifiedkfoldStratifiedkfold)将数
10、据集划分成k份,特点在于,划分的k份中,每一份内各个类别数据的比例和原始数据集中各个类别的比例相同。21数据集用网格搜索来调超参数(一)什么是超参数?指在学习过程之前需要设置其值的一些变量,而不是通过训练得到的参数数据。如深度学习中的学习速率等就是超参数。什么是网格搜索?假设模型中有2个超参数:A和B。A的可能取值为a1,a2,a3,B的可能取值为连续的,如在区间01。由于B值为连续,通常进行离散化,如变为0,0.25,0.5,0.75,1.0 如果使用网格搜索,就是尝试各种可能的(A,B)对值,找到能使的模型取得最高性能的(A,B)值对。22BA00.250.50.751.0a3a2a1用网
11、格搜索来调超参数(二)网格搜索与K折交叉验证结合调整超参数的具体步骤:1.确定评价指标;2.对于超参数取值的每种组合,在训练集上使用交叉验证的方法求得其K次评价的性能均值;3.最后,比较哪种超参数取值组合的性能最好,从而得到最优超参数的取值组合。训练预测模型预测K折交叉验证23训练集测试集超参数取值的每种组合Thanks!哈尔滨工业大学计算机学院 刘远超24(ClassificationProblemandItsPerformanceEvaluation)分类及其性能度量分类及其性能度量25分类问题 分类问题是有监督学习的一个核心问题。分类解决的是要预测样本属于哪个或者哪些预定义的类别。此时输
12、出变量通常取有限个离散值。分类的机器学习的两大阶段:1)从训练数据中学习得到一个分类决策函数或分类模型,称为分类器(classifier);2)利用学习得到的分类器对新的输入样本进行类别预测。两类分类问题与多类分类问题。多类分类问题也可以转化为两类分类问题解决,如采用一对其余(One-vs-Rest)的方法:将其中一个类标记为正类,然后将剩余的其它类都标记成负类。26分类性能度量准确率假设只有两类样本,即正例(positive)和负例(negative)。通常以关注通常以关注的类为正类,其他类为负类。的类为正类,其他类为负类。实际类别预测类别正负总计正TPFNP(实际为正)负FPTNN(实际为
13、负)表中AB模式:第二个符号表示预测的类别,第一个表示预测结果对了(True)还是错了(False)分类准确率(分类准确率(accuracy):分类器正确分类的样本数与总样本数之比:?27思考:假设共有100个短信,其实际情况为,其中有1个是垃圾短信,99个是非垃圾短信。某分类模型将这100个短信都分为非垃圾短信,则准确率(accuracy)为?分类性能度量精确率和召回率 精确率(precision)和召回率(recall):是二类分类问题常用的评价指标。是二类分类问题常用的评价指标。precision?recall?精确率反映了模型判定的正例中真正正例的比重。在垃圾短信分类器中,是指预测出的
14、垃圾短信中真正垃圾短信的比例。召回率反映了总正例中被模型正确判定正例的比重。医学领域也叫做灵敏度(sensitivity)。在垃圾短信分类器中,指所有真的垃圾短信被分类器正确找出来的比例。实际类别预测类别正例负例总计正例TPFNP(实际为正例)负例FPTNN(实际为负例)28分类性能度量PR曲线Area(AreaUnderCurve,或者简称AUC)Area的定义(p-r曲线下的面积)如下:?Area有助于弥补P、R的单点值局限性,可以反映全局性能。29如何绘制PR曲线要得到PR曲线,需要一系列Precision和Recall的值。这些系列值是通过阈值阈值来形成的。对于每个测试样本,分类器一般
15、都会给了“Score”值,表示该样本多大概率上属于正例。步骤:1.从高到低将“Score”值排序并依此作为阈值threshold;2.对于每个阈值,“Score”值大于或等于这个threshold的测试样本被认为正例,其它为负例。从而形成一组预测数据。实际类别预测类别正例负例总计正例TPFNP(实际为正例)负例FPTNN(实际为负例)样本#实际类别预测分值1P0.92N0.83P0.754N0.75P0.65?precision?,recall?)PNPNPN30分类性能度量F值 F值?是精确率和召回率的调和平均:?一般大于0。当=1时,退化为F1:?比较常用的是F1,即表示二者同等重要31分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度学习基础Mchapter1ALL 1 深度 学习 基础 Mchapter1ALL
限制150内