(2.1.1)--第二章_机器学习基本概念.pdf
《(2.1.1)--第二章_机器学习基本概念.pdf》由会员分享,可在线阅读,更多相关《(2.1.1)--第二章_机器学习基本概念.pdf(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据机器学习第二讲:机器学习基本概念 基本术语 监督学习 假设空间 学习三要素 奥卡姆剃刀定理 没有免费的午餐定理 训练误差和测试误差 正则化 泛化能力 生成模型与判别模型提纲 Data set形状=圆形 剥皮=难味道=酸甜形状=扁圆形 剥皮=易 味道=酸形状=长圆形 剥皮=难 味道=甜。Instance/sample Attribute value/feature Attribute/feature space Feature vector基本术语 D=x1,x2,xm m个示例的数据集是d维样本空间X的一个特征向量 training/learning training data trai
2、ning sample Label (形状=长圆形 剥皮=难 味道=甜),橙子)example基本术语 Classification regression binary classification multi-class classification Clustering Multi-labeling annotation 基本术语监督学习 监督学习目的是学习一个由输入到输出的映射,称为模型 模型的集合就是假设空间(hypothesis space)模型:概率模型:条件概率分布P(Y|X),非概率模型:决策函数Y=f(X)联合概率分布:假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y
3、)问题的形式化监督学习假设空间 hypothesis space 学习过程:搜索所有假设空间,与训练集匹配 形状=圆形 剥皮=难味道=酸甜 橙 形状=扁圆形 剥皮=易 味道=酸 橘 形状=长圆形 剥皮=难 味道=甜橙 假设形状,剥皮,味道 分别有3,2,3 种可能取值,加上取任意值*和空集,假设空间规模4x3x4+1=49 Version space:形状=*剥皮=难味道=*橙 形状=扁圆形 剥皮=易 味道=*橘 学习三要素:当假设空间F为决策函数的集合:F实质为参数向量决定的函数族:当假设空间F为条件概率的集合:F实质是参数向量决定的条件概率分布族学习三要素 策略 损失函数和风险函数 0-1
4、损失函数 0-1 loss function 平方损失函数 quadratic loss function 绝对损失函数 absolute loss function 对数损失函数 logarithmic loss function 或对数似然损失函数 loglikelihood loss function 学习三要素 策略 损失函数的期望 风险函数 risk function 期望损失 expected loss 经验风险 empirical risk,经验损失 empirical loss学习三要素 策略:经验风险最小化与结构风险最小化 经验风险最小化最优模型 当样本容量很小时,经验风险最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2.1 第二 机器 学习 基本概念
限制150内