欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    深度学习基础ppt课件.pptx

    • 资源ID:30266215       资源大小:3.74MB        全文页数:16页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    深度学习基础ppt课件.pptx

    我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物基于基于YOLOYOLO的图像识别的图像识别目录 CONTENTS1问题概述2YOLO简介与原理4使用数据及结果3YOLO代价函数PART01问题概述问题概述我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物图像是指物体的描述信息,数字图像是一个物体的数字表示。视觉是人类感知外部世界的最重要手段,据统计,在人类获取的信息中,视觉信息占60%,而图像正式人类获取信息的重要途径,因此,和视觉紧密相关的数字图像处理技术的项目的开发越来越受到人们的关注,逐渐形成图像识别技术。随着数字图像处理技术的发展和实际应用的需求。许多问题不要求其输出结果是一幅完整的图像本身,而是将经过一定处理后的图像再分割和描述,提取有效的特征,进而加以判断分类,这种技术就是图像的模式识别。PART02YOLOYOLO简介简介我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物3. 这个confidence代表了所预测的box中含有 object的置信度和这个box预测的有多准两重信息其中如果有object落在一个grid cell里,第一项取1,否则取0。 第二项是预测的bounding box和实际的ground truth之间的IOU值。 YOLO算法YOLO为一种新的目标检测方法,该方法的特点是实现快速检测的同时还达到较高的准确率。作者将目标检测任务看作目标区域预测和类别预测的回归问题。 核心思想1. 将一幅图像分成SxS个网格(grid cell),如果某个object的中心落在这个网格中,则这个网格负责预测这个object。2. 每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值,即每个box要预测(x, y, w, h)和confidence共5个值。Redmon et al., 2015, You Only Look Once: Unified real-time object detection我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 Yolov3的改进1. yolov3采用多尺度预测。(13*13)(26*26)(52*52)2. 原论文时基于coco数据集的,而本实验是要检测汽车,所以先验框的大小可 能有所不同,先通过k_means聚类算法得到本实验的先验框的大小:40,30, 60,42, 89,69, 93,276, 127,94, 148,53, 223,114, 339,172, 418,3293. YOLO的CNN网络把图片分成 S*S 个网格(13*13,26 *26,52*52),然后每个单元格负责去检测那些中心点落在该格子内的目标。每个单元格需要预测 3*(4+1+B)个值。如果将输入图片划分为 S*S 网格,那么每层最终预测值为 S*S*3*(4+1+B) 大小的张量。(B为类别数)(52*52)(26*26)(13*13)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物YOLO_v3结构图如下所示DBLDBL: 就是卷积 + BN + Leaky_relu,共同构成了最小组件。resnresn:n代表数字,有res1,res2, ,res8等等,表示这个res_block里含有多少个res_unit。这是yolo_v3的大组件,yolo_v3开始借鉴了ResNet的残差结构,使用这种结构可以让网络结构更深。concatconcat:张量拼接。将darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。PART03YOLOYOLO代价函数代价函数我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 代价函数误差 = 定位误差 + 分类误差误差 = 定位误差 + 置信度误差 + 分类误差误差 = 定位误差 + 包含目标的框置信度误差 + 不包含目标的框置信度误差 + 分类误差Output:S x S x (5*B+C)的一个tensorB:(x, y, w, h, confidence)C:识别的类的数量不能等值加权置信度有两类我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 代价函数采用平方根之差兼顾大框和小框的误差PART04使用数据及结果使用数据及结果我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物训练数据与测试数据本次使用的数据为152张图片文件,与已经对这些图片中的车辆信息标注好的XML文件作为训练数据,而使用130张图片作为测试数据,52张图片作为验证数据,4张图片为一个batch, 示例如下所示:结果展示如下图所示,为YOLO识别结果,可以清楚地看到,图像中车辆已被识别出来结果展示下图是训练集,测试集损失函数以及学习率的学习曲线,训练集的误差,验证集误差不断减小,先用三层网络预训练200轮,学习率为0.00005,预训练结束后用全部网络训练,改变学习率为0.000001,若loss值在5个以内没有超过阈值,就进行10倍的衰减,对于val_loss若在7个以内没有超过阈值,就认为模型没有继续学习,进行early_stopping若可以说明结果实现了对图片中车辆信息的提取。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物感 谢 各 位 的 观 看感 谢 各 位 的 观 看

    注意事项

    本文(深度学习基础ppt课件.pptx)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开