一种基于可变形部件模型的快速对象检测算法-李春伟.pdf
《一种基于可变形部件模型的快速对象检测算法-李春伟.pdf》由会员分享,可在线阅读,更多相关《一种基于可变形部件模型的快速对象检测算法-李春伟.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 38卷 第 11期 电 子 与 信 息 学 报 Vol.38No.112016年 11月 JournalofElectronics&InformationTechnology Nov.2016一 种 基 于 可 变 形 部 件 模 型 的 快 速 对 象 检 测 算 法李春伟*于洪涛李邵梅卜佑军(国家数字交换系统工程技术研究中心郑州450002)摘 要 : 为 了 解 决 可 变 形 部 件 模 型 检 测 过 程 中 的 速 度 瓶 颈 问 题 , 该 文 针 对 模 型 的 检 测 流 程 , 提 出 一 种 结 合 快 速 特 征金 字 塔 计 算 的 级 联 可 变 形 部 件 模
2、 型 。 由 于 模 型 的 检 测 速 度 主 要 取 决 于 特 征 计 算 以 及 对 象 定 位 这 两 个 过 程 , 提 出 一 种两 阶 段 的 加 速 算 法 : 首 先 采 用 尺 度 上 稀 疏 采 样 的 特 征 金 字 塔 来 近 似 表 示 精 细 采 样 的 多 尺 度 图 像 特 征 , 以 加 快 特 征 计算 过 程 ; 然 后 在 定 位 过 程 中 结 合 级 联 算 法 , 以 一 个 序 列 模 型 顺 序 地 评 估 各 个 部 件 , 从 而 快 速 剪 除 大 部 分 可 能 性 较 小的 对 象 假 设 , 以 加 快 对 象 定 位 过 程
3、。 在 PASCALVOC2007和 INRIA数 据 集 上 的 实 验 结 果 表 明 , 该 算 法 可 以 明 显加 快 检 测 速 度 , 而 检 测 精 度 仅 略 有 下 降 。关 键 词 : 快 速 对 象 检 测 ; 可 变 形 部 件 模 型 ; 特 征 计 算 ; 级 联 检 测中 图 分 类 号 : TP391.4 文 献 标 识 码 : A 文 章 编 号 : 1009-5896(2016)11-2864-07DOI:10.11999/JEIT160080Rapid Object Detection Algorithm Based on Deformable Part
4、 ModelsLIChunwei YUHongtao LIShaomei BUYoujun(National Digital Switching System Engineering & Technological Research Center, Zhengzhou 450002, China)Abstract:Tosolvethespeedbottleneckofdeformablepartmodelsinthedetectionprocess,thispaperproposesacascadedeformablepartmodelwithrapidcomputationoffeature
5、pyramidsforthedetectionprocessofthemodel.Becausethespeedofthedetectionismainlydeterminedbythetwoprocessesofthefeaturecomputationandtheobjectlocation,atwo-stagespeedupalgorithmisproposed.Firstly,sparsely-sampledfeaturepyramidsonthescaleare utilized to approximate finely-sampled multi-scale image feat
6、ures to speed up the process of featurecomputation.Thencombinedwiththecascadealgorithminthelocation process,asequencemodelisutilizedtoevaluateindividualpartssequentiallysoastorapidlyprunemostobjecthypothesesofsmallpossibilitiesinordertospeeduptheprocessofobjectlocation.Theexperimentalresultson PASCA
7、LVOC2007dataset andINRIAdataset show that the algorithm in the paper apparently speeds up the speed of detection with minor loss indetectionprecision.Key words:Rapidobjectdetection;Deformablepartmodel;Featurecomputation;Cascadedetection1 引 言对 象 检 测 技 术 是 计 算 机 视 觉 的 关 键 技 术 和 研 究热 点 之 一 。 可 变 形 部 件
8、模 型 1(Deformable PartModel, DPM)作 为 现 今 最 流 行 的 对 象 检 测 算 法 之一 , 在 对 象 检 测 领 域 著 名 的 PASCALVOC竞 赛 中多 次 取 得 优 异 的 成 绩 , 目 前 已 经 扩 展 应 用 到 人 体 姿态 估 计 2, 行 人 检 测 3, 人 脸 检 测 4, 以 及 智 能 交 通 5等 诸 多 领 域 。 但 是 DPM模 型 中 涉 及 的 梯 度 方 向 直方 图6(HistogramofOrientedGradient,HOG)特 征金 字 塔 的 提 取 和 对 象 定 位 两 部 分 的 运 算
9、量 都 较 大 ,收 稿 日 期 : 2016-01-19; 改 回 日 期 : 2016-06-08; 网 络 出 版 : 2016-09-01*通 信 作 者 : 李 春 伟 基 金 项 目 : 国 家 自 然 科 学 基 金 (61572519,61521003)Foundation Items: The National Natural Science Foundation ofChina(61572519,61521003)导 致 在 单 机 上 处 理 单 张 PASCAL数 据 集 中 的 图 像时 , 运 行 时 间 在 10s左 右 , 无 法 满 足 实 际 应 用 需 求
10、 。为 此 , 近 年 来 研 究 学 者 针 对 DPM的 加 速 问 题 开 展了 系 列 研 究 。 现 有 的 DPM模 型 加 速 研 究 主 要 集 中在 以 下 两 个 方 面 :单 类 别 加 速 算 法 : 主 要 关 注 于 单 个 类 别 检 测 中DPM模 型 的 加 速 效 果 。 文 献 7,8通 过 较 早 地 剪 除 无望 的 对 象 假 设 来 减 少 计 算 量 , 前 者 根 据 部 件 滤 波 器的 得 分 , 使 用 中 间 阈 值 来 剪 除 得 分 较 低 的 部 件 假 设 。但 是 需 要 专 门 的 确 认 数 据 集 来 训 练 中 间 阈
11、 值 。 后 者通 过 使 用 多 分 辨 率 的 层 次 部 件 模 型 , 逐 次 对 目 标 假设 进 行 判 断 , 但 是 其 对 于 检 测 精 度 有 一 定 的 影 响 。文 献 9采 用 一 种 类 似 于 文 献 7中 的 加 速 策 略 , 通 过一 种 积 极 的 部 件 选 择 策 略 优 化 了 滤 波 器 评 估 的 顺序 。 文 献 10在 所 有 可 能 的 图 像 区 域 上 搜 索 全 局 最 优万方数据第 11期 李 春 伟 等 : 一 种 基 于 可 变 形 部 件 模 型 的 快 速 对 象 检 测 算 法 2865的 分 类 结 果 , 然 而 该
12、 方 法 使 用 最 大 响 应 的 上 确 界 进行 搜 索 窗 口 的 裁 剪 操 作 , 其 有 效 性 极 大 地 依 赖 于 边界 的 健 壮 性 。 文 献 11采 用 GPU实 现 并 行 计 算 , 但是 对 计 算 机 硬 件 提 出 了 较 高 的 要 求 ; 文 献 12使 用 快速 傅 里 叶 变 换 来 加 速 检 测 过 程 中 卷 积 计 算 过 程 。 文献 13通 过 多 种 加 速 方 法 间 的 组 合 来 构 建 完 整 的 加速 策 略 。多 类 别 加 速 算 法 : 文 献 14使 用 大 量 部 件 集 合 中的 稀 疏 线 性 组 合 来 对
13、可 变 形 部 件 进 行 编 码 , 以 此 来压 缩 模 型 中 所 使 用 的 有 效 部 件 数 ; 文 献 15使 用 少 量基 本 的 部 件 集 合 的 线 性 组 合 来 近 似 表 示 模 板 中 视角 、 形 变 、 尺 度 等 方 面 的 变 化 。 类 似 的 方 法 在 文 献 16中 也 进 行 了 相 关 研 究 。 这 两 种 方 法 都 是 通 过 学 习 得到 一 组 共 享 的 基 元 部 件 , 来 获 取 类 别 层 次 的 检 测 效果 。 文 献 17提 出 了 基 于 局 部 敏 感 的 哈 希 算 法 来 近 似DPM中 的 卷 积 计 算 ,
14、 处 理 的 对 象 类 别 达 到 了 100000种 , 但 是 对 于 检 测 精 度 的 影 响 较 大 。综 上 , 可 以 看 出 已 有 研 究 中 主 要 关 注 对 象 定 位加 速 , 并 且 取 得 了 一 些 成 果 , 但 是 对 于 特 征 计 算 加速 关 注 较 少 。 所 以 想 要 进 一 步 提 高 DPM模 型 的 处理 速 度 , 就 不 得 不 考 虑 特 征 计 算 部 分 的 加 速 问 题 。由 此 , 本 文 提 出 了 一 种 针 对 可 变 形 部 件 模 型 的 两 阶段 加 速 算 法 : 首 先 , 采 用 尺 度 上 稀 疏 采
15、样 的 特 征 金字 塔 近 似 表 示 精 细 采 样 的 多 尺 度 特 征 金 字 塔 , 以 此来 加 快 特 征 计 算 过 程 ; 然 后 , 采 用 级 联 算 法 来 加 速对 象 定 位 过 程 。 为 了 便 于 叙 述 , 后 续 将 本 文 提 出 的方 法 称 之 为 结 合 快 速 特 征 金 字 塔 的 级 联 可 变 形 部 件模 型 (Cascade Deformable Part Model with Fastfeaturepyramid,FCDPM)。2 基 于 幂 指 定 律 的 快 速 特 征 金 字 塔 计 算在 基 于 多 尺 度 特 征 金 字
16、塔 的 滑 动 窗 口 模 型 中 为了 解 决 模 板 尺 寸 与 对 象 尺 寸 不 一 致 的 问 题 , 需 要 对目 标 图 像 多 次 进 行 下 采 样 得 到 不 同 尺 度 下 的 图 像 ,然 后 再 在 逐 个 尺 度 的 图 像 上 逐 个 位 置 上 计 算 图 像 特征 , 从 而 生 成 精 细 的 特 征 金 字 塔 , 该 方 法 得 到 的 特征 精 度 高 , 但 是 相 应 的 时 间 开 销 也 较 大 。 已 有 研 究人 员 对 特 征 金 字 塔 进 行 研 究 , 发 现 多 尺 度 金 字 塔 尺度 间 的 特 征 存 在 一 定 的 关 系
17、 , 且 满 足 幂 指 定 律 18,19。由 此 , 本 文 提 出 在 特 征 金 字 塔 的 计 算 过 程 中 , 利 用多 尺 度 特 征 中 的 幂 指 定 律 有 选 择 地 计 算 部 分 尺 度 图像 的 特 征 , 然 后 基 于 这 些 尺 度 图 像 的 特 征 对 临 近 尺度 图 像 的 特 征 进 行 近 似 计 算 , 从 而 减 少 特 征 计 算 的运 算 量 。2.1 多 尺 度 特 征 间 的 幂 指 定 律为 了 便 于 描 述 , 本 节 先 简 要 介 绍 一 下 多 尺 度 图像 间 的 幂 指 定 律 。 对 于 给 定 的 输 入 图 像
18、I , 定 义 其对 应 的 通 道 特 征 为 图 像 像 素 的 某 种 线 性 或 是 非 线 性变 换 的 输 出 响 应 : ( )W=C I 。 其 中 W 表 示 某 种 计 算函 数 , C 表 示 输 出 响 应 。 定 义 fW 为 C 的 权 值 加 和 :( ) ( ), , , , ,i j si j sf w i j sW =I C , sI 为 图 像 I 在 尺 度 s 上的 重 采 样 图 像 , 其 中 sI 的 维 数 ( = ,s s sh g h sh)sg sg= 是 图 像 I 维 数 h g 的 s 倍 。 那 么 ( )fW sI 就被 定 义
19、 为 ( ) ( )1 , ,s ss s ijsf i j sh g sW I C (1)其 中 , ( )=s sWC I 。 由 此 , ( )fW sI 说 明 了 图 像 在 位 置( ),i j 以 及 尺 度 s 上 计 算 得 到 的 sC 的 全 局 平 均 值 。 在DPM模 型 中 , W 表 示 HOG特 征 映 射 函 数 。 最 终 目的 是 为 了 得 出 ( )fW I 与 尺 度 s 之 间 的 函 数 关 系 。 由 此设 ( )F I 定 义 了 图 像 I 的 统 计 信 息 , E 定 义 了 其 在图 片 集 中 的 数 学 期 望 。 由 文 献
20、19可 知 , 1 ( )/sE F I2 ( )sE F I 之 值 仅 与 尺 度 比 1/ 2s s 相 关 , 独 立 于 尺 度 值1s 以 及 2s 。 由 此 得 到( ) ( ) ( )1 2 1 2s sE E s s FF F -=I I (2)其 中 , F 表 示 对 应 的 拟 合 参 数 。 针 对 HOG特 征 计算 , 使 用 ( ) ( ),s sfW F WF = =I I , 由 此 期 望 得 出 图像 特 征 期 望 与 图 像 尺 度 之 间 的 关 系 。将 一 幅 图 像 I 视 为 K 幅 较 小 的 图 像 1 2, , , KI I I的
21、并 集 , 可 以 得 到 1 2= , , , KI I I I 。 由 于 HOG特 征对 于 旋 转 以 及 平 移 并 不 敏 感 , 因 此 ( ) 1( ,W W=I I2 1 2, , ) ( ), ( ), , ( )K KW W WI I I I I , 将 结 果 代 入式 (1)中 得 到 ( ) ( )kf f KW WI I (3)此 时 , 如 果 将 1 2, , , KI I I 视 为 一 个 较 小 的 图 像 集合 , 那 么 ( ) ( )kf E fW WI I 就 表 示 在 这 个 集 合 中 的 数学 期 望 , 即 图 像 的 全 局 特 征
22、均 值 ( )fW I 是 子 图 像 集 样本 特 征 均 值 ( )kfW I 的 数 学 期 望 。 由 于 ( )kfW I 可 以 视为 较 小 图 像 的 统 计 信 息 并 且 ( )kE fW I 表 示 了 在 这 一较 小 的 图 像 集 合 中 的 期 望 , 那 么 根 据 式 (2)可 以 得出 , 1 2 ( )/ ( ) ( 1/ 2)k ks sE f E f s s WW W -=I I 。 由 于 1( )sfW I1 ( )ksE fW I 并 且 ( ) ( )2 2ks sf E fW WI I , 进 而 推 断 出 :( ) ( ) ( )1 2
23、1 2s sf f s sWW W -I I (4)2.2 基 于 幂 指 定 律 的 尺 度 间 HOG 特 征 近 似 计 算本 节 将 上 述 定 律 应 用 到 DPM模 型 中 的 HOG特征 计 算 中 。 在 传 统 DPM模 型 中 , 计 算 尺 度 图 像 sI 的特 征 = ( )s sWC I 的 方 法 为 ( ( , )s R sW=C I , 其 中 R表示 采 样 函 数 , 即 需 要 首 先 将 图 像 I 缩 放 至 尺 度 s ,然 后 再 计 算 图 像 sI 的 HOG特 征 。 根 据 上 述 定 律 ,( )fW I 和 ( )sfW I 之 间
24、 存 在 对 应 关 系 , 为 此 在 已 知 原 始万方数据2866 电 子 与 信 息 学 报 第 38卷尺 寸 图 像 I 的 特 征 ( )W=C I 的 情 况 下 , 可 以 根 据 其对 sC 进 行 近 似 计 算 , 从 而 提 高 特 征 计 算 的 速 度 。具 体 过 程 为 , 对 于 式 (4)中 设 置 1 , 2 1s s s= = ,由 此 得 到 ( ) ( )sf f s WW W -I I 。 这 一 结 论 不 仅 适 用 于原 始 图 像 , 对 于 图 像 I 中 的 采 样 窗 口 w 以 及 重 采 样图 像 sI 中 的 sw 都 是 适
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 变形 部件 模型 快速 对象 检测 算法 李春伟
限制150内