从服装关键点、信息检索、个性化推荐到智能试衣电商AI技术如何进化?.docx
《从服装关键点、信息检索、个性化推荐到智能试衣电商AI技术如何进化?.docx》由会员分享,可在线阅读,更多相关《从服装关键点、信息检索、个性化推荐到智能试衣电商AI技术如何进化?.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、从服装关键点、信息检索、个性化推荐到智能试衣,电商AI技术如何进化?【导读】近日ICCVDeepFashion2Challenge2019公布了比赛结果首次参赛的美图影像实验室MTlab凭借其在综合检测精度上的优势以明显差距斩获服饰关键点估计LandmarkEstimation赛道的冠军。DeepFashion2Challenge此次共吸引18支国内外顶级技术团队介入包括清华大学、阿里巴巴等知名企业及学术机构。图1ICCVDeepFashion2Challenge2019据介绍DeepFashion2Challenge是基于DeepFashion1以及DeepFashion2公开数据集根底上的
2、计算机视觉领域技术竞赛。今年度的比赛分为两个赛道服饰关键点估计及服饰检索ClothesRetrieval。此次美图介入的是服饰关键点估计赛道服饰关键点估计比赛包含193,000个图像训练数据32,000个验证集图像数据63,000个测试集图像数据。比赛任务中包含13个不同的服饰类别每个类别都有独立的8到37个关键点共计294个关键点。怎样实现同时检测多个类别共294个关键点是此次比赛的难点之一。此外如图2所示DeepFashion2数据集包含了多种尺度、遮挡、视角等复杂情况下的服饰图像数据因此提升模型对服饰在不同情况下的鲁棒性也是比赛的一大挑战需要投入大量的研发精力。图2DeepFashion
3、2数据类型分布在本次比赛中MTlab团队所建立的模型在综合检测精度表现出明显优势该模型可以同时对13个类别的服饰进展关键点估计相较于多个模型而言大大降低了算法复杂度和使用本钱。其次该模型还具备良好的扩展性通过类别信息的使用可以一次应对多类别的数据。目前基于多目的的关键点估计方法大致可以分为自下而上Bottom-up以及自上而下Top-down两类。自上而下的方法主要包含两个步骤首先通过目的检测算法将图像中的每一件服饰检测出来随后针对每一个检测出来的服饰区域图像估计其关键点位置。自下而上的方法也包含两个步骤首先将图片中所有的服饰关键点检测出来然后通过一定计算方式将关键点聚类到不同的服饰上。为了进
4、步模型的扩展性与应用性并且缓解单图多目的穿插重叠导致的关键点错位等问题MTlab采用了基于自上而下方法的关键点检测方案即将该任务分解成多目的框检测及单目的关键点估计并将这两步操作进展单独优化。基于自上而下的方法第一步是进展服饰检测。目的检测是计算机视觉中的核心任务之一。目的检测即自动找到图像中所有目的物体包含物体的定位以及物体分类两个子任务同时确定物体的类别与位置。当前对目的检测的研究是学术界的一个热点R-CNN、FastR-CNN、FasterR-CNN、YOLO及SSD等一系列模型的提出大大加速了该领域的开展比方人脸检测、行人检测及车辆检测等在工业界也得到了很好的应用。但是针对服饰数据的目
5、的检测任务当前少有研究也应用缺乏一个主要的原因是服饰数据标注难度较大且公开的高质量标注数据集少。此次比赛的数据集除了服饰关键点标签外还提供了包含服饰检测框外的多种标注标签据此MTlab团队可以进展服饰检测的模型训练学习。此外基于自上而下的方案由于最终关键点是基于目的检测的结果来做估计的所以服饰检测的好坏对最后成绩的影响至关重要。第二步进展单服饰的关键点估计。目前对关键点的估计应用最多的是人体骨骼点估计,已有的方法在模型上可分为单阶段的One-stage和多阶段的Multi-stage在输出上可分为基于坐标回归Coordinate、热力图Heatmap和热力图结合偏移信息HeatmapOffse
6、ts。相对于人体骨骼数据服饰关键点数据在遮挡、角度、尺度和非刚性变形尤为严重这也使得服饰关键点估计异常困难。在最终的施行方案中MTlab首先在图上做目的框检测找出可能为服饰的目的框由此可以获得较多粗略的服饰框。再基于这些框的检测结果去做单服饰目的框的关键点估计并同时对框进展额外的打分给出最终有效的关键点。通过这种方案可以分开优化多目的框检测模型以及单目的关键点估计模型降低模型优化复杂度进而可以更充分地利用计算资源以进步该模型的准确度。而在应用层面上服饰检测与服饰关键点识别有不同的应用领域两个模型均可独立使用后续模型仍可以有效地通过不同数据持续优化进步。图3服饰关键点预测流程图在比赛的多目的框检
7、测阶段MTlab采用了HybridTaskCascademodel(如图3上图所示)作为根底模型。而在单目的关键点估计阶段那么以Multi-stagePoseEstimationNetwork(图3下列图所示)的肢体关键点估计模型作为根底模型。在两个根底模型上MTlab基于服饰关键点检测任务的特点和评价指标针对模型的不同方面进展了深化的优化及改良由于服饰检测任务较为复杂各种尺度及遮盖等情况往往会造成误检、漏检等问题所以MTlab使用多尺度训练及多尺度测试的检测方案对模型进一步优化。同时利用该方案twostage的特性在目的框检测经过中优化了模型的召回率在关键点估计模型中除了给出关键点还会对目的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 服装 关键 信息 检索 个性化 推荐 智能 试衣 AI 技术 如何 进化
限制150内