哈哈(haha)体育

哈哈体育.(HAHA)十年运营,信誉无忧

返回新闻中心

? ? ?

手艺能力

以原创手艺系统为基本，，，，，，，，SenseCore商汤AI大装置为焦点基座，，，，，，，，结构多领域、多偏向前沿研究，，，，，，，，快速买通AI在各个笔直场景中的应用，，，，，，，，向行业赋能。。。。。

申请试用

相识所有案例

相识所有产品效劳

商汤研究

商汤研究始终坚持原创，，，，，，，，一直突破立异。。。。。具有人工智能领域深挚的学术积累，，，，，，，，具备健全的人才作育机制，，，，，，，，已与海内外五十余所一流高校和科研院所建设了深度相助关系，，，，，，，，并与众多行业同仁同心共建AI生态圈。。。。。

申请试用

相识所有案例

相识所有产品效劳

商汤大装置AI云 SenseCore

建设高效率、低本钱、规�；；；；；� AI 云基础设施，，，，，，，，打造专业的深度学习平台及算法模子系统，，，，，，，，引领AI立异，，，，，，，，助力工业界及学术界探索 AI 界线。。。。。

申请试用

相识所有案例

相识所有产品效劳

商汤日日新大模子 SenseNova

商汤日日新大模子 SenseNova，，，，，，，，可以提供自然语言处置惩罚、图片天生、自动化数据标注、自界说模子训练等多种大模子及能力。。。。。

申请试用

相识所有案例

相识所有产品效劳

水星智能移动终端平台 SenseME

哈哈(haha)体育SenseME 水星智能移动终端平台提供包括SDK、AI传感器和ISP芯片等全套产品，，，，，，，，能够支持诸多物联网装备，，，，，，，，以增进感知智能和内容增强

申请试用

相识所有案例

相识所有产品效劳

火星混淆现实平台 SenseMARS

SenseMARS平台通过对物理天下的数字重修、虚拟化身和软件智能体，，，，，，，，创立全新的陶醉式和交互式的元宇宙体验

申请试用

相识所有案例

相识所有产品效劳

晶识智能零售平台 SenseGalaxy

基于商汤SKU商品识别大模子，，，，，，，，用AI赋能智能结算、库存盘货、纯净度审核等营业场景并快速拓展至智慧商流与智慧物流领域。。。。。

申请试用

相识所有案例

相识所有产品效劳

焦点手艺: 以原创手艺系统为基本，，，，，，，，SenseCore商汤AI大装置为焦点基座，，，，，，，，结构多领域、多偏向前沿研究，，，，，，，，
快速买通AI在各个笔直场景中的应用，，，，，，，，向行业赋能。。。。。

< 返回论文解读

CVPR 2017 | 商汤科技及香港中大-商汤科技团结实验室精选论文解读（二）

2017-07-25

在今年的CVPR学术聚会上商汤科技与香港中大-商汤科技团结实验室配合揭晓的论文多达23篇，，，，，，，，香港中大林达华教授亲自精选五篇论文与各人分享。。。。。这五篇论文的研究效果在各个专业数据集、竞赛如ImageNet、Visual Genome、DAVIS Challenge、MPII中，，，，，，，，取得第一名的效果。。。。。

国际盘算机视觉与模式识别大会 (CVPR) 是人工智能尤其是盘算机视觉领域的顶级学术聚会。。。。。今年CVPR的文章录取率约莫29%。。。。。在CVPR上揭晓的论文被公以为代表了该领域科技生长的最高水平。。。。。从今年7月21日最先这个一年一度的盛会就在漂亮的夏威夷火奴鲁鲁召开。。。。。本届CVPR大谈判汤科技与香港中大-商汤科技团结实验室共揭晓了23篇论文，，，，，，，，凌驾了以人工智能手艺著称的科技巨头Google (21篇)和Facebook AI Research (7篇)。。。。。这23篇论文涵盖了盘算机视觉的多个领域，，，，，，，，不但提出了许多新型的应用，，，，，，，，也在焦点手艺的研发上取得了多项国际领先的效果。。。。。在本文中我们将以其中5篇论文为代表一窥商汤这个AI独角兽背后的焦点手艺立异之路。。。。。

PolyNet：深度网络设计的里程碑多项角逐夺冠

深度学习在这几年取得了令众人瞩目的成绩。。。。。这些成绩背后的最主要的手艺因素就是深度网络设计手艺的一直突破。。。。。深度网络的前进首先反应在ImageNet1000类图像分类的准确率上它是业界公认的权衡深度网络性能的一个主要指标。。。。。从AlexNet、GoogLeNet到ResNet网络越来越深准确率也在一直提升。。。。。在已往五年ImageNet分类准确率从84%提高到了97%。。。。。�？？？？？墒撬孀磐缟疃纫涣鎏硇阅艿慕徊教嵘钕扔龅搅似烤�。。。。。好比ResNet从一百多层增添到一千层性能也没有显著的提高。。。。。

面临这样的难题此论文提出了一种新的破局思绪增强网络的结构多样性(Structural diversity)。。。。。这个思绪源自于我们在实践中的一个主要视察多个差别结构的超深网络的简朴团结往往能带来性能的进一步显著提升。。。。。沿着这个思绪我们设计了PolyNet。。。。。它由多个差别形态的称为PolyInception的基本元组叠合在一起组成。。。。。由于每种元组都可以通过一个数学多项式表达出它的结构以是称为Polynomial Inception简称PolyInception。。。。。如上图所示每个PolyInception是内部合成了多个差别深度的并行通路。。。。。这个设计把结构多样性的头脑往前推进了主要一步把它融入到每个单位的设计之中。。。。。

此论文的作者透过系统性的比照实验对PolyNet的设计举行测试发明它相比于主流的设计包括ResNet以及由Google提出的InceptionResNet v2有更高的效率即在相同的盘算量下能获得显着更高的性能。。。。。文中形貌的Very Deep PolyNet在ImageNet大规模图像分类测试集上获得了single-crop过失率4.25%和multi-crop过失率3.45%的性能显著凌驾了Google提出的InceptionResNet v2和Facebook在统一时间揭晓的ResNeXt成为已揭晓的性能最高的网络也是深度网络设计领域的新标杆。。。。。

在ImageNet2016的角逐中商汤科技与香港中大-商汤科技团结实验室在多项角逐中选用了这种网络结构并取得了三个单项第一的优异效果。。。。。这一效果反应了一个高效的深度网络架构关于提升应用性能的主要作用。。。。。PolyNet的模子结构已在Github果真

https://github.com/CUHK-MMLAB/polynet

论文问题：PolyNet:A Pursuit of Structural Diversity in Very Deep Networks

论文作者：Xingcheng Zhang, Zhizhong Li, ChenChange Loy, Dahua Lin

Relational Net：Visual Genome上把关系识别准确率从48%大幅度提高到82%

物体检测与识别一直是盘算机视觉研究的主要偏向。。。。。近年来随着Faster RCNN等基于深度学习的检测框架的生长物体检测的性能有了长足的前进但这关于图像明确仍然是缺乏够的。。。。。泛起了同类型物体的图片它们背后转达的寄义可能是截然差别的。。。。。要明确这样的图片我们不但需要判断图中泛起的物体的类型并且需要明确物体之间的关系。。。。。

最近一段时间关系识别逐步进入盘算机视觉研究的视野。。。。。在这个问题上的一个有代表性的事情是斯坦福大学李飞飞团队在2016年10月揭晓在ECCV上的论文。。。。。该事情把语言先验用于关系识别相比于之前的要领取得了不错的希望关系识别的准确率提高到了48%。。。。。然而这样的准确率显然离知足适用需求仍有较大的距离同时它也反应的问题的难度。。。。。这个问题的主要挑战在于关系与物体有着显著差别的性子。。。。。某种类型的物体它的外观体现往往较量一致而统一种关系的外观体现往往千差万别。。。。。

此论文提出了一种新的建模要领把统计学习和深度网络有机地团结起来。。。。。此要领把一个基于条件随机场(Conditional Random Field)的迭代推断要领解开从而把它表达为一个前向盘算网络。。。。。这个前向网络和CRF一样具有统计推断的能力可是它可以被嵌入到一个更大的深度学习系统中和其它模�？？？？？橐黄鹁傩卸硕远说难�。。。。�；；；；；谡庵忠齑寺畚奶岢隽艘桓龀莆狣eep Relational Net的关系明确框架把特征学习以及跨领域关系学习团结成一个统一网络。。。。。这个框架在关系明确领域的主要数据集Visual Genome上把关系识别准确率从48%大幅度提高到82%从而为这个问题设立了新的性能标杆。。。。。这篇论文在CVPR 2017被吸收为Oral presentation。。。。。该论文相关代码与模子结构已经在Github果真

https://github.com/doubledaibo/drnet

论文问题：Detecting Visual Relationships with Deep Relational Networks

论文作者：Bo Dai, Yuqi Zhang, Dahua Lin

Deep Layer Cascade：斩获第一届DAVIS Challenge 视频语义支解角逐冠军

图像语义支解是图像明确的基石性手艺在自动驾驶系统等牵涉街景或场景识别应用中饰演举足轻重的角色。。。。�；；；；；谏疃妊暗挠镆逯Ы馐忠账淙豢梢匀〉迷冻虐逡斓男阅芸墒峭览涤诩畹耐缁蛘咧卮蟮暮蟠χ贸头Ｊ忠仗岣吣Ｗ拥恼雇�。。。。。因而处置惩罚历程通常需要泯灭大宗的盘算资源并且速率不高。。。。。

此论文提出了一个很具启发性的立异点对难度差别的区域区别看待 — 让简朴的归于简朴把名贵的盘算资源投放在难题的部分。。。。。详细而言大块平滑的区域支解是较为容易的而物体界线或者有重大纹理的区域的支解则较为难题。。。。�；；；；；谡庖皇硬齑宋奶岢隽艘桓鲂滦偷挠镆逯Ы饽Ｗ覦eep Layer Cascade (LC)。。。。。它将图像中的像素分为简朴、中等、难题三个部分划分由网络中的浅层、中层、高层来针对性完身支解。。。。。

此文还提出了Region Convolution来只处置惩罚每个阶段感兴趣的区域而忽视其他区域。。。。。关于简朴区域的低层处置惩罚效果通过skip connection直接传送到输出端并与重大区域处置惩罚的效果相融合因此三个条理的处置惩罚无缝衔接组成了一个可以端对端训练的统一网络。。。。。Deep Layer Cascade不但提高盘算速率并且由于每个阶段只专注处置惩罚某类难度的像素精度也会相对地提高。。。。。LC可以无邪地与差别的深度网络架构团结运用。。。。。Inception-ResNet-v2应用LC后速率提高了42.8% 精度提高了1.7%。。。。。经测试LC在多个测试集上大幅度提高速率并抵达甚至逾越state-of-the-art的精度水平LC在VOC12测试集上mIoU可抵达80.3在COCO上预训练可抵达82.7在Cityscapes测试集上可抵达71.1。。。。。

除了上述论文值得一提的是商汤科技与香港中大-商汤科技团结实验室在这次的CVPR斩获了由VideoNet(http://videonet.team/)主理的第一届DAVIS Challenge 视频语义支解角逐冠军 http://davischallenge.org/ 。。。。。参赛者需要提出算法准确地把视频里指定的物体举行语义实例支解。。。。。由于物体快速移动造成的模糊状态和多物体之间的遮挡问题角逐的挑战难度特殊高。。。。。商汤科技与香港中大-商汤科技团结实验室相助提出的Video Object Segmentation with Re-identificationVS-ReID算法让他们在全球共 22支步队里脱颖而出获得冠军。。。。。

论文问题：Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer Cascade

论文作者：Xiaoxiao Li, Ziwei Liu, Ping Luo, ChenChange Loy, Xiaoou Tang

别的，，，，，，，，商汤科技与香港中大-商汤团结实验室加入DAVIS Challenge角逐的手艺计划也在DAVIS Challenge workshop整理揭晓：

论文问题：Video Object Segmentation with Re-identification

论文作者：XiaoxiaoLi, Yuankai Qi, Zhe Wang, Kai Chen, Ziwei Liu, Jianping Shi, Ping Luo, ChenChange Loy, Xiaoou Tang

Tubelet Proposal Network：ImageNet冠军检测手艺到视频的跃迁

视频中的物体检测问题由于其在高级AI系统如自动驾驶、家居机械人中的潜在用途近年来获得了普遍的关注。。。。。相较于古板静止图片的物体检测问题现有的视频物体检测要领通�；；；；；谑笨铡腹艿馈�(tubelets)即跨时间毗连的检测框来有用的应用视频中的时域信息。。。。。可是现有要领中时空管道天生的质量和效率往往差强人意基于运动信息的天生要领只能天生较短的时空管道而基于图像信息的天生要领需要破费大宗的盘算量也不可包管关于物体较高的召回率。。。。。

该论文将古板针对静止图像的FasterRCNN框架举行了扩展将视频物体检测框架扩展为「候选时空管道天生」和「候选时空管道识别」两个模�？？？？？樘岢隽艘恢指咝实暮蜓∈笨展艿捞焐炷芄辉诎苁笨展艿澜铣こざ鹊耐本】赡艿谋４娌畋鹗笨展艿赖亩嘌源佣岣呶锾宓恼倩芈�。。。。�；；；；；谡庑└咧柿康暮蜓∈笨展艿烙τ帽嗦�-解码LSTM网络举行时空管道的识别能够有用的提升检测整体的准确率。。。。。作者还对Tubelet Proposal Network初始化和差别设置举行了详尽剖析基于TPN的物体检测平均准确率相较于静止图像检测框架有>5%的提升。。。。。

该论文作者在2015和2016一连两年取得ImageNet视频物体检测项目第一。。。。。该论文是他们在2016年ImageNet竞赛第一事情上举行扩展后提出的全新视频物体检测框架相较于现有算法对视频中物体检测的效率和准确率进一步提升。。。。。

论文问题：Object Detection in Videos with Tubelet Proposal Networks

论文作者：Kai Kang, Hongsheng Li, Tong Xiao, Wanli Ouyang, Junjie Yan, XihuiLiu, Xiaogang Wang

Multi-Context Attention：单人体姿态识别数据集MPII准确率第一

人体姿态预计旨在检测出图像或视频中人体各要害点的位置具有很大的应用价值如体感游戏人机交互机械人虚拟现实装备行动捕获机械视觉等。。。。。然而由于人体姿态很是富厚图像视频配景冗杂人体遮挡等情形常有爆发以是人体姿态预计问题极具挑战性。。。。。要解决上述问题需要充清楚确图像的上下文信息古板要领通常使用多个差别标准的图像块来对多标准信息建模这样获得的多标准信息往往缺少无邪性和多样性。。。。。人脑视觉注重力机制是人脑高效明确自然场景的有用机制。。。。。通过将注重力集中到焦点区域人脑能有用扫除与使命无关的其他滋扰区域并着重剖析与使命相关的要害区域。。。。。

此论文提出的多情境注重力机制网络multi-context attention network首次将注重力机制模子与人体姿态预计使命有用团结通过设计三种差别的注重力机制模子——多标准注重力机制multi-resolution attention多语义注重力机制multi-semantics attention人体全局-局部注重力机制hierarchical global-part attention——来学习图像上下文信息能够有用去除人体姿态预计使命里的冗余配景提高对易混淆人体部位区分能力从而人体要害部位的检测精度。。。。。在最普遍使用的单人体姿态识别数据集MPII上该要领准确度在已揭晓的事情中最高。。。。。该要领现在已经开源代码可在如下网站获得

https://github.com/bearpaw/pose-attention

论文问题：Multi-Context Attention for Human Pose Estimation

附录

商汤科技及香港中大-商汤科技团结实验室共有23篇论文被吸收，，，，，，，，附上CVPR2017上Session时间

Multi-Context Attention for Human Pose Estimation - Saturday, July 22, 2017, 09:00–10:30
Multi-Scale Continuous CRFs as Sequential Deep Networksfor Monocular Depth Estimation - Saturday, July 22, 2017, 09:00–10:30
Accurate Single Stage Detector Using Recurrent Rolling Convolution - Saturday, July 22, 2017, 10:30–12:30
Mimicking Very Efficient Network for Object Detection - Saturday, July 22, 2017, 10:30–12:30
Object Detection in Videos with Tubelet Proposal Networks - Saturday, July 22, 2017, 10:30–12:30
Spindle Net: Person Re-identification with Human Body Region Guided Feature Decomposition and Fusion - Saturday, July 22, 2017, 10:30–12:30
Discover and Learn New Objects from Documentaries - Saturday, July 22, 2017, 13:30–15:00
Learning object interactions and descriptions for Semantic Image Segmentation - Saturday, July 22, 2017, 13:30–15:00
Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification Saturday, July 22, 2017, 15:00–17:00
Scale-Aware Face Detection - Saturday, July 22, 2017, 15:00–17:00
Interpretable Structure-Evolving LSTM - Sunday, July 23, 2017, 08:30–10:00
Detecting Visual Relationships with Deep Relational Networks - Sunday, July 23, 2017, 13:00–14:30
Joint Detection and Identification Feature Learning for Person Search - Sunday, July 23, 2017, 13:00–14:30
Learning Cross-Modal Deep Representations for Robust Pedestrian Detection - Sunday, July 23, 2017, 14:30–16:30
PolyNet: A Pursuit of Structural Diversity in Very Deep Networks - Sunday, July 23, 2017, 14:30–16:30
Pyramid Scene Parsing Network - Sunday, July 23, 2017, 14:30–16:30
Person Search with Natural Language Description - Monday, July 24, 2017, 10:00–12:00
Quality Aware Network for Set to Set Recognition - Monday, July 24, 10:00–12:00
Untrimmed Nets for Weakly Supervised Action Recognitionand Detection - Tuesday, July 25, 2017, 10:00–12:00
Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer Cascade - Tuesday, July 25, 2017, 13:00–14:30
Residual Attention Network for Image Classification- Tuesday, July 25, 13:00–14:30
ViP-CNN: A Visual Phrase Reasoning Convolutional Neural Network for Visual Relationship Detection - Tuesday, July 25, 2017, 14:30–16:30
Look into Person: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing - Tuesday, July 25, 2017, 14:30–16:30

您尚未完善信息

完善信息后，，，，，，，，即可下载资料

完善信息跳过，，，，，，，，继续浏览

您尚未登录

您还未登录，，，，，，，，登录方可继续

登录跳过，，，，，，，，继续浏览

请选择您以为需要刷新的地方：

导航欠好用，，，，，，，，不利便找到感兴趣的内容
产品先容信息不敷周全
产品先容信息禁止易懂
页面翻开速率烦懑，，，，，，，，页面浏览不流通/有卡顿
页面不敷雅观
售后效劳欠好找，，，，，，，，体验欠好

跳过下一个

您是否能够抵达本次网站的会见目的？？？？？？

是
否
仍在举行中

下一个

您对商汤官网的知足度怎样？？？？？？

1
2
3
4
5
6
7
8
9
10

很是不知足很是知足

提交

已收到您对商汤官网的评价和建议！

谢谢您的耐心反响~

关闭

产品试用

填写此简朴表格，，，，，，，，我们将尽快联系您！

把您的需求发给我们相识所有产品

商务相助

400 900 5986

周一至周五 9:00-12:00，，，，，，，，13:00-18:00

business@sensetime.com

相助同伴招募

成为相助同伴

您还未登录，，，，，，，，登录方可继续

登录跳过，，，，，，，，继续浏览

您尚未完善信息

完善信息后，，，，，，，，即可下载资料

完善信息跳过，，，，，，，，继续浏览

商务相助

400 900 5986
( 周一至周五 9:00-12:00, 13:00-18:00 )
business@sensetime.com
媒体相同: pr@sensetime.com
投资者关系联络: ir@sensetime.com

社交媒体

微信公众号

【网站地图】【sitemap】