- ½¹µãÊÖÒÕ
- ÒÔÔ´´ÊÖÒÕϵͳΪ»ù±¾£¬£¬£¬£¬£¬£¬£¬£¬SenseCoreÉÌÌÀAI´ó×°ÖÃΪ½¹µã»ù×ù£¬£¬£¬£¬£¬£¬£¬£¬½á¹¹¶àÁìÓò¡¢¶àÆ«ÏòÇ°ÑØÑо¿£¬£¬£¬£¬£¬£¬£¬£¬
¿ìËÙÂòͨAIÔÚ¸÷¸ö±ÊÖ±³¡¾°ÖеÄÓ¦Ó㬣¬£¬£¬£¬£¬£¬£¬ÏòÐÐÒµ¸³ÄÜ¡£¡£¡£¡£¡£¡£
ÉÌÑÐØÊµÀýÖ§½âµÄ½ø½×Èý¼¶Ìø£º´ÓMask R-CNNµ½Hybrid Task Cascade

±àÕß°´£ºÔçÔÚ2018ÄêµÄCOCO½ÇÖðÖУ¬£¬£¬£¬£¬£¬£¬£¬ÉÌÌÀ¿Æ¼¼Ñо¿Ô±ºÍÏã¸ÛÖÐÎÄ´óѧ-ÉÌÌÀÍŽáʵÑéÊÒ(MMLab)ͬÑâ×é³ÉµÄÍŶӣ¬£¬£¬£¬£¬£¬£¬£¬ÔÚ×î½¹µãµÄÎïÌå¼ì²â(Detection)ÏîÄ¿ÖжáµÃ¹Ú¾ü¡£¡£¡£¡£¡£¡£ÉÌÌÀÍŶӴ´Á¢ÐԵؿª·¢ÁËȫеÄÊÖÒÕ£¬£¬£¬£¬£¬£¬£¬£¬ÓÈÆäÊÇÌá³öÁËеĶàʹÃü»ìÏý¼¶Áª¼Ü¹¹(Hybrid Task Cascade)£¬£¬£¬£¬£¬£¬£¬£¬Í¨¹ý°Ñ²î±ð×ÓʹÃü¾ÙÐÐÖð¼¶»ìÏý£¬£¬£¬£¬£¬£¬£¬£¬ÓÐÓõظÄÉÆÁËÕû¸ö¼ì²âÀú³ÌÖеÄÐÅÏ¢Á÷¶¯¡£¡£¡£¡£¡£¡£
¿ËÈÕ£¬£¬£¬£¬£¬£¬£¬£¬»ùÓÚ COCO 2018½ÇÖðÍŶÓÏàÖúµÄЧ¹û£¬£¬£¬£¬£¬£¬£¬£¬MMLabÍŶÓÓÖÈ¡µÃÐÂÍ»ÆÆ£¬£¬£¬£¬£¬£¬£¬£¬½ÒÏþÁËÂÛÎÄ¡¶Hybrid Task Cascade for Instance Segmentation¡·£¬£¬£¬£¬£¬£¬£¬£¬¸ÃÂÛÎÄÒÑÈëÑ¡CVPR 2019¡£¡£¡£¡£¡£¡£ÂÛÎÄÌá³öÁËÒ»ÖÖеÄʵÀýÖ§½â¿ò¼Ü£¬£¬£¬£¬£¬£¬£¬£¬Éè¼ÆÁ˶àʹÃü¶à½×¶ÎµÄ»ìÏý¼¶ÁªÂç¹¹£¬£¬£¬£¬£¬£¬£¬£¬²¢ÇÒÈÚºÏÁËÒ»¸öÓïÒåÖ§½âµÄ·ÖÖ§À´ÔöÇ¿Spatial Context¡£¡£¡£¡£¡£¡£ÕâÖÖ¿ò¼ÜÈ¡µÃÁËÏÔ×ÅÓÅÓÚMask R-CNNºÍCascade MaskR-CNNµÄЧ¹û¡£¡£¡£¡£¡£¡£±¾ÎÄÊǶԡ¶Hybrid Task Cascade for Instance Segmentation¡·µÄÂÛÎĽâ¶Á¡£¡£¡£¡£¡£¡£
Åä¾°
ʵÀýÖ§½â(Instance Segmentation)ÊÇÒ»¸öºÍÎïÌå¼ì²âºÜÊÇÏà¹Ø¿ÉÊǸüÄѵÄÎÊÌ⣬£¬£¬£¬£¬£¬£¬£¬ÔÚÎïÌå¼ì²âµÄ»ù´¡ÉÏ£¬£¬£¬£¬£¬£¬£¬£¬»¹ÒªÇóÖ§½â³öÎïÌåµÄÏñËØ£¬£¬£¬£¬£¬£¬£¬£¬ÈçÏÂͼËùʾ¡£¡£¡£¡£¡£¡£

ʵÀýÖ§½âÕâ¸öÎÊÌâ½ü¼¸ÄêµÄÉú³¤ÔںܺéÁ÷ƽÉÏÊÇÓÉCOCOÊý¾Ý¼¯ºÍ½ÇÖðÍÆ¶¯µÄ¡£¡£¡£¡£¡£¡£´ÓMNC£¬£¬£¬£¬£¬£¬£¬£¬FCISµ½PANet£¬£¬£¬£¬£¬£¬£¬£¬¶¼ÊÇÔÚCOCO Instance Segmentation Track ÉÏÄõÚÒ»ÃûµÄÒªÁì¡£¡£¡£¡£¡£¡£Mask R-CNNÊǸöÆÆÀý£¬£¬£¬£¬£¬£¬£¬£¬ÓÉÓÚPaper¹ûÕæµÃ½ÏÁ¿Ô磬£¬£¬£¬£¬£¬£¬£¬ÒÔÊÇÊÇ2017Äêǰ¼¸Ãû²½¶ÓµÄ»ù±¾ÒªÁì¡£¡£¡£¡£¡£¡£Í¬Àí¿ÉÖª£¬£¬£¬£¬£¬£¬£¬£¬Hybrid Task Cascade(HTC)ÔÚ COCO 2018 µÄ½ÇÖðÖÐҲȡµÃÁ˵ÚÒ»Ãû¡£¡£¡£¡£¡£¡£
¸ÅÊö
¼¶ÁªÊÇÒ»ÖÖ½ÏÁ¿¾µäµÄ½á¹¹£¬£¬£¬£¬£¬£¬£¬£¬ÔÚÐí¶àʹÃüÖж¼ÓÐÓõ½£¬£¬£¬£¬£¬£¬£¬£¬ºÃ±ÈÎïÌå¼ì²âÖеÄCC-Net£¬£¬£¬£¬£¬£¬£¬£¬CascadeR-CNN£¬£¬£¬£¬£¬£¬£¬£¬ÓïÒåÖ§½âÖеÄDeep Layer CascadeµÈµÈ¡£¡£¡£¡£¡£¡£È»¶ø½«ÕâÖֽṹ»òÕßÍ·ÄÔÒýÈ뵽ʵÀýÖ§½âÖв¢²»ÊÇÒ»¼þÖ±½Ó¶øÈÝÒ×µÄÊÂÇ飬£¬£¬£¬£¬£¬£¬£¬ÈôÊÇÖ±½Ó½«Mask R-CNNºÍCascade R-CNNÍŽáÆðÀ´£¬£¬£¬£¬£¬£¬£¬£¬»ñµÃµÄÌáÉýÊÇÓÐÏ޵쬣¬£¬£¬£¬£¬£¬£¬Òò´ËÎÒÃÇÐèÒª¸ü¶àµØÌ½Ë÷¼ì²âºÍÖ§½âʹÃüµÄ¹ØÁª¡£¡£¡£¡£¡£¡£
ÔÚ±¾ÆªÂÛÎÄÖУ¬£¬£¬£¬£¬£¬£¬£¬ÎÒÃÇÌá³öÁËÒ»ÖÖеÄʵÀýÖ§½â¿ò¼Ü£¬£¬£¬£¬£¬£¬£¬£¬Éè¼ÆÁ˶àʹÃü¶à½×¶ÎµÄ»ìÏý¼¶ÁªÂç¹¹£¬£¬£¬£¬£¬£¬£¬£¬²¢ÇÒÈÚºÏÁËÒ»¸öÓïÒåÖ§½âµÄ·ÖÖ§À´ÔöÇ¿Spatial Context¡£¡£¡£¡£¡£¡£ÕâÖÖ¿ò¼ÜÈ¡µÃÁËÏÔ×ÅÓÅÓÚMask R-CNNºÍCascade Mask R-CNNµÄЧ¹û¡£¡£¡£¡£¡£¡£

ÒªÁì
Õû¸ö¿ò¼ÜµÄÑݽø¿ÉÒÔÓÃËÄÕÅͼÀ´ÌåÏÖ£¬£¬£¬£¬£¬£¬£¬£¬ÆäÖÐMÌåÏÖMask·ÖÖ§£¬£¬£¬£¬£¬£¬£¬£¬BÌåÏÖBox·ÖÖ§£¬£¬£¬£¬£¬£¬£¬£¬Êý×ÖÌåÏÖStage£¬£¬£¬£¬£¬£¬£¬£¬M1¼´ÎªµÚÒ»¸öStageµÄMask·ÖÖ§¡£¡£¡£¡£¡£¡£

½ø½××¼±¸£ºCascade Mask R-CNN
ÓÉÓÚCascade R-CNNÔÚÎïÌå¼ì²âÉϵÄЧ¹ûºÜÊǺ㬣¬£¬£¬£¬£¬£¬£¬ÎÒÃÇÊ×ÏÈʵÑ齫Cascade R-CNNºÍMask R-CNNÖ±½Ó¾ÙÐÐÔÓ½»£¬£¬£¬£¬£¬£¬£¬£¬»ñµÃ×Ó´úCascade Mask R-CNN£¬£¬£¬£¬£¬£¬£¬£¬ÈçÉÏͼ(a)Ëùʾ¡£¡£¡£¡£¡£¡£ÔÚÕâÖÖʵÏÖÀ£¬£¬£¬£¬£¬£¬£¬Ã¿Ò»¸öStageºÍMask R-CNN ÏàËÆ£¬£¬£¬£¬£¬£¬£¬£¬¶¼ÓÐÒ»¸öMask·ÖÖ§ºÍBox·ÖÖ§¡£¡£¡£¡£¡£¡£Ä¿½ñStage»á½ÓÊÜRPN»òÕßÉÏÒ»¸öStage»Ø¹é¹ýµÄ¿ò×÷ΪÊäÈ룬£¬£¬£¬£¬£¬£¬£¬È»ºóÕ¹ÍûеĿòºÍMask¡£¡£¡£¡£¡£¡£ÕâÒ²ÊÇʵÑéÖÐÎÒÃÇËù½ÏÁ¿µÄBaseline£¬£¬£¬£¬£¬£¬£¬£¬´ÓʵÑé±í¸ñ¿ÉÒÔ¿´µ½×ÅʵÕâ¸öBaselineÒѾºÜÇ¿ÁË£¬£¬£¬£¬£¬£¬£¬£¬¿ÉÊÇÈÔÈ»±£´æÏÔ×ŵÄÎÊÌ⣬£¬£¬£¬£¬£¬£¬£¬Ö÷ÒªÔÚÓÚCascade MaskR-CNNÏà±ÈMask R-CNNÔÚBox APÉÏÌá¸ßÁË3.5¸öµã£¬£¬£¬£¬£¬£¬£¬£¬¿ÉÊÇÔÚMask APÉÏÖ»Ìá¸ßÁË1.2¸öµã¡£¡£¡£¡£¡£¡£
½ø½×µÚÒ»²½£ºInterleaved Execution
Cascade R-CNNËäȻǿÐÐÔÚÿһ¸öStageÄÚÀïÈûÏÂÁËÁ½¸ö·ÖÖ§£¬£¬£¬£¬£¬£¬£¬£¬¿ÉÊÇÕâÁ½¸ö·ÖÖ§Ö®¼äÔÚѵÁ·Àú³ÌÖÐûÓÐÈκν»»¥£¬£¬£¬£¬£¬£¬£¬£¬ËüÃÇÊDz¢ÐÐÖ´Ðеġ£¡£¡£¡£¡£¡£ÒÔÊÇÎÒÃÇÌá³öInterleaved Execution£¬£¬£¬£¬£¬£¬£¬£¬Ò²¼´ÔÚÿ¸öStageÀ£¬£¬£¬£¬£¬£¬£¬ÏÈÖ´ÐÐBox·ÖÖ§£¬£¬£¬£¬£¬£¬£¬£¬½«»Ø¹é¹ýµÄ¿òÔÙ½»ÓÉMask·ÖÖ§À´Õ¹ÍûMask£¬£¬£¬£¬£¬£¬£¬£¬ÈçÉÏͼ(b)Ëùʾ¡£¡£¡£¡£¡£¡£ÕâÑù¼ÈÔöÌíÁËÿ¸öStageÄÚ²î±ð·ÖÖ§Ö®¼äµÄ½»»¥£¬£¬£¬£¬£¬£¬£¬£¬Ò²Ïû³ýÁËѵÁ·ºÍ²âÊÔÁ÷³ÌµÄGap¡£¡£¡£¡£¡£¡£ÎÒÃÇ·¢Ã÷ÕâÖÖÉè¼Æ¶ÔMask R-CNNºÍCascade Mask R-CNN µÄMask·ÖÖ§¶¼ÓÐÒ»¶¨ÌáÉý¡£¡£¡£¡£¡£¡£

ÕâÒ»²½Æðµ½Á˺ÜÖ÷ÒªµÄ×÷Ó㬣¬£¬£¬£¬£¬£¬£¬¶ÔÒ»Ñùƽ³£Cascade½á¹¹µÄÉè¼ÆºÍË¢ÐÂÒ²¾ßÓÐ½è¼øÒâÒå¡£¡£¡£¡£¡£¡£ÎÒÃÇÊ×ÏÈ»ØÊ×ÔʼCascade
R-CNNµÄ½á¹¹£¬£¬£¬£¬£¬£¬£¬£¬Ã¿¸öStageÖ»ÓÐBox·ÖÖ§¡£¡£¡£¡£¡£¡£Ä¿½ñStage¶ÔÏÂÒ»Stage±¬·¢Ó°ÏìµÄ;¾¶ÓÐÁ½Ìõ£º(1)
µÄÊäÈëÌØÕ÷ÊÇ
Õ¹Íû³ö»Ø¹éºóµÄ¿òͨRoI Align»ñµÃµÄ;(2)
µÄ»Ø¹éÄ¿µÄÊÇÒÀÀµ
µÄ¿òµÄÕ¹ÍûµÄ¡£¡£¡£¡£¡£¡£Õâ¾ÍÊÇBox·ÖÖ§µÄÐÅÏ¢Á÷£¬£¬£¬£¬£¬£¬£¬£¬ÈÃÏÂÒ»¸öStageµÄÌØÕ÷ºÍѧϰĿµÄºÍÄ¿½ñStageÓйء£¡£¡£¡£¡£¡£ÔÚCascadeµÄ½á¹¹ÖÐÕâÖÖÐÅÏ¢Á÷ÊǺÜÖ÷ÒªµÄ£¬£¬£¬£¬£¬£¬£¬£¬Èòî±ðStageÖ®¼äÔÚÖð½¥µ÷½â¶ø²»ÊÇÀàËÆÓÚÒ»ÖÖEnsemble¡£¡£¡£¡£¡£¡£
È»¶øÔÚCascade Mask R-CNN ÖУ¬£¬£¬£¬£¬£¬£¬£¬²î±ðStageÖ®¼äµÄMask·ÖÖ§ÊÇûÓÐÈκÎÖ±½ÓµÄÐÅÏ¢Á÷µÄ£¬£¬£¬£¬£¬£¬£¬£¬
Ö»ºÍÄ¿½ñ
ͨ¹ýRoI AlignÓйØÁª¶øÓë
ûÓÐÈκÎÁªÏµ¡£¡£¡£¡£¡£¡£¶à¸öStageµÄMask·ÖÖ§¸üÏñÓòî±ðÂþÑܵÄÊý¾Ý¾ÙÐÐѵÁ·È»ºóÔÚ²âÊÔµÄʱ¼ä¾ÙÐÐEnsemble£¬£¬£¬£¬£¬£¬£¬£¬¶øÃ»ÓÐÆðµ½Stage¼äÖð½¥µ÷½âºÍÔöÇ¿µÄ×÷Óᣡ£¡£¡£¡£¡£ÎªÏàʶ¾öÕâÒ»ÎÊÌ⣬£¬£¬£¬£¬£¬£¬£¬ÎÒÃÇÔÚÏàÁÚµÄStageµÄMask·ÖÖ§Ö®¼äÔöÌíÒ»ÌõÅþÁ¬£¬£¬£¬£¬£¬£¬£¬£¬ÌṩMask·ÖÖ§µÄÐÅÏ¢Á÷£¬£¬£¬£¬£¬£¬£¬£¬ÈÃÄÜ
ÖªµÀ
µÄÌØÕ÷¡£¡£¡£¡£¡£¡£ÏêϸʵÏÖÉÏÈçÏÂͼÖкìÉ«²¿·ÖËùʾ£¬£¬£¬£¬£¬£¬£¬£¬ÎÒÃǽ«
µÄÌØÕ÷¾ÓÉÒ»¸ö1x1µÄ¾í»ý×öFeature embedding£¬£¬£¬£¬£¬£¬£¬£¬È»ºóÊäÈëµ½
£¬£¬£¬£¬£¬£¬£¬£¬ÕâÑù
¼ÈÄÜ»ñµÃBackboneµÄÌØÕ÷£¬£¬£¬£¬£¬£¬£¬£¬Ò²ÄÜ»ñµÃÉÏÒ»¸öStageµÄÌØÕ÷¡£¡£¡£¡£¡£¡£

½ø½×µÚÈý²½£ºSemantic Feature Fusion
ÕâÒ»²½ÊÇÎÒÃÇʵÑ齫ÓïÒåÖ§½âÒýÈ뵽ʵÀýÖ§½â¿ò¼ÜÖУ¬£¬£¬£¬£¬£¬£¬£¬ÒÔ»ñµÃ¸üºÃµÄSpatial Context¡£¡£¡£¡£¡£¡£ÓÉÓÚÓïÒåÖ§½âÐèÒª¶Ôȫͼ¾ÙÐÐϸÄåµÄÏñËØ¼¶µÄ·ÖÀ࣬£¬£¬£¬£¬£¬£¬£¬ÒÔÊÇËüµÄÌØÕ÷ÊǾßÓкÜÇ¿µÄ¿Õ¼äλÖÃÐÅÏ¢£¬£¬£¬£¬£¬£¬£¬£¬Í¬Ê±¶ÔÔ¶¾°ºÍÅä¾°ÓкÜÇ¿µÄÇø·ÖÄÜÁ¦¡£¡£¡£¡£¡£¡£Í¨¹ý½«Õâ¸ö·ÖÖ§µÄÓïÒåÐÅÏ¢ÔÙÈںϵ½BoxºÍMask·ÖÖ§ÖУ¬£¬£¬£¬£¬£¬£¬£¬ÕâÁ½¸ö·ÖÖ§µÄÐÔÄÜ¿ÉÒÔ»ñµÃ½Ï´óÌáÉý¡£¡£¡£¡£¡£¡£
ÔÚÏêϸÉè¼ÆÉÏ£¬£¬£¬£¬£¬£¬£¬£¬ÎªÁË×î´óÏ޶ȺÍʵÀýÖ§½âÄ£×Ó¸´ÓÃBackbone£¬£¬£¬£¬£¬£¬£¬£¬ïÔÌÌØÊâ²ÎÊý£¬£¬£¬£¬£¬£¬£¬£¬ÎÒÃÇÔÚÔʼµÄFPNµÄ»ù´¡ÉÏÔöÌíÁËÒ»¸ö¼òÆÓµÄÈ«¾í»ýÍøÂçÓÃÀ´×öÓïÒåÖ§½â¡£¡£¡£¡£¡£¡£Ê×ÏȽ«FPNµÄ5¸ölevelµÄÌØÕ÷ͼResizeµ½Ïàͬ¾Þϸ²¢Ïà¼Ó£¬£¬£¬£¬£¬£¬£¬£¬È»ºó¾ÓÉһϵÁоí»ý£¬£¬£¬£¬£¬£¬£¬£¬ÔÙ»®·ÖÕ¹Íû³öÓïÒåÖ§½âЧ¹ûºÍÓïÒåÖ§½âÌØÕ÷¡£¡£¡£¡£¡£¡£ÕâÀïÎÒÃÇʹÓÃCOCO-StuffµÄ±ê×¢À´¼àÊÓÓïÒåÖ§½â·ÖÖ§µÄѵÁ·¡£¡£¡£¡£¡£¡£ºìÉ«µÄÌØÕ÷½«ºÍÔÀ´µÄBoxºÍMask·ÖÖ§¾ÙÐÐÈÚºÏ(ÔÚÏÂͼÖÐûÓл³ö)£¬£¬£¬£¬£¬£¬£¬£¬ÈںϵÄÒªÁìÎÒÃÇÒ²ÊǽÓÄɼòÆÓµÄÏà¼Ó¡£¡£¡£¡£¡£¡£

½ø½×Ч¹û
ͨ¹ýÉÏÃæµÄ¼¸²½£¬£¬£¬£¬£¬£¬£¬£¬ÔÚʹÓÃResNet-50µÄBackboneÏ£¬£¬£¬£¬£¬£¬£¬£¬Ïà¶ÔCascade Mask R-CNN¿ÉÒÔÓÐ1.5¸öµãµÄMask APÌáÉý£¬£¬£¬£¬£¬£¬£¬£¬Ïà¶ÔMask R-CNN¿ÉÒÔÓÐ2.9¸öµãµÄÌáÉý¡£¡£¡£¡£¡£¡£ÔÚCOCO 2017 val×Ó¼¯ÉϵÄÖð²½±ÈÕÕÊÔÑéÈçϱíËùʾ¡£¡£¡£¡£¡£¡£

³ýÁË´¿¾»°æHTCÖ®Í⣬£¬£¬£¬£¬£¬£¬£¬ÔÚPaperÀïÎÒÃÇ»¹¸ø³öÁËÔÚCOCO ChallengeÄÚÀïÓõ½µÄËùÓа취ºÍ¼¼ÇɵÄÕǵãÇéÐÎ(Á¼ÐÄÉúÒâÓÐľÓÐ)¡£¡£¡£¡£¡£¡£

×ܽá
1¡¢¶àʹÃü¶à½×¶ÎµÄ»ìÏý¼¶ÁªÂç¹¹¡£¡£¡£¡£¡£¡£
2¡¢ÑµÁ·Ê±Ã¿¸öStageÄÚBoxºÍMask·ÖÖ§½ÓÄɽ»ÌæÖ´ÐС£¡£¡£¡£¡£¡£
3¡¢ÔÚ²î±ðStageµÄMask·ÖÖ§Ö®¼äÒýÈëÖ±½ÓµÄÐÅÏ¢Á÷¡£¡£¡£¡£¡£¡£
4¡¢ÓïÒåÖ§½âµÄÌØÕ÷ºÍÔʼµÄBox/Mask·ÖÖ§Èںϣ¬£¬£¬£¬£¬£¬£¬£¬ÔöÇ¿Spatial Context¡£¡£¡£¡£¡£¡£
Code
ÕÕÀý½«Releaseµ½MMDetection
(https://github.com/open-mmlab/mmdetection)£¬£¬£¬£¬£¬£¬£¬£¬½Ó´ý watch¡£¡£¡£¡£¡£¡£
Arxiv
Hybrid Task Cascade for Instance Segmentation
(https://arxiv.org/abs/1901.07518)





·µ»Ø