中邮证券:Meta发布图像分割模型SAM 有望掀起通用视觉模型热潮

近日Meta在论文中发布新模型SegmentAnythingModel(SAM),用于识别、分割图像和视频中的物体。

智通财经APP获悉,中邮证券发布研究报告称,近日Meta在论文中发布新模型SegmentAnythingModel(SAM),用于识别、分割图像和视频中的物体。目前SAM模型及数据集均为开源,可以灵活集成于更大的AI系统,随着SAM的演进与发展,该技术可能会成为工业质检、AR/VR、自动驾驶、卫星遥感等多领域的强大的辅助工具,该行看好SAM等图像分割模型在机器视觉中的应用。国内厂商积极布局,有望掀起通用视觉模型热潮。

中邮证券主要观点如下:

Meta发布图像分割模型SAM,展现出零样本性能

近日Meta在论文中发布新模型SegmentAnythingModel(SAM),用于识别、分割图像和视频中的物体。与其他计算机视觉模型相比,SAM的创新性主要体现在以下几个方面:1)SAM基于1100万张图像和11亿个掩码的海量数据集进行训练,是迄今为止最大的分割数据集;2)SAM在分割任务中展现出较强的零样本性能,能对从未训练过的图片进行精准分割,初步验证了多模态技术路径及其泛化能力;3)SAM开创性地与Prompt结合了起来,标志着自然语言处理的Prompt模式开始被应用在了计算机视觉领域。Meta表示,目前公司内部已经开始使用SAM相关技术,用于在Facebook、Instagram等社交平台上照片的标记、内容审核和内容推荐等。

国内厂商积极布局,有望掀起通用视觉模型热潮

继Meta发布SAM后,智源研究院视觉团队推出通用分割模型SegGPT(SegmentEverythingInContext)。与SAM的精细标注能力相比,SegGPT模型更偏重于批量化标注分割能力,无论是在图像还是视频环境,用户在画面上标注识别一类物体,即可批量化识别分割出其他所有同类物体。从测试结果看,研究人员在广泛的任务上对SegGPT进行了评估,包括少样本语义分割、视频对象分割、语义分割和全景分割,结果显示SegGPT模型同样展现出强大的零样本场景迁移能力,并在COCO和PASCAL等经典CV数据集上取得最优性能。

工业制造领域是图像分割模型较好的应用入口

在工业制造领域,图像分割是图像识别和机器视觉至关重要的预处理,相关技术被用于捕捉和处理图像,为设备提供操作指导的应用,具体场景包括乱序零件的分拣等。以往为特定任务创建准确的分割模型通常需要领域专家进行高度专业化的工作,同时需要强大的算力与大量精准标注的数据,而SAM等通用图像分割模型实现了机器视觉核心技术的范式突破,未来有助于减少大量的数据标注工作。

我国工业领域对采用图像和机器视觉技术的工业自动化、智能化需求广泛提升,以工业相机、图像采集卡、光源及图像处理软件为核心的视觉产品日益完善。根据亿欧智库的统计数据,中国机器视觉器件和系统的销售额从2012年的19.8亿元增长至2021年的161亿元,复合增长率达到31.7%,目前3D技术领域80%以上的市场份额被海外企业占据,国产化需求将进一步推动我国工业视觉产业的快速发展。从工业视觉下游行业来看,3C电子、半导体、新能源行业合计占比约80%,该行认为伴随消费电子等产品不断升级,对于机器视觉的通用性、准确性要求将更高,图像分割等AI技术有望带来工业制造领域的降本增效。

投资建议:

1)奥普特(688686.SH):机器视觉核心部件龙头,深度学习(工业AI)、3D视觉工序覆盖持续增长;

2)凌云光(688400.SH):智能视觉装备供应商,开展多种AI算法、计算成像、大数据与认知图谱等技术研究;

3)奥比中光(688322.SH):聚焦3D视觉感知,与微软、英伟达联合研发制造3DiToF相机FemtoMega;

4)千方科技(002373.SZ):智慧交通行业领军,视觉智能算法赋能车路协同,有望与大股东阿里形成全方位合作;

5)声迅股份(003004.SZ):安防整体解决方案提供商,加大训练算力投入,为安防视频图像分析、智能行为分析等提供算力支持。

风险提示:行业竞争加剧风险;SAM模型落地不及预期;机器视觉相关技术发展不及预期等。

智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏