智通财经APP获悉,近日,据媒体报道,苹果公司发布了一篇研究论文,讨论了其正在研究的生成式AI技术——HUGS。据介绍,目前HUGS经过训练,可以在约30分钟内生成数字人类分身。据称,这比NeuMan、Vid 2 Avatar在内的其他方式要快约100倍。可以看到,苹果正在大刀阔斧地进行更新,预计接下来,在人工智能技术的影响下,相关行业将会不断出现新的技术创新。东方证券表示,AI数字人的加速落地,相关产业政策的快速跟进,建议关注行业各细分赛道。相关概念股:商汤(00020)、百度集团-SW(09888)、网易-S(09999)。
苹果研究员Anurag Ranjan发布推文,表示HUGS的全称叫作Human Gaussian Splats,使用机器学习和计算机视觉,在原始输入数据较少的情况下,创建出逼真的人像元素。苹果官方介绍中表示神经渲染技术目前已经有了长足的进步,但最适合的场景依然是静态场景的摄影测量,还无法推广到环境中自由移动的人类。
HUGS使用3DGaussian Splatting的技术,在场景中创建可移动的人类。该方法本身需要少量的主体视频,通常在场景中运动,并显示尽可能多的表面供系统工作。在某些情况下,该技术对源输入数据的要求很低,最少可以低至50到100帧的单目视频,相当于2到4秒的24fps视频。
事实上,苹果公司一直致力于有关数字分身的研究。例如在其最新MR头显VisionPro里,该设备能够通过前置摄像头扫描用户面部信息,并基于机器学习技术和编码神经网络,为用户生成一个数字分身。当用户使用FaceTime通话时,数字分身便可以模仿用户的面部及手部动作。
此外,据媒体消息报道,iPhone 16系列最大的更新可以说是引入AIGC。苹果计划对iPhone 16麦克风进行重大升级,以改善新的人工智能增强Siri体验。郭明錤在最新的帖子中写道,加强Siri的硬件和软件功能和规格是推广人工智能生成内容的关键。他表示,苹果的生成式AI野心以及将大型语言模型(LLMs)集成到Siri中将严重依赖于改进的语音输入处理。
据行业人士透露,苹果计划最早在2024年底开始在iPhone和iPad上融入AIGC技术。今年10月,苹果发布用于个人电脑的M3、M3 Pro和M3 Max芯片时也透露出关键信息。苹果当时称,这些芯片引入了增强型神经网络引擎,用于加速强大的机器学习(ML)模型。
2023年,无疑是AI行业风起云涌的一年,围绕大模型竞争引发了诸多行业热潮,在全球科技企业的共同推动下,其应用也从云端更多地走向边缘、终端,智能手机、PC等消费电子设备正在开始大幅更新,以适应大模型、AIGC的应用。
展望2024年,著名科技媒体Tech Crunch对明年AI行业趋势做出六大预测:1)OpenAI将成为一家产品公司;2)代理、生成视频和生成音乐从小众走向大众;3)混合小模型可能更有优势;4)很多公司会放弃大规模应用AI,行业会出现一轮整合浪潮;5)苹果即将加入战局;6)可能会出现全新的AI合规行业。
东方证券表示,AI赋能使数字人有更加智能的内核。虚拟数字人的驱动可分为由真人扮演的“中之人”驱动和AI驱动,过去AI驱动数字人的痛点在于成本较高、交互效果不佳,因此由“中之人”驱动更为常见:而随着近期AI领域的技术突破、文本、图像等领域的大模型应用的快速落地,将使数字人的应用场景及范围明显扩大。AI数字人的加速落地,相关产业政策的快速跟进,建议关注行业各细分赛道。
投资机会方面,信达证券建议重点关注AI三大创新领域。2023年以来,AI行业实现了突飞猛进的发展,是目前全球科技进步的最前沿方向。该行认为以GPT为代表的大语言模型方向,以图像/视频生成技术为代表的AIGC方向,和以自动控制/边缘计算为代表的硬件及自动驾驶方向,是AI行业值得重点关注的三大创新领域。建议重点关注拥有大语言模型的科技巨头微软、谷歌、百度、腾讯控股、阿里巴巴等,AIGC应用龙头Adobe、美图公司、阜博集团、柠萌影视,边缘硬件端PC和手机头部品牌联想集团、小米集团,以及自动驾驶技术领先的新势力企业小鹏汽车等。
相关概念股:
商汤(00020):9月份,商汤“如影SenseAvatar”AI数字人生成平台通过中国信通院首批“可信虚拟人生成内容管理系统”测评,并荣获“L3卓越级”证书,标志着商汤如影在功能完备程度、系统可信能力、产业化能力方面,已达到行业标杆级水平。
百度集团-SW(09888):由百度研究院孵化的VidPress是业界首个支撑通用型、大规模生产的智能视频合成平台,用户仅需一键输入新闻图文内容链接,就可以自动化完成视频制作,整套制作流程在数分钟内即可全部完成。
网易-S(09999):目前网易自研AI技术已应用于游戏工业化全流程,AI技术对关键环节的工作效率提升高达90%。据介绍,网易互娱AI LAB已自研数十款AI提效工具,覆盖AI语音生成、AI原画生成、AI视频动捕、AI模型生成等诸多环节。