长江证券:Meta革命性AI驱动3D资产创建 阶跃星辰大模型实现“万亿+多模”

作者: 智通财经 刘璇 2024-07-09 11:15:00
从语言到多模态、从理解到生成的升级与布局,技术的不断提升有望加速AI在各场景的应用。

智通财经APP获悉,长江证券发布研报认为,大模型在技术和产品生态方面均加速发展。Meta3D Gen实现AI驱动的高效3D资产创建,简化3D设计流程;阶跃星辰实现万亿参数和多模融合,加速大模型在各类场景应用。从语言到多模态、从理解到生成的升级与布局,技术的不断提升有望加速AI在各场景的应用。该团队认为AI技术及应用领域持续突破,建议持续关注AI在广告、电商、影视、游戏和教育等各领域的商业化落地。

Meta正式公布文生3D模型Meta3D Gen,能够在一分钟内根据用户输入的文本提示词构建全方位3D资产。阶跃星辰在WAIC2024上首发三款Step系列通用大模型新品,包括Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型。

Meta3D Gen实现AI驱动的高效3D资产创建,简化3D设计流程。1)高效生成优质内容,满足高端视觉应用需求。3DGen能在1分钟内根据文本提示词快速生成3D资产,速度是现有其他系统的3~60倍。3D Gen的生成划分为两个阶段:第一阶段AssetGen根据用户提供的文本提示创建初始3D资产,用时约30秒;第二阶段使用TextureGen,进一步提升3D资产的纹理质量,用时约20秒。实验证明,在两个阶段中各部件均能取得优于现有技术的效果,且两项技术集成的3D Gen也能以68%的胜率超过其他模型。2)融合物理渲染与人工网格输入,更易融入创作者工作流。基于物理的渲染技术(PBR将3D模型的物理属性融入到3D资产中,让计算机不仅能理解3D资产的形状,还能模拟与光线等物理世界的因素产生交互作用,提升资产在复杂场景中的适用性。同时系统支持人类艺术家创作的3D网格输入,增强创建的灵活性。3)解决行业痛点,应用前景广阔。通过专业3D艺术家的评估,3D Gen生成的3D模型在保真度、3D网格质量、材料质量和控制方面表现更优。3D Gen或能解决行业痛点:内容素材方面,若用户能够方便且高效地创造3D素材,且在Gen AI加持下素材的质量进一步提升,将能改善VR内容缺乏的问题。技术效率方面,在电影特效、AR/VR、视频游戏等领域中,GenAI+3D技术有望简化和增强3D资产创建过程。

阶跃星辰实现万亿参数和多模融合,加速大模型在各类场景应用。1)通用大模型的底座能力升级。Step-2达到万亿参数级别,在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面接近GPT-4。多模态方面亦有提升,Step-1.5V从图像理解升级到视频理解,且在Step-2万亿参数大模型的加持下,模型推理能力提升,可根据图像内容进行各类高级推理任务。Step-1X全面支持600M、2B、8B三种参数量,并在多模态理解和生成统一技术路线上实现重要技术突破。2)推进大模型产品应用落地。阶跃星辰与界面财联社上海电影、中文在线、中国知网、中广天择、小冰、YAHAHA Studios合作,在金融财经内容创作、消费娱乐等领域共同探索面向C端用户的创新应用。例如基于Step系列大模型与上影合作,在WAIC现场发布了《大闹天宫》AI互动体验“测测你是哪路神仙”。游戏运用AI工具让IP价值得以释放,融合大模型的图像理解、风格迁移、图像生成、剧情创作等多种能力,做到千人千面和无限剧情的可能。

大模型在技术和产品生态方面均加速发展。从语言到多模态、从理解到生成的升级与布局,技术的不断提升有望加速AI在各场景的应用。长江证券认为AI技术及应用领域持续突破,建议持续关注AI在广告、电商、影视、游戏和教育等各领域的商业化落地。

风险提示

1、AI技术发展不及预期风险;

2、内容监管风险。


智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏