悦灵犀AI多模态重磅更新“视”不可挡

作者：智通财经肖顺兰 2024-06-11 18:30:00

悦灵犀AI发布2.0多模态重磅更新，采用了更加先进复杂的算法和模型，拥有更强大的应用能力，以及更全面的人工智能新交互功能。

6月11日，悦享控股有限公司（CHR.US），一家以技术驱动的新一代移动互联网基础设施与平台服务提供商宣布，悦灵犀AI发布2.0多模态重磅更新，采用了更加先进复杂的算法和模型，拥有更强大的应用能力，以及更全面的人工智能新交互功能。这标志着悦灵犀AI在底层技术层面取得重大突破，在应用层面实现了质的飞跃，为用户带来前所未有的应用体验，以及更加丰富、多样和真实的生成效果。

在本次重磅更新中，悦灵犀AI推出了极具开拓性的“文生视频”工具，并对用户全面开放使用。悦灵犀AI文生视频技术已超越国内行业平均水平，其主要得益于以下几个方面的技术创新和应用：

1. DiT混合模型架构：悦灵犀平台的文生视频技术采用了当前最前沿的DiT (Diffusion Transformer)混合模型架构，该模型架构区别于目前AI视频领域广泛基于的UNet架构的扩散模型，悦灵犀融合了Diffusion和 Transformer两种模型的优点，可用于生成高质量的视频内容。其中，Diffusion模型通过扩散过程针对视频帧添加噪声，再通过逆向扩散过程逐步去噪，生成细节丰富、高质量的视频帧。而Transformer模型的自注意力机制可以捕捉和生成帧序列中的复杂依赖关系，确保生成的视频帧在时间上的一致性和连贯性。

2. 深度模拟与可控性：悦灵犀文生视频技术不仅能够生成高质量的图像，还具备对真实物理世界的深度模拟能力。通过DRL深度强化学习，悦灵犀能够理解和模拟复杂的现实场景和物体动态，为用户提供更为真实和准确的视频内容。同时，该技术还具有高度的可控性，允许用户根据具体需求调整和优化生成的视频，实现个性化的创意表达。

3. 独特的创造力：悦灵犀文生视频技术拥有独特的创造力，可以基于用户的文本描述指令，创造性地生成不同风格的视频内容。这种创造力的实现，得益于模型中的CGV算法，能够捕捉和理解用户的创意意图，并将其转化为可视化的视频内容。

4. 语义理解与本地化优势：依托于悦享人工智能大模型北辰星悦的强大支持，悦灵犀在语义理解方面表现出色，特别是在中文语境下的理解能力。这使得用户在使用悦灵犀进行视频创作时，无论想表达复杂的情感还是细腻的文化元素，都能够得心应手。

悦灵犀AI文生视频技术的先进性不仅体现在其创新的模型架构和强大的处理能力上，还表现在其对用户需求的深刻理解和对本地文化的高度适应上。这些技术的融合与应用，使得悦灵犀能够为用户提供一个高效、精准且富有创造力的视频生成工具。

在本次悦灵犀AI2.0版本的迭代更新中，产品团队不仅对核心功能进行了深度优化，还新增了创新的AI扩图工具与AI头像制作工具，进一步拓宽了平台在商业化场景中的应用广度，为商业品牌提供了更为多样化的营销工具。

AI扩图工具利用先进的人工智能技术，能够智能识别并扩展图像内容，帮助用户轻松实现高质量图像的无损放大与创意扩展，无论是产品细节展示还是广告画面的高清呈现，都能满足商业需求的高标准。而AI头像制作工具则通过个性化的算法，让用户能够快速生成独具特色的虚拟形象，为社交媒体营销、虚拟助手或个性化服务提供了全新的互动方式。

此外，在本次2.0版本更新的同时，悦灵犀还特别增加了AI课程模块，精心录制了大量AI课程，旨在帮助普通用户快速理解和使用，为个人创作者提供了强有力的服务与技术支持。

随着悦灵犀AI多模态的持续迭代更新，以及能力的大幅提升，进一步说明悦灵犀 AI 不仅拥有雄厚的技术研发实力与产品创新能力，而且在庞大的AI应用市场具有强大的发展潜力。

关于悦享控股

作为国内领先的新一代移动互联网基础设施与平台服务提供商，专注打造"平台+应用+技术+产业"为一体的数字生态系统，全力打造融合AI技术在内的全新web3.0开放业务体系，以及基于区块链、云计算、扩展现实、数字孪生等打造的5G+VR+AR+AI悦享元宇宙空间平台。

公司拥有北辰星悦智能云、悦灵犀AI创作平台、悦享开放平台、悦享视频、悦享商城、悦境CheerReal、悦享车载互联CheerCar、悦聊CheerChat、悦享鲜配团购电商、数字创新研究院、悦享直播系列、网综网剧系列、悦系列节目集群、IP短视频矩阵等，向市场提供拥有"在线+离线"、"虚拟+现实"在内的多元应用场景空间。

悦享控股致力于以"悦享+"为核心的产业生态布局，巩固和强化核心竞争力，实现长期可持续的规模化发展。

智通声明：本内容为作者独立观点，不代表智通财经立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。更多最新最全港美股资讯，请点击下载智通财经App