您现在的位置是:主页 > 区块链 >

TokenPocket钱包安卓版官网|阿里巴巴推出新的基于人工智能的视频生成工具,与先行者竞争

2023-12-28 15:00:20区块链 人已围观

简介BABAAI GitHub I2VGen-xl AI VGen GitHub VGen Python VGen T2V VGen 60 3500 1280720 LLM MetaMETA Llama 2 Animate Anybody ReferenceNet 2023 Web3 Avalanche CoinGeek...

中国科技巨头阿里巴巴(纳斯达克股票代码:BABA)的子公司阿里云宣布推出一款基于人工智能(AI)的新型文本到视频生成器。

根据 GitHub 的可用数据,被称为 I2VGen-xl 的新 AI 模型在从各种来源生成高质量视频方面表现出了熟练程度。 除了视觉上引人注目的视频外,该模特的创作被描述为“语义准确”,减少了错误、幻觉或阿谀奉承的可能性。

“VGen 可以根据输入的文本、图像、所需的动作、所需的主题,甚至提供的反馈信号生成高质量的视频,”GitHub 声明中写道。

VGen 被描述为开源视频生成代码库,允许用户训练他们的文本到视频模型。 通过使用 Python 执行简单的命令,VGen 用户可以训练自定义模型并在无缝过程中执行推理,以提高效率。

该存储库支持具有运动可控性的合成视频合成以及具有人类反馈和缩放 T2V 的指令,同时具有多个用于多个任务的预训练模型。

声明中写道:“它还提供了各种常用的视频生成工具,例如可视化、采样、训练、推理、使用图像和视频的联合训练、加速等。”

根据公告,VGen 通过其海量训练数据实现其高级功能,其中包括 60 亿个文本到图像对和 3500 万个文本到视频对。 该模型的深度训练数据池的影响在于其多功能性和跨多个用例的准确性的提高。

该模型开发团队已经发布了技术论文和官方网页,向研究人员介绍该模型。 用户可以访问预先训练的模型和代码来生成 1280×720 像素视频,使其与现有产品相媲美。

该团队表示,未来将推出专门用于生成人体视频的新模型以及用于动作捕捉的更新版本。

阿里巴巴以新兴技术向前发展

阿里巴巴进军人工智能领域,推出了大型语言模型(LLM)——统一前文,以与 Meta(纳斯达克股票代码:META)的 Llama 2 竞争。该公司并没有满足于现状,推出了旨在生成视频的“Animate Anybody”产品通过其专有的 ReferenceNet 框架从静态照片中获取。

尽管阿里巴巴此前对区块链技术持立场,但 2023 年初与 Web3 公司 Avalanche 的合作见证了阿里巴巴进入虚拟宇宙。 此后,中美之间激烈的半导体冷战减缓了阿里巴巴在人工智能和量子计算领域的进展,因为该公司向内寻找新的解决方案。 阿里巴巴推出了一款新的基于人工智能的视频生成工具,以与先行者竞争。

观看:人工智能确实不是生成的,而是合成的

Youtube 视频Youtube 视频

区块链新手? 查看 CoinGeek 的区块链初学者部分,这是了解更多有关区块链技术的终极资源指南。

Tags:

标签云

站点信息

  • 文章统计12456篇文章
  • 标签管理标签云
  • 微信公众号:扫描二维码,关注我们