您现在的位置是:主页 > 区块链 >
TokenPocket钱包安卓版官网|阿里巴巴推出新的基于人工智能的视频生成工具,与先行者竞争
2023-12-28 15:00:20区块链 人已围观
简介BABAAI GitHub I2VGen-xl AI VGen GitHub VGen Python VGen T2V VGen 60 3500 1280720 LLM MetaMETA Llama 2 Animate Anybody ReferenceNet 2023 Web3 Avalanche CoinGeek...
中国科技巨头阿里巴巴(纳斯达克股票代码:BABA)的子公司阿里云宣布推出一款基于人工智能(AI)的新型文本到视频生成器。
根据 GitHub 的可用数据,被称为 I2VGen-xl 的新 AI 模型在从各种来源生成高质量视频方面表现出了熟练程度。 除了视觉上引人注目的视频外,该模特的创作被描述为“语义准确”,减少了错误、幻觉或阿谀奉承的可能性。
“VGen 可以根据输入的文本、图像、所需的动作、所需的主题,甚至提供的反馈信号生成高质量的视频,”GitHub 声明中写道。
VGen 被描述为开源视频生成代码库,允许用户训练他们的文本到视频模型。 通过使用 Python 执行简单的命令,VGen 用户可以训练自定义模型并在无缝过程中执行推理,以提高效率。
该存储库支持具有运动可控性的合成视频合成以及具有人类反馈和缩放 T2V 的指令,同时具有多个用于多个任务的预训练模型。
声明中写道:“它还提供了各种常用的视频生成工具,例如可视化、采样、训练、推理、使用图像和视频的联合训练、加速等。”
根据公告,VGen 通过其海量训练数据实现其高级功能,其中包括 60 亿个文本到图像对和 3500 万个文本到视频对。 该模型的深度训练数据池的影响在于其多功能性和跨多个用例的准确性的提高。
该模型开发团队已经发布了技术论文和官方网页,向研究人员介绍该模型。 用户可以访问预先训练的模型和代码来生成 1280×720 像素视频,使其与现有产品相媲美。
该团队表示,未来将推出专门用于生成人体视频的新模型以及用于动作捕捉的更新版本。
阿里巴巴以新兴技术向前发展
阿里巴巴进军人工智能领域,推出了大型语言模型(LLM)——统一前文,以与 Meta(纳斯达克股票代码:META)的 Llama 2 竞争。该公司并没有满足于现状,推出了旨在生成视频的“Animate Anybody”产品通过其专有的 ReferenceNet 框架从静态照片中获取。
尽管阿里巴巴此前对区块链技术持立场,但 2023 年初与 Web3 公司 Avalanche 的合作见证了阿里巴巴进入虚拟宇宙。 此后,中美之间激烈的半导体冷战减缓了阿里巴巴在人工智能和量子计算领域的进展,因为该公司向内寻找新的解决方案。 阿里巴巴推出了一款新的基于人工智能的视频生成工具,以与先行者竞争。
观看:人工智能确实不是生成的,而是合成的
区块链新手? 查看 CoinGeek 的区块链初学者部分,这是了解更多有关区块链技术的终极资源指南。
Tags:
相关文章
随机图文
-
TokenPocket安卓下载|Trezor 将 SOL 代币和 So
Trezor,史上第一个加密货币硬件钱包品牌, 广告 在您的钱包中实施 Solana 网络... -
tp官网|5ireChain:通过 ESG 驱动的可持续发
在创新与责任相结合的 Web 3.0 动态领域中,5ireChain 作为开拓者脱颖而出,以其... -
将USDT从trc20换为bep20(trc20兑换bep20)
TRC20和BEP20都是USDT的代币标准,分别基于波场和币安链。TRC20格式的USDT运行在波... -
tp钱包官方网址|揭示:为什么加密货币多
BNB 智能链(BSC),之前称为币安智能链,自 2020 年 9 月推出以来已经取得了长...