CogVideo是由智谱 AI 联合清华大学开发的一种开源文本到视频生成模型,基于 Transformer 架构,是一个 94 亿参数的 Transformer 模型。它通过继承预训练的文本到图像模型 CogView2,并在此基础上进行扩展和训练。
diffusers
库。可以通过以下命令安装这些依赖项:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
pip install diffusers
from diffusers import DiffusionPipeline
model = DiffusionPipeline.from_pretrained("THUDM/CogVideoX-2b")
model.save_pretrained("./cogvideox-2b")
生成视频:通过输入文本描述生成视频。示例代码如下:
prompt = "A cat playing with a ball of yarn"
video = model(prompt).videos
video.save("output.mp4")
CogVideo 及其升级版广泛应用于多个领域,包括:
本网站提供的「CogVideo」相关内容均来源于网络搜集整理,不保证跳转外部链接的准确性和完整性。网站外部链接的内容在[2025-05-25]录入之前合规合法,后期网站的内容如出现违规或者损害了您的利益,可以直接联系网站管理员进行删除。如果涉及到金钱交易,请仔细甄别,避免上当受骗!
ai创作(14) 虚拟人像(1) 智能体模型(8) ai文生视频(31) ai对话工具(43) 人工智能模型(3) ai聊天(41) CogAgent(1) ai大模型(17) 文本转语音(25) 声音克隆(11) ai翻译工具(18) 语音合成(8) 大语言模型(6) ai编程(27) 智能编码(5) 文档生成(1) 大模型(13) ai语音生成(13) ai开发工具(4) ai论文助手(9) ai视频精修(8) AI编程助手(20) AI添加字幕(1) 自然语言处理(9) ai搜索(11) 智能编程助手(6) 电脑智能体(1) 多模态(18) ai机器人(5)