OpenAI发布Sora文生视频大模型,清华大学亦有新专利公布
2月21日消息,近日,人工智能领域的领军企业OpenAI发布了其首款名为Sora的文本生成视频大模型。这款模型能够根据用户提供的文字提示,生成长达60秒的高质量视频。令人惊叹的是,Sora所输出的视频效果堪比专业的影视CG,因此在发布后迅速引爆了科技圈。
与此同时,在文生视频技术的研发上,国内高校也取得了显著进展。据国家知识产权局网站公布的信息,清华大学于2月2日申请了一项名为“一种定制化多主体文生视频方法、装置、设备及介质”的专利。该专利涉及神经网络技术领域,为文生视频技术的进一步发展提供了新的思路。
据本站了解,清华大学的这项专利申请中详细描述了一种定制化多主体文生视频的方法。该方法需要获取多个主体分别对应的主体文本表述以及主体图像;然后,基于这些信息,进一步获取混合文本和组合图像。接下来,将混合文本和组合图像输入到文生视频模型中,生成第二噪声预测值,并根据这个预测值与组合图像,计算出第二损失和第三损失。通过综合考虑第一损失、第二损失与第三损失,对文生视频模型进行优化,从而得到一个性能更优的文生视频模型。
这项专利技术的创新之处在于,它通过多种损失函数对文生视频模型的参数进行优化,确保在基于文本描述生成视频中的图像时,文本描述与定制化主体能够保持一致。同时,该技术在生成过程中能够确保每个主体的特征不会发生混淆,并且在最终的视频中消除合成痕迹,从而提升视频的整体质量和观感。
相关文章
- OpenAI发布Sora模型:可根据文本生成多视角视频,电影行业或受冲击
- OpenAI发布Sora模型:文本秒变视频,AI创作再升级
- Gartner警告:生成式AI或致搜索量暴跌25%,企业营销战略需大调整
- 魅族宣布All in AI战略:全力进军人工智能,暂停传统智能手机新项目
- 谷歌开源新工具Magika:基于AI高效识别文件格式和内容
- 通义千问App新春献礼:全家福、拜年舞一键生成,共享欢乐春节
- 昆仑万维发布全新“天工2.0”:国内首个免费千亿级MoE大语言模型AI应用诞生
- 百度推出全新AI拜年功能,智能生成个性贺卡助力春节祝福
- 人工智能进一步促进教育数字化发展
- 谷歌重磅更新:Bard更名为Gemini,AI体验再升级
- 字节跳动推出“扣子”:国内首个AI聊天机器人快速开发平台上线
- 百川智能发布Baichuan 3:超越GPT-4的中文大语言模型新星
- 惠普星Book Pro 14 AI轻薄战力本重磅发布 加速消费级人工智能落地
- OpenAI更新ChatGPT:新增“多语言功能”支持简体中文界面
热门教程
Win11每次开机会检查tpm吗?Win11每次开机是否会检查tpm详情介绍
2Win11任务栏空白怎么办?Win11任务栏空白解决办法
3系统之家装机大师怎么用?系统之家装机大师使用教程
4Win10 21H1更新KB5003637后任务栏不能在底部显示怎么办?
5Win11正式版怎么安装安卓APK应用?Win11安装安卓APK文件方法
6Win10家庭版笔记本电脑怎么关闭Windows defender功能?
7Win11资源管理器的样式如何切换?Win11资源管理器样式切换方法
8Win11电脑下载的文件被自动删除怎么办?
9Win11蓝屏怎么修复?win11蓝屏修复教程
10Win11正式版如何固定“此电脑”到任务栏?
装机必备 更多+
重装教程
大家都在看
电脑教程专题 更多+