首页 > 每日快讯 > [AI每日快讯·20241204]腾讯正式发布混元版「Sora」，权重、代码、算法全开源

[AI每日快讯·20241204]腾讯正式发布混元版「Sora」，权重、代码、算法全开源

发布时间：2024-12-04 09:18:15 | 责任编辑：字母汇 | 浏览量：444 次

一、李飞飞World Labs「空间智能」模型！一张图生成3D世界

1. 李飞飞的World Labs推出首个“空间智能”模型，实现从一张图生成3D世界；

2. 该技术可用于实时渲染、生成可互动的虚拟环境，改变游戏、电影和VR的发展；

3. 该模型结合了生成式AI与3D技术，为创作者提供全新的创意工作流，并推进空间智能的应用。

https://mp.weixin.qq.com/s/CtmG0pck4fwtBWkypvt0sA

二、腾讯正式发布混元版「Sora」，权重、代码、算法全开源

1. 腾讯开源了其混元视频生成模型，具备超强的真实质感和高水平的语义理解；

2. 模型能够精准理解复杂的文本提示，写实风格上表现突出，特别是人物面部识别和细节处理；

3. 支持镜头切换，提升视频的视觉张力和一致性，是目前少数具备此功能的AI视频生成工具之一。

https://mp.weixin.qq.com/s/kalNwoQP07lccluKPo0DzQ

三、谷歌爆火产品NotebookLM核心团队集体离职，另起炉灶创业

1. 谷歌NotebookLM团队核心成员集体离职创业，团队包括负责人Raiza Martin、设计师Jason Spielman和工程师Stephen Hughes；

2. NotebookLM是谷歌Labs的实验性AI产品，因音频概述功能爆火，团队最初仅有几人，依靠Google Labs的支持快速发展；

3. 离职成员拥有丰富的创业和产品开发经验，计划继续探索大模型的新应用，NotebookLM将继续更新。

https://mp.weixin.qq.com/s/ZhlY8H_ulhhbTy3McI6Rcw

四、即梦灰测2.1模型，新模型解决AI图像生成中文字体的问题

1. 字节即梦AI发布2.1模型，重点解决AI图像生成中文字体问题；

2. 用户可通过简单描述生成带有中文字体的海报和素材，提升设计师效率；

3. 模型支持多种应用场景，如个性化海报、小说封面、社交媒体配图等，目前处于灰度测试阶段。

https://mp.weixin.qq.com/s/AmjGdI5N6Rjd92RWQIH1Zg

五、 Arc浏览器团队预告了新AI浏览器Dia，他们想重新设计光标

1. Arc 浏览器开发公司预告推出AI浏览器Dia，聚焦AI工具集成，计划2025年初发布；

2. Dia浏览器将通过光标和地址栏等功能，帮助用户自动执行任务，如获取信息、发送邮件和安排会议；

3. 该浏览器还将展示自动操作功能，如自主浏览电商网站并添加购物车项目，目标是构建无缝的AI助手体验。

https://mp.weixin.qq.com/s/4_z9XmLTDmwuIJmTPsoA5g

六、告别声音克隆侵权！Hume AI推出Voice Control可编辑语音

1. Hume AI推出“Voice Control”功能，允许用户无编程经验创建个性化AI语音；

2. 用户可在10个维度上调整语音特性，如性别、自信度、热情等，轻松定制语音；

3. 该功能结合情感智能语音接口，适用于客服机器人、虚拟助手等应用，未来计划扩展能力和优化音质。

https://mp.weixin.qq.com/s/pge4zIgeZdnvo3SzcjkCKQ

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：马斯克要求阻止OpenAI向营利企业转型

下一篇： [AI每日快讯·20241205]亚马逊一口气发6个大模型、3nm芯片、多模态Any-to-Any

[AI每日快讯·20241204]腾讯正式发布混元版「Sora」，权重、代码、算法全开源

最新Ai信息

最新Ai工具

热门AI推荐