[AI每日快讯·20241203]全球五大巨头GPU总量曝光!2025年等效H100或超1240万块

发布时间:2024-12-03 08:57:34 · 责任编辑:字母汇 · 浏览量:78 次

一、  全球五大巨头GPU总量曝光!2025年等效H100或超1240万块

1. 2025年,全球五大AI巨头预计将拥有超过1240万块等效H100 GPU算力,微软、谷歌、Meta、亚马逊和xAI将继续扩展其算力。

2. 英伟达预计2025年销量将达到650万到700万块GPU,H100和Blackwell系列将占据主导地位。

3. 各大公司在AI训练中依赖巨量算力,OpenAI和谷歌的训练成本和资源消耗最大,xAI也在迅速扩展超算。

https://mp.weixin.qq.com/s/NIfv9yrQZMq3d9YrtDYkbQ

二、  美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源

1. Prime Intellect宣布开源全球首个去中心化训练的10B大模型INTELLECT-1,展示去中心化训练能够实现大规模模型;

2. 模型训练通过3个大洲、112台H100 GPU完成,采用去中心化框架Prime,提升计算效率和容错性;

3. 未来目标是扩展至AGI,推动社区参与和优化训练框架,确保AI发展开放、协作。

https://mp.weixin.qq.com/s/AwA6zQ8VEZZzEZryKZkJow

三、  DeepMind用语言游戏让AI学AlphaGo自我博弈,突破数据限制

1. DeepMind引入“苏格拉底式学习”,通过语言游戏实现智能体自我博弈,打破数据限制;

2. 语言游戏机制为智能体提供了无限的数据生成与自我完善途径,同时提供反馈以改进技能;

3. 该方法支持递归自我改造,使智能体不仅能从环境中学习,还能调整自身结构,推进AGI的发展。

https://mp.weixin.qq.com/s/EC5QdHcasev8JpTp-OKLKQ

四、  Adobe AI音效MultiFoley,一键生成电影级音效,同步精度惊人!

1. MultiFoley是一款能够根据文本、音频或视频样本生成电影级音效的AI系统,具备超高同步精度;

2. 技术突破在于其48kHz高带宽音频输出和多种输入方法(文本、音频、视频)的集成,实现精确同步;

3. 与现有系统相比,MultiFoley在音视频同步和语义一致性方面表现优秀,未来有望集成至Adobe产品,推动创作行业革新。

https://mp.weixin.qq.com/s/HDJ1A7RqBIZHunVdiETFcQ

五、  特斯拉FSD V13开始推送:代码重写,干净简洁堪比猛禽3引擎

1. 特斯拉FSD V13版本进行了完全重写,优化了端到端网络,支持从停车位到停车位的自动驾驶;

2. V13版本在多个方面进行大幅提升,包括数据处理、视频输入、训练计算扩展和控制延迟缩短;

3. 特斯拉预计FSD将于2025年初超越人类驾驶员,计划推出Robotaxi服务,但完全无人监管可能要等到V14版本。

https://mp.weixin.qq.com/s/y5C7Dz-JPjEH9aPXXdyP-g

六、  中科院联手腾讯打造AI带货王AnchorCrafter,动作表情自然到位

1. 中科院与腾讯合作推出的AnchorCrafter能创建自然流畅的虚拟主播,解决了传统虚拟主播僵硬、呆滞的问题;

2. 用户只需提供主播照片和商品信息,AI便能生成带货视频,并可精确控制主播的动作与表情;

3. AnchorCrafter通过高质量的商品还原与手部互动训练,实现了与真人媲美的带货效果。

https://mp.weixin.qq.com/s/LF3j7gbuQRKHQQafxePK7Q

七、  清华智谱6000亿合成交错语音文本预训练,问答性能提升近3倍

1. 清华和智谱团队提出了一种基于大规模合成交错语音文本数据的方法,突破了传统语音-文本数据集的限制;

2. 该方法通过从文本中生成语音片段,消除了对大量并行语音-文本数据的需求,提升了语音语言模型(SpeechLM)预训练效率;

3. 实验表明,模型在语音问答性能上取得近3倍提升,问答准确率从13%提升至31%,实现了在语音聊天等任务中的显著进步。

https://mp.weixin.qq.com/s/ZfTNihA0PyWJJsSizgJX_g