Grok V7基础模型预训练完毕,马斯克揭示其天然多模态功能
发布时间:2025-08-11 17:19:53 | 责任编辑:吴昊 | 浏览量:7 次
埃隆·马斯克于8月11日在 X 平台上宣布,xAI 的 Grok V7 基础模型已于上周完成预训练。该版本最大的亮点在于其原生多模态能力,能够直接处理视频和音频的比特流,无需进行转换即可理解内容。
这意味着 Grok V7不仅能看懂视频画面,还能听懂语音中的细微变化,精准辨识出表达的情绪和语调重点,从而实现更深层次的语义理解。
与此同时,马斯克还宣布,Grok4 模型现在对所有用户免费开放。免费用户每天可以进行少量查询,如果需要更多的使用权限,则需要付费订阅。此举旨在扩大 Grok 的用户基础,使其更广泛地被大众所接触和使用。
Grok V7的原生多模态能力,预示着其在视频和音频处理方面将带来显著提升,为未来的 AI 应用开启了更多可能性。而 Grok4的免费开放,也反映了 xAI 正在通过不同的策略来平衡技术创新与市场普及。
2025年8月11日,埃隆·马斯克在X平台宣布,xAI公司研发的Grok V7基础模型已于上周顺利完成预训练,其最大亮点是具备原生多模态能力。
核心亮点
-
原生多模态:Grok V7能够直接处理视频和音频的原始比特流,无需任何格式转换即可深入理解内容。
-
情绪识别:可以精准捕捉语音中的情绪变化、语调重点等细微差异。
-
代码生成:在应用层面,Grok已展现出强大的单次提示(one-shot)代码生成能力,例如可一次性生成完整的FPS游戏。
其他相关动态
-
Grok 4免费开放:与此同时,Grok 4模型已向所有用户免费开放,免费用户每日有使用次数限制,超出部分需订阅。
-
未来展望:马斯克透露,未来Grok模型将能通过“自博弈循环”和“数据飞轮”机制,自己“玩”自己生成的游戏,并根据观察结果实时优化代码。
Grok V7的推出,标志着xAI在多模态AI领域迈出了关键一步,也为未来的AI应用打开了更多可能性。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。