xAI推出Grok4.20:显著增强推理能力,不幻觉率高达78%突破行业新高
发布时间:2026-03-13 10:11:00 | 责任编辑:张毅 | 浏览量:2 次
2026年3月12日,xAI正式发布新一代大语言模型Grok4.20Beta,该模型在保持价格竞争力的同时,凭借极高的事实可靠性刷新了行业纪录。
根据Artificial Analysis的最新评估,Grok4.20在启用推理功能的智能指数(Intelligence Index)中获得48分,较前代版本提升6分。尽管在综合基准测试中仍与Gemini3.1Pro Preview和GPT-5.4(均为57分)存在差距,但其在AA全知测试中的表现极为出色,非幻觉率高达78%,有效解决了AI模型普遍存在的虚假信息编造问题。
在产品矩阵与工程参数方面,xAI同步推出了带推理功能、不带推理功能以及多智能体模式的三种API版本。该模型支持高达200万个令牌的上下文窗口,其定价策略极具市场渗透力,每百万令牌成本仅为2美元至6美元,较Grok4显著降低。技术层面,Grok4.20在面对未知领域时表现出极强的克制力,承认“不知道”的频率大幅提升,错误率仅约为五分之一。
当前全球大模型竞争已从单纯的参数规模转向推理深度与事实准确性的双重博弈。Grok4.20的推出,标志着xAI在追求通用人工智能(AGI)的过程中,正试图通过强化“诚实性”与“低幻觉率”来构建差异化优势。这种对事实可靠性的极致追求,不仅提升了AI在严谨行业应用中的落地潜力,也为未来多智能体协同协作提供了更为稳固的信息信任基础。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
