首页 > 快讯 > 开源AI新星崛起!Cogito v2依赖机器直觉与DeepSeek及Claude一决高下

开源AI新星崛起!Cogito v2依赖机器直觉与DeepSeek及Claude一决高下

发布时间:2025-08-01 10:31:37 | 责任编辑:吴昊 | 浏览量:16 次

【小编 报道】近日,一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型(LLM),试图在拥挤的开源AI赛道中突围。不同于传统的参数堆叠策略,这家由前谷歌工程师创立的公司,押注“机器直觉”与自我改进的推理能力,打造出真正能“边用边学”的AI模型。
Cogito v2系列包括四个模型,参数规模从 70B 到671B 不等,分为 密集模型(Dense) 和 专家混合模型(MoE),均已在 Hugging Face、Together AI 等平台开放使用。旗舰模型 Cogito v2-671B MoE 被称为“思维效率最优”的推理型AI,推理路径比 DeepSeek R1缩短60%,性能却能与 Qwen1.5-72B 和 Claude4Opus 接近甚至超越。
其核心技术在于模型不仅在运行时进行“内省式推理”,更将这些推理路径提炼回模型权重中,形成内化直觉。这一机制,让模型能像 AlphaGo 通过对弈强化策略一样,在每一次推理中“变得更聪明”。
Deep Cogito 发布了多个测试样例来验证其“机器直觉”:
在数学问题中,Cogito671B 凭借短至100token 的推理链准确得出结论,而 DeepSeek R1则用了200+ token。
在法律类推理中,它采用两步逻辑结构输出清晰结论,超过许多模型甚至真实法学硕士学生的表现。
在经典亲属逻辑题“爱丽丝是查理的祖母吗?”中,Cogito v2成功避开了代词混淆陷阱,准确输出“祖母”。
尽管 Cogito v2的模型规模庞大,Deep Cogito 称其 训练8个模型总成本不到350万美元,这与 OpenAI、Anthropic 动辄上亿美元的研发开销形成鲜明对比。
公司首席执行官 Drishan Arora 表示:“更好的模型不是训练更多数据,而是训练更有意义的数据。”这正是 Cogito 模型得以在推理任务上突破的关键所在。
Cogito v2模型目前已可通过 Hugging Face、Baseten、RunPod、Unsloth 等平台下载或API调用。为轻量化部署场景,Cogito671B 还推出了 FP8量化版本,支持大模型以更低硬件门槛运行,推理效率提升,准确率仅微幅下降。
更重要的是,Deep Cogito 承诺所有模型开源,并将持续迭代、优化,形成以“推理链反馈+自我提升”为核心的新型模型训练路径。
目前,Cogito v2已获得 Benchmark 和 South Park Commons 等知名机构的关注与支持,并被视为开源AI领域的一匹黑马。

开源AI新星崛起!Cogito v2依赖机器直觉与DeepSeek及Claude一决高下-项目/模型网址:
Hugging Face
开源AI新星崛起!Cogito v2依赖机器直觉与DeepSeek及Claude一决高下

Cogito v2 是由 DeepCogito 团队发布的全新开源模型系列,通过创新的 “自我改进” 机制,显著提升了核心推理能力,同时保持惊人的训练效率。相比之下,DeepSeek-R1 专注于密集推理任务(如代码、数学、科学、逻辑推理),其性能可比肩 OpenAI o1 模型正式版,在 AIME 2024 和 MATH-500 等基准测试中表现优异,并展示了强化学习在培养 AI 自主思考能力方面的潜力。此外,Claude 3.5 Sonnet 在某些智能体编程评估基准(如 SWE-bench verified)上表现优于 Gemini 2.5 Pro 等模型。

综上,Cogito v2 以创新的自我改进机制挑战了 DeepSeek 和 Claude 等主流模型,而 DeepSeek-R1 在推理密集型任务上表现突出,Claude 则在智能体编程等特定场景中有亮眼表现。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐