蚂蚁数科隆重推出金融推理巨作——Agentar-Fin-R1模型
发布时间:2025-07-29 11:09:25 | 责任编辑:吴昊 | 浏览量:7 次
在今日举行的世界人工智能大会论坛上,蚂蚁数科隆重推出其最新研发的金融推理大模型 ——Agentar-Fin-R1。这款模型是基于阿里巴巴的通义千问 Qwen3大模型打造,专注于金融行业的专业性、推理能力以及安全合规能力,旨在为金融机构提供一个 “可靠、可控、可优化” 的智能中枢。
Agentar-Fin-R1在多个权威评测基准上表现出色,不仅超越了同尺寸的开源通用大模型 Deepseek-R1,还在 FinEval1.0和 FinanceIQ 等金融大模型评测中取得了优异的成绩。这一成果表明,蚂蚁数科在金融领域的 AI 应用已然迈入了新的高度。
为了满足不同金融机构在多样化场景下的需求,Agentar-Fin-R1提供了32B 和8B 参数两个版本,此外还有非推理版本的14B 和72B 参数模型。蚂蚁数科的 CEO 赵闻飙在发布会上表示,当前通用大模型与产业实际应用之间存在 “知识鸿沟”,因此构建专业的金融大模型是金融与 AI 深度融合的必然之路。未来,金融大模型的应用深度将成为金融机构竞争力的关键因素。
在数据层面,蚂蚁数科构建了一个业内最全面的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。借助千亿级金融专业数据语料和专家标注的金融长思维链(CoT)构造机制,Agentar-Fin-R1展现出其 “天生懂金融” 的能力。
如今,蚂蚁数科已经帮助上海某银行打造出一款 “AI 手机银行”,为用户提供自然对话式的金融服务。这种 “对话即服务” 的模式不仅提升了老年客户的满意度,还使得月活用户同比增长了25%。
论文地址:https://arxiv.org/pdf/2507.16802
蚂蚁数科于 2025 年 7 月 28 日在世界人工智能大会(WAIC)论坛上正式推出金融推理大模型 Agentar-Fin-R1。
核心亮点
维度 | 信息 |
---|---|
技术底座 | 基于阿里通义千问 Qwen3,提供 8 B / 32 B 两个推理版本,另有 14 B / 72 B 非推理版本,满足不同部署环境。 |
性能表现 | 在 FinEval1.0、FinanceIQ、Finova 等金融权威基准上全面超越同尺寸开源通用模型 DeepSeek-R1 及现有金融大模型,取得 SOTA(State-of-the-Art)成绩。 |
数据与知识 | 构建覆盖 6 大类、66 小类 的金融任务体系(含银行、证券、保险、基金、信托等全场景),基于 千亿级 金融语料,通过可信数据合成 + 专家长思维链(CoT)标注,实现“出厂即专家”。 |
可信 & 合规 | 内置多层可信度保障机制,引入“原则类合成数据”,确保模型天然遵守金融监管红线(数据合规、反洗钱等)。 |
易用性 | 采用创新加权训练算法,显著减少二次微调所需数据与算力,降低企业落地门槛与成本。 |
持续进化 | 结合 RAG 与自主迭代体系,实时吸收最新政策、市场动态与产品条款,保证知识、能力与合规性始终在线。 |
典型场景
-
智能投顾与财富管理:根据风险偏好生成个性化投资组合;
-
风险评估与预警:实时分析市场、财务与行业数据,输出风险报告;
-
金融数据分析与报告生成:自动完成复杂报表、监管报送;
-
客户关系管理:精准识别客户需求,提供个性化服务。
官方声音
“通用大模型距离产业实际应用存在‘知识鸿沟’。构建专业的金融大模型是推进金融与 AI 深度融合的必然路径,未来金融大模型的应用深度将成为金融机构竞争力的关键要素。”
—— 蚂蚁数科 CEO 赵闻飙
生态布局
蚂蚁数科同步推出 Agentar 全栈企业级智能体平台,已联合百家金融机构落地 100 余种金融智能体方案,覆盖智能风控、营销、财富管理等核心场景,形成从底层大模型到上层应用的完整 AI 生态。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。