首页 > 快讯 > Jan-v1模型针对Qwen3-4B-Thinking进行微调，强势冲击Perplexity Pro

Jan-v1模型针对Qwen3-4B-Thinking进行微调，强势冲击Perplexity Pro

发布时间：2025-08-13 15:07:46 | 责任编辑：张毅 | 浏览量：245 次

近日，开源AI领域迎来重磅消息。一款名为Jan-v1的深度研究模型正式发布，基于阿里云Qwen3-4B-Thinking模型精心微调，直接对标商业化产品Perplexity Pro。这款仅有4亿参数的模型凭借91%的SimpleQA准确率、完全本地运行能力以及对推理和工具使用的专项优化，迅速成为AI开发者社区的关注焦点。
性能表现超越预期，准确率媲美商业产品
Jan-v1在SimpleQA基准测试中取得了91%的准确率，略微超越Perplexity Pro的表现，这一成绩令业界刮目相看。通过对Qwen3-4B-Thinking模型的专项微调，Jan-v1在逻辑推理、工具使用和多步骤任务处理方面展现出卓越性能。
该模型支持256K tokens的上下文长度，并可通过YaRN技术扩展至100万tokens，这使其特别适用于长文档分析、学术研究和复杂对话场景。相比许多需要依赖云端算力的大型模型，Jan-v1的这一特性为用户提供了更大的灵活性。
本地运行优势突出，隐私保护成核心卖点
与依赖云端服务的Perplexity Pro不同，Jan-v1最大的优势在于可完全在本地环境运行。该模型仅需约4GB VRAM即可高效工作，大大降低了硬件门槛和使用成本。这一特性不仅保障了用户数据的隐私安全，还避免了网络延迟和服务中断的风险。
Jan-v1通过与Jan App的深度集成，用户可通过简洁的界面快速调用模型功能。该模型支持vLLM和llama.cpp等多种部署方式，为开发者提供了丰富的集成选择。官方推荐的参数设置包括温度0.6、top_p0.95，以确保推理输出的高质量与稳定性。
技术架构创新，双模推理机制引关注
Jan-v1的技术基础来源于阿里云2025年4月发布的Qwen3-4B-Thinking模型。该基础模型拥有4亿参数和独特的双模推理机制，包括思考模式与非思考模式两种工作状态。通过创新的多阶段强化学习微调技术，Jan-v1摆脱了对传统监督微调的依赖，进一步提升了在数学、科学、编码和逻辑推理方面的能力。
该模型的"思考模式"能够自动生成结构化的推理过程，输出以特定格式呈现，便于用户验证和理解AI的推理逻辑。这种透明化的推理过程对于学术研究和复杂问题分析具有重要价值。
应用场景广泛，从研究到智能代理全覆盖
Jan-v1被定位为多功能AI助手，特别适合深度研究、网络搜索和工具调用等场景。无论是解答复杂的学术问题、生成高质量代码，还是通过各种框架执行外部工具任务，Jan-v1都能提供可靠支持。
该模型采用Apache2.0开源许可证，允许开发者自由定制和二次开发。结合Hugging Face、Ollama等平台的生态支持，Jan-v1的应用场景有望得到进一步扩展。
开发者社区积极响应，开源生态日趋完善
Jan-v1的发布在AI开发者社区引发了热烈讨论。许多开发者对其在低资源环境下的高性能表现给予高度评价，认为该模型重新定义了小型模型的应用潜力。91%的SimpleQA准确率和256K上下文支持，使其成为学术研究者和个人开发者的理想选择。
不过，部分社区成员也指出，4亿参数规模的模型在处理极其复杂的任务时可能需要配合外部工具进行优化。尽管如此，Jan-v1的开源特性和完整的技术文档为社区贡献和持续改进提供了良好基础。
Jan-v1的发布标志着开源AI领域的重要进展，其兼顾性能与隐私的设计理念，以及相对较低的资源需求，为AI技术的普及和应用提供了新的可能性。随着社区的持续贡献和工具生态的不断完善，这款模型有望在AI研究和实际应用中发挥更大作用。
项目地址：https://huggingface.co/janhq/Jan-v1-4B

根据当前最新公开信息，Jan-v1模型确实是在Qwen3-4B-Thinking基础上进行微调而来，并在本地运行场景下取得了91%的SimpleQA准确率，略超Perplexity Pro，具备挑战其地位的潜力。

核心要点如下：

基础模型：Jan-v1基于Qwen3-4B-Thinking微调，后者是Qwen3系列中专为“深度思考”优化的版本，支持thinking/no-thinking双模式。
性能表现：在本地部署环境下，Jan-v1在SimpleQA基准测试中达到91%准确率，高于Perplexity Pro，尤其适用于网页搜索与深度研究任务。
挑战Perplexity Pro：Perplexity Pro作为当前领先的AI搜索助手，依赖云端大模型，而Jan-v1则主打本地运行+高精度+低延迟，在隐私、成本和响应速度上具备优势。

技术实现细节（微调层面）：

微调方式：社区已有开发者使用ms-swift框架对Qwen3-4B进行LoRA与Full Fine-tuning实验，发现LoRA微调在保留“思考模式”输出方面更稳定。
数据集与训练策略：训练数据可能包括长思维链（CoT）样本与搜索任务相关的高质量问答对，以增强模型在信息检索与推理任务上的表现。

总结：

Jan-v1并非全新架构，而是站在Qwen3-4B-Thinking肩膀上，通过精准微调与本地优化，实现了对Perplexity Pro的局部超越。它的出现标志着开源小模型在特定场景下已具备挑战闭源大模型的能力，尤其适合对隐私、成本敏感的用户与开发者。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： “花生 AI”：B 站的新型 AI 视频制作工具，3 分钟即可完成影片制作

下一篇：官方声明驳回关于8月发布DeepSeek-R2模型的计划

Jan-v1模型针对Qwen3-4B-Thinking进行微调，强势冲击Perplexity Pro

核心要点如下：

技术实现细节（微调层面）：

总结：

最新Ai信息

最新Ai工具

热门AI推荐