AI大模型
DeepSeek模型官网
AI功能描述:推出 DeepSeek-V2.5,融合通用和编码能力,对 API 和 Web 进行了升级,提供全新体验,重新定义可能性。
深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型,并在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。和 DeepSeek AI 对话,轻松接入 API。
- 产品发布:推出 DeepSeek-V2.5,融合通用和编码能力,对 API 和 Web 进行了升级,提供全新体验,重新定义可能性。
- 免费访问与特性优势
- 提供 DeepSeek-V2.5 的免费访问。
- 具备 64K 上下文长度(API 端),开源模型支持 128K 上下文长度,在当前主要大模型排行榜上表现出色,在 AlignBench 排名前三,超越 GPT-4 且接近 GPT-4-Turbo;在 MT-Bench 处于顶级行列,可与 LLaMA3-70B 竞争且优于 Mixtral 8x22B,尤其擅长数学、代码和推理。
在多个测评维度与其他主流模型对比中展现出优势,如在 AlignBench、MT-Bench、MMLU、GSM8K、MATH、BBH、HumanEval 等测评中,DeepSeek-V2.5 在部分指标上超越或接近 GPT-4、GPT-4-Turbo 等模型,相比 GPT-3.5、Gemini1.5 Pro、Claude3 系列、abab 系列、ERNIE-4.0、GLM-4、Moonshot-v1、Baichuan 3、Qwen1.5 72B、LLaMA 3 70B、Mixtral 8x22B 等模型也有自身优势,具体数据表格清晰呈现了各项指标的对比情况。
- 每百万输入令牌价格为 0.14 美元。
- 每百万输出令牌价格为 0.28 美元。
- 参数规模与上下文长度:拥有 236B 参数,API 端 64K 上下文长度(开源模型 128K 上下文长度),为处理长文本和复杂任务提供了基础。
- 性价比高:输入和输出令牌定价具有成本效益,在提供强大功能的同时,价格相对合理,适合追求性价比的用户和企业。
- 兼容性好:与 OpenAI API 兼容,可实现无缝对接,便于用户在现有系统或工作流程中集成和使用 DeepSeek-V2.5,减少迁移成本和技术障碍。
智谱AI大模型