DeepSeek模型
AI大模型

DeepSeek模型官网

AI功能描述:推出 DeepSeek-V2.5,融合通用和编码能力,对 API 和 Web 进行了升级,提供全新体验,重新定义可能性。

用户评分:
0分

深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型,并在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。和 DeepSeek AI 对话,轻松接入 API。

产品发布与特性

  1. 产品发布:推出 DeepSeek-V2.5,融合通用和编码能力,对 API 和 Web 进行了升级,提供全新体验,重新定义可能性。
  2. 免费访问与特性优势
    • 提供 DeepSeek-V2.5 的免费访问。
    • 具备 64K 上下文长度(API 端),开源模型支持 128K 上下文长度,在当前主要大模型排行榜上表现出色,在 AlignBench 排名前三,超越 GPT-4 且接近 GPT-4-Turbo;在 MT-Bench 处于顶级行列,可与 LLaMA3-70B 竞争且优于 Mixtral 8x22B,尤其擅长数学、代码和推理。

模型能力对比

在多个测评维度与其他主流模型对比中展现出优势,如在 AlignBench、MT-Bench、MMLU、GSM8K、MATH、BBH、HumanEval 等测评中,DeepSeek-V2.5 在部分指标上超越或接近 GPT-4、GPT-4-Turbo 等模型,相比 GPT-3.5、Gemini1.5 Pro、Claude3 系列、abab 系列、ERNIE-4.0、GLM-4、Moonshot-v1、Baichuan 3、Qwen1.5 72B、LLaMA 3 70B、Mixtral 8x22B 等模型也有自身优势,具体数据表格清晰呈现了各项指标的对比情况。

API 定价

  1. 每百万输入令牌价格为 0.14 美元。
  2. 每百万输出令牌价格为 0.28 美元。

产品优势总结

  1. 参数规模与上下文长度:拥有 236B 参数,API 端 64K 上下文长度(开源模型 128K 上下文长度),为处理长文本和复杂任务提供了基础。
  2. 性价比高:输入和输出令牌定价具有成本效益,在提供强大功能的同时,价格相对合理,适合追求性价比的用户和企业。
  3. 兼容性好:与 OpenAI API 兼容,可实现无缝对接,便于用户在现有系统或工作流程中集成和使用 DeepSeek-V2.5,减少迁移成本和技术障碍。

为此AIGC软件打分

平均评分 0 / 5. 打分人数: 0

暂无人打分!为此AI工具打分。

相关导航