type
status
date
slug
summary
tags
category
icon
password
DeepSeek-V3-0324 是 deepseek-chat 模型的最新升级版本,发布于2025年3月24日。这次更新涵盖了多个方面的重要提升:
notion image

推理能力增强

模型在多个基准测试上取得了显著进步:
  • MMLU-Pro 分数从 75.9 提升到 81.2,增加了 5.3 分
  • GPQA 分数从 59.1 提升到 68.4,增加了 9.3 分
  • AIME(美国高中数学邀请赛)分数从 39.6 提升到 59.4,增加了 19.8 分
  • LiveCodeBench 分数从 39.2 提升到 49.2,增加了 10.0 分
这表明模型在复杂推理问题上的表现有了质的飞跃,特别是在数学和实时代码评估方面。
⬇️⬇️⬇️查看这些测试基准的详细介绍⬇️⬇️⬇️

Web前端开发能力优化

  • 代码生成的准确率得到了提升
  • 生成的网页和游戏前端界面更加美观

中文写作能力升级

  • 风格与内容方面进行了优化
    • 实现了与R1写作风格的对齐
    • 中长篇写作的内容质量有明显提升

功能增强

  • 多轮交互式改写能力得到提升
  • 翻译质量和书信写作方面有所优化

中文搜索能力优化

  • 对报告分析类请求进行了优化,使输出内容更加详实

Function Calling 能力改进

  • Function Calling 的准确率有所提升
  • 修复了 V3 之前版本存在的问题
这次更新全面提升了模型的各项能力,尤其是在复杂推理、代码生成和中文写作方面的改进非常显著。
相关文章
最全免费 ASR 服务合集!(阿里云系列模型)
Lazy loaded image
大模型基准测试的详细介绍
Lazy loaded image
自定义 Modelfile 方案实现 Ollama Gemma 3 函数调用指南
Lazy loaded image
Ollama 版本 Gemma 3 缺少函数调用的解决方案
Lazy loaded image
解决 OpenAI sdk 报错:Client.init() 出现意外的关键字参数 'proxies'
Lazy loaded image
Due to unexpected capacity constraints, Claude is unable to respond to your message. Please try again soon. 解决方案
Lazy loaded image
大模型基准测试的详细介绍自定义 Modelfile 方案实现 Ollama Gemma 3 函数调用指南
Loading...
Doiiars
Doiiars
一个低调的技术Geek
最新发布
最全免费 ASR 服务合集!(阿里云系列模型)
2025-3-28
大模型基准测试的详细介绍
2025-3-28
Ollama 中 Gemma3 的 Function Calling 无法使用的问题
2025-3-28
自定义 Modelfile 方案实现 Ollama Gemma 3 函数调用指南
2025-3-28
Ollama 版本 Gemma 3 缺少函数调用的解决方案
2025-3-28
DeepSeek-V3-0324更新了什么?
2025-3-27