
DeepSeek-R1-0528模型近日在Hugging Face平台开源,引发广泛关注。此次升级虽被官方称为"小版本",但实测表现却实现了跨越式提升。模型在代码能力、文本理解和推理能力等方面均有显著进步,性能已接近OpenAI的o3高版本模型。
在代码能力方面,LiveCodeBench测试平台数据显示,DeepSeek-R1-0528能够一次性生成千行无Bug代码,在动态交互实现上更加精准。文本处理方面,模型上下文长度扩展至128k,长文本提取准确率大幅提升。Extended NYT Connections基准测试得分从38.6%跃升至49.8%。
记者通过三项编程任务对模型进行了实测。在俄罗斯方块游戏开发中,模型生成的游戏功能完整、运行流畅;太阳系模拟任务中,模型准确还原了行星轨道运动,并提供了丰富的科普信息;在英伟达财报网页设计任务中,模型准确提取复杂数据,生成了美观实用的可视化界面。
国际AI领域对此次升级反响热烈。多位专家认为,这标志着中国在全球AI竞赛中的影响力提升。Hyperbolic Labs联合创始人称赞其数学能力,AI评论人Haider称其为"开源的胜利"。CTOL Digital Solutions CEO Max Zhang表示,这一进步为下一代R2模型的发展奠定了基础。









本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/70497/