DeepSeek即将发布的DeepSeek-R1-Preview在LiveCodeBench基准测试中表现优异,与OpenAI o1的中档推理设置相当。该模型替换了更大规模的基础模型,并帮助LiveCodeBench团队修复了评分系统的bug。此前,DeepSeek宣布R1模型将开源,引发了网友热议,认为2025年的编程将变得更为简单。DeepSeek-R1-Lite-Preview曾表现出自我反思的能力,随着推理长度增加,得分稳步提升。开发者们对未来的开源模型和API充满期待。
© 版权声明
文章版权归作者所有,未经允许请勿转载。