阿里推出全新推理模型,仅1/21参数媲美DeepSeek R1

快讯3小时前发布 biquandh
3 0 0

金色财经报道,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型,QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。

© 版权声明

相关文章

暂无评论

暂无评论...