PANews 9月10日消息,去中心化AI协议Prime Intellect发布强化学习微调(RFT)服务,提供全栈RL基础设施,助力AI原生公司创建和训练定制代理。服务包括rl-trainer、验证器和环境中心,支持在强化学习环境中训练模型。此外,还推出Prime Sandboxes隔离Docker环境,专为安全执行代码和LLM基准测试设计。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...
PANews 9月10日消息,去中心化AI协议Prime Intellect发布强化学习微调(RFT)服务,提供全栈RL基础设施,助力AI原生公司创建和训练定制代理。服务包括rl-trainer、验证器和环境中心,支持在强化学习环境中训练模型。此外,还推出Prime Sandboxes隔离Docker环境,专为安全执行代码和LLM基准测试设计。