OpenCoder

Name: OpenCoder
Brand: Opencoder
SKU: 68d0d57459b8ff325e1c9b0b
Availability: InStock

(0 条评论)

标签

：

AI 工具与服务 /合成数据

点击联系TA 我也要上架

免责声明

适用范围

产品信息

用户评价

什么是 Opencoder?

OpenCoder 是一个开放且可重复的代码LLM系列，其中包括1.5B和8B基础以及聊天模型，支持英语和汉语。从头开始，OpenCoder 在由90％的原始代码和10％与代码相关的Web数据组成的2.5万亿代币上进行了预估计，并在超过450万高质量的SFT示例上进行了监督命名，最终达到了顶级代码LLMS的性能。我们不仅提供模型的权重和推理代码，还提供可再现的培训数据，完整的数据处理管道，严格的实验消融结果以及详细的培训协议。 _OpenCoder 授权研究人员建立和创新，是您推进代码AI的开放基础。完整的开源：OpenCoder 不仅要发布模型权重和即将推出的推理代码，还可以发布完整的数据清洁代码，以确保完全透明度。该版本包括高质量的合成数据，一组广泛的检查点以及超过450万个监督微调（SFT）条目的数据集，使OpenCoder 是可用的最全面开放式型号之一。全面的实验分析：OpenCoder 通过对各种数据清洁策略和培训过程的大量消融研究进行严格测试，包括文件级别和存储库级的删除实验，确保彻底探索和验证模型的性能。高质量的合成数据：OpenCoder 提供了完全开发的合成数据生成过程，超过450万SFT数据条目，为模型培训和评估建立了强大的数据基础。出色的性能：OpenCoder 在多种语言模型基准中实现高性能，将其定位在代码的领先开源模型中。