CCI 中文互联网语料库

CCI 中文互联网语料库

浏览量 0

智源研究院主导的大规模开源中文互联网语料库,CCI 4.0 数据总量达35TB,含中英双语和CoT推理合成数据,助力大模型训练。

CCI(Chinese Corpora Internet)是由智源研究院主导建设的大规模开源中文互联网语料库,为全球大模型研发提供高质量的中文训练数据。最新版本 CCI 4.0 数据总量达35TB,包含中英双语数据集和合成推理轨迹数据,是当前中文领域最具影响力的开源语料库项目。

分享到:
关于CCI 中文互联网语料库特别声明

本站职场人导航提供的CCI 中文互联网语料库都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由职场人导航实际控制,在2026年7月4日 上午2:38收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,职场人导航不承担任何责任。

您必须登录才能参与评论!
暂无评论...