搜索

用于大模子的首批中文根基语料库宣告

发表于 2024-05-06 17:44:00 来源:火烧火燎网

  中新网北京12月21日电 中国收集空间清静协会家养智能清静规画业余委员会20日在北京召开宣告会,用于面向社会宣告用于大模子的大模的首首批中文根基语料库。

  据悉,批中网安协会家养智能清静规画专委会会同国家威信机构,文根发挥企业、基语高校以及科研单元协同优势,料库经由“共建-同享”机制,宣告集聚一批高品质可信数据,用于经由去重、大模的首过滤等技术本领,批中组成并对于社会宣告首批120G中文根基语料,文根搜罗1亿余条数据,基语500亿个token。料库用户登录中国收集空间清静协会网站,宣告点击“中文根基语料库”链接,用于经由注册、认证等挨次,就能下载相关语料。

  网安协会家养智能清静规画专委会负责人展现,语料库建树是一项临时性、业余性的使命,需要凭证响应纪律、尺度以及尺度,需要协力共建、突破立异,增长组成迷信实用的语料库集聚、处置、运用机制,为国家家养智能技术立异以及财富睁开赋能。

  来自专委会成员单元、大模子存案机谈判相关规模科研、企业、社会机关代表近100人退出宣告会。

随机为您推荐
友情链接
版权声明:本站资源均来自互联网,如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

Copyright © 2016 Powered by 用于大模子的首批中文根基语料库宣告,火烧火燎网   sitemap

回顶部