鹏程·盘古:大规模自回归中文预训练语言模型及应用

首页 地方资讯 正文
在鹏城云脑Ⅱ上训练了全球首个拥有全开源2000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1TB高质量中文训练数据,采用全场景人工智能计算框架MindSpore自动并行技术实现了五维并行训练策略,从而可将训练任务高效扩展到4096个处理器上。对比实验表明,在少样本或零样本情况下,鹏程·盘古模型在多个中文自然语言理解或生成任务上都具有较优的性能。在此基础上,鹏程·盘古模型在大模型压缩、提示微调学习、多任务学习以及持续学习等方面也取得了很好的应用效果。
  免费阅读6页,下载阅读完整文档.
来源: 鹏城实验室等,报告厅推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表报告厅立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!

加入我们

报告厅主要包含智慧城市、数字经济、工业互联网、中台战略、物联网、大数据、区块链、5G、元宇宙、碳中和、前沿技术等十二个专题,上万份热门报告可供学习使用。
温馨提示:本站报告存储于“知识星球”平台,请扫码加入后,方可进行下载。

热门报告