DeepSeek,国产AI应用的“诺曼底时刻”

首页 地方资讯 正文
我们认为DeepSeek的成功有望改变现有AI的产业格局,一方面是中国在全球AI产业的竞争形态,另一方面是大模型开源与闭源的竞争形态:

1)对于训练而言,最引人注目的自然是FP8的使用。根据深度学习与NLP公众号,DeepSeek-V3是第一个(至少在开源社区内)成功使用FP8混合精度训练得到的大号MoE模型。

2)与OpenAI依赖人工干预的数据训练方式不同,DeepSeekR1采用了R1-Zero路线,直接将强化学习应用于基础模型,无需依赖监督微调(SFT)和已标注数据。

3)低成本模型有望引领AI产业“新路径”:开源+MOE。

4)开源VS闭源:开源重构AI生态,与闭源共同繁荣下游。
  免费阅读6页,下载阅读完整文档.
来源: 华西证券,报告厅推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表报告厅立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!

加入我们

报告厅主要包含智慧城市、数字经济、工业互联网、中台战略、物联网、大数据、区块链、5G、元宇宙、碳中和、前沿技术等十二个专题,上万份热门报告可供学习使用。
温馨提示:本站报告存储于“知识星球”平台,请扫码加入后,方可进行下载。

热门报告