《指南》从“数据治理”的发展历程展开,点明当前大模型时代数据治理遇到的问题,后对于“面向人工智能的数据治理”概念进行定义,并从不同维度分析面向人工智能的数据治理与传统的数据治理的差异。
《指南》将人工智能数据治理阶段划分为“数据收集”、“数据预处理”、“模型推理”等9个阶段,提出治理对象包括“原始多模态数据集”、“标签数据集”、“训练数据集”等4类对象。而后明确每个阶段对应的治理目标与方法。
《指南》明确面向人工智能数据治理的三大主要工作,即“数据质量”、“数据安全与隐私”和“数据伦理”,并为企业提供“治理方法”及“技术手段”的实践指导。《指南》还梳理了企业在整个治理过程中应遵循的治理步骤,覆盖从“明确应用目标与需求”到“持续数据集运营与优化”的五个阶段,为企业实践提供方法论的指引。
结合当前人工智能产业的技术发展趋势,《指南》提出数据治理对企业竞争力提升的重要性。未来,随着技术的快速发展与实践的进一步落地,数据治理将推动人工智能应用的高质量发展,人工智能数据产业的分工也将更加明确。
来源: 大数据技术标准推进委员会,报告厅推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表报告厅立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!
立即下载
