期刊专题

10.12154/j.qbzlgz.2024.04.009

作为生成式人工智能核心驱动力的训练数据的治理研究

引用
[目的/意义]当前研究对于生成式人工智能训练数据的治理问题关注较少.然而,训练数据的生命周期中存在着诸多不容忽视的风险,亟需有效的治理.[方法/过程]文章在论证了训练数据是生成式人工智能核心驱动力的基础上,使用数据生命周期的理论模型,全面归纳了训练数据生命周期中可能出现的风险样态.然后,从训练数据自身特性、生态性因素与生成式人工智能开发者操作性因素等角度分析了相关风险的成因.[结果/结论]数据本身的碎片化特性与偏见性是风险发生的起点;数据的生态失衡是风险发生的外部成因;同时,"黑箱"中的训练数据、偏差的数据标注与懈怠的数据脱敏则是风险发生的内在成因.由此,针对训练数据的特性,可以借助"可怜圆点"的框架,为其构建一个综合法律、市场、社群规范以及架构的风险治理方案.

训练数据、生成式人工智能、数据治理、ChatGPT

45

TP391;G252;N4

司法部专项;中央高校基本科研业务费项目

2024-08-18(万方平台首次上网日期,不代表论文的发表时间)

共9页

87-95

暂无封面信息
查看本期封面目录

情报资料工作

1002-0314

11-1448/G3

45

2024,45(4)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn