作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
厘清当前阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态是进一步探讨AI训练数据治理的基础与前提.本研究在扎根理论的指导下,以滚雪球抽样法获得的100位AI开发者为研究对象,通过半结构化访谈结合非正式沟通、现实观察、内部与公开资料搜集等方式获取研究数据并提炼概念与范畴,勾勒出现阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态,主要结论包括:(1)AI开发者群体将经由自行采集、公开数据、爬取数据、第三方购买与模拟产生等不同渠道获取的人工智能训练数据用于数据标注、算法验证等常规用途,但存在猎奇分享、窥探心理等异化用途;(2)AI开发者群体对数据使用边界的心理认知主要包括数据泄露/冒用作假、隐私贩卖/侥幸心理、算法偏见/个人主观、干扰社会事务及心理伤害;(3)个人道德、协议约束、法律担忧与媒介监督等因素警示AI开发者对于数据边界问题保持清醒与冷静;(4)将法律、监管、媒体等哲社制衡方案嵌入到AI开发者的数据来源渠道及操作使用层面,进而寻求创新与伦理间的平衡已成为AI数据治理的关键.
推荐文章
人工智能背景下"AI合成主播"功能的优劣性
人工智能
AI合成主播
语音功能
人工智能+创客,在高中开始培养AI人才
人工智能+创客
高中
AI人才
人工智能科普套件的研究与分析
人工智能教育
科普套件
智慧教育
人工智能科普套件
智力培养
人工智能初级课程
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究
来源期刊 新闻记者 学科 社会科学
关键词 人工智能 训练数据 数据来源 使用情态 数据治理
年,卷(期) 2022,(1) 所属期刊栏目 数字生活
研究方向 页码范围 86-96
页数 11页 分类号 G201
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人工智能
训练数据
数据来源
使用情态
数据治理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
新闻记者
月刊
1006-3277
31-1171/G2
16开
上海延安中路839号
4-371
1983
chi
出版文献量(篇)
5537
总下载数(次)
19
论文1v1指导