潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究

高泽晋

文献导航

搜索文章

搜索思路

钛学术文献服务平台 \
学术期刊 \
科教文艺期刊 \
新闻出版期刊 \
新闻记者期刊 \
潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究

潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究

作者：

高泽晋

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

人工智能

训练数据

数据来源

使用情态

数据治理

摘要：

厘清当前阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态是进一步探讨AI训练数据治理的基础与前提.本研究在扎根理论的指导下,以滚雪球抽样法获得的100位AI开发者为研究对象,通过半结构化访谈结合非正式沟通、现实观察、内部与公开资料搜集等方式获取研究数据并提炼概念与范畴,勾勒出现阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态,主要结论包括:(1)AI开发者群体将经由自行采集、公开数据、爬取数据、第三方购买与模拟产生等不同渠道获取的人工智能训练数据用于数据标注、算法验证等常规用途,但存在猎奇分享、窥探心理等异化用途;(2)AI开发者群体对数据使用边界的心理认知主要包括数据泄露/冒用作假、隐私贩卖/侥幸心理、算法偏见/个人主观、干扰社会事务及心理伤害;(3)个人道德、协议约束、法律担忧与媒介监督等因素警示AI开发者对于数据边界问题保持清醒与冷静;(4)将法律、监管、媒体等哲社制衡方案嵌入到AI开发者的数据来源渠道及操作使用层面,进而寻求创新与伦理间的平衡已成为AI数据治理的关键.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

中学生教育体育图书情报档案大学学报少儿教育教育文化文学新闻出版科研管理艺术语言文字

新闻记者2022 新闻记者2020 新闻记者2019 新闻记者2018 新闻记者2017 新闻记者2016 新闻记者2015 新闻记者2014 新闻记者2013 新闻记者2012 新闻记者2011 新闻记者2010 新闻记者2009 新闻记者2008 新闻记者2007 新闻记者2006 新闻记者2005 新闻记者2004 新闻记者2003 新闻记者2002 新闻记者2001

新闻记者2022年第2期新闻记者2022年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究
来源期刊	新闻记者	学科	社会科学
关键词	人工智能训练数据数据来源使用情态数据治理
年，卷（期）	2022,（1）	所属期刊栏目	数字生活
研究方向		页码范围	86-96
页数	11页	分类号	G201
字数		语种	中文
DOI