您的位置：首页 >微商 >

MIT发现AI数据集中存在大量标签错误，并建立查看网站

时间：2021-03-29 14:50:58 | 来源：品玩

原标题：MIT发现AI数据集中存在大量标签错误，并建立查看网站

品玩3月29日讯，据Engadget消息，一个由麻省理工学院计算机科学家领导的小组，研究了十个被引用最多的用于测试机器学习系统的数据集。他们发现，大约3.4%的数据是不准确或错误标记的，这可能会导致使用这些数据集的人工智能系统出现问题。

这些数据集被引用次数均超过10万次，其中包括来自新闻组、亚马逊和IMDb的基于文本的数据集。错误源于亚马逊产品评论被错误地标记为正面，而实际上是负面的，反之亦然。

为了找出可能的错误，研究人员使用了一个称为自信学习（confident learning）的框架，该框架检查数据集的标签噪声（或无关数据）。他们使用Mechanical Turk验证了可能的错误，发现算法标记的数据中有54%的标签不正确。研究人员发现，QuickDraw测试集的错误率最高，约为500万（约占数据集的10%）。

团队创建了一个网站，任何人都可以浏览该网站查看标签错误。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。

猜你喜欢

相关推荐

最新推荐

因“商业诋毁的不正当竞争” 腾讯关联公司获赔300万

因“商业诋毁的不正当竞争” 腾讯关联公司获赔300万

高端美妆品牌在中国全面升级独立门店，可以看出哪些门道？

高端美妆品牌在中国全面升级独立门店，可以看出哪些门道？

2020年全国超16万份药品严重不良反应，哪些药是“重灾区”？

2020年全国超16万份药品严重不良反应，哪些药是“重灾区”？

Oppo A53今天在印度推出检查预期价格和完整规格等

Oppo A53今天在印度推出检查预期价格和完整规格等

《Among Us》更新预告玩家迎来一顶免费的“巧克力冰淇淋帽”

《Among Us》更新预告玩家迎来一顶免费的“巧克力冰淇淋帽”

新疆官员批西方在种族问题上集体失忆：简直厚颜无耻

新疆官员批西方在种族问题上集体失忆：简直厚颜无耻

百度关联公司公开两项专利：可提高新闻线索生成的时效性

百度关联公司公开两项专利：可提高新闻线索生成的时效性

美国反华议员又鼓动“提升美国驻台代表层级”，网友痛批：台湾这颗棋子不知被美国玩到何时！

美国反华议员又鼓动“提升美国驻台代表层级”，网友痛批：台湾这颗棋子不知被美国玩到何时！

热门文章

精彩内容

打破传统？白宫官网写“拜登-哈里斯政府”，而非“拜登政府”

2021-03-29
苏伊士运河被堵引发全球关注：小游戏应运而生可随意拖动船只

2021-03-29
“在牙齿上犯的错，须用房子来偿还”

2021-03-29
哪种食用油最健康？特级初榨橄榄油可能对人体最健康

2021-03-29
科大讯飞关联公司公开一项专利：可抑制病菌在乘客乘坐电梯时的传播

2021-03-29
阿姆斯特丹应用科技大学将人工智能与实践相结合

2021-03-29
缅甸政府军再度空袭克伦民族武装控制区数千居民逃往泰缅边境

2021-03-29
印度新增新冠肺炎确诊病例68020例累计确诊超1203万例

2021-03-29