源之原味

利用人工智能解决维基百科的性别问题

 

这篇文章来自 wired.com。原始 url 是: https://www.wired.com/story/using-artificial-intelligence-to-fix-wikipedias-gender-problem/

以下内容由机器翻译生成。如果您觉得可读性不好, 请阅读原文或 点击这里.

利用人工智能解决维基百科的性别问题

Hotlittlepotato

仪阿德尔森是 一位成功的医生发表了大约100篇关于成瘾的生理学和治疗的研究论文。她还在拉斯维加斯开办了一个高调的药物滥用诊所。哦, 她是以色列最大的报纸出版商, 她的亿万富翁丈夫谢尔顿是一位慈善家和有影响力的共和党捐赠者。

但维基百科没有她的词条。

阿德尔森是数以千计的名称标记的水银, 软件工具 由旧金山启动底漆, 旨在帮助维基百科编辑填补众包百科全书中的盲点。妇女在科学方面的代表性不足是一个特定的目标。世界上第五个访问量最大的网站有一个 性别偏见的长期运行问题: 只有 18% 它的传记是妇女。调查估计84到90% 的维基百科编辑是男性。

水银使用机器学习算法来冲刷新闻文章和科学引文, 以发现维基百科中缺少的著名科学家, 然后为它们编写完全来源的草稿条目。仪阿德尔森的草稿如下所示:

仪阿德尔森是医生和主席的 dr 和谢尔顿 g. 阿德尔森诊所药物滥用治疗和研究。[1] 与她的丈夫谢尔顿阿德尔森, 她拥有拉斯维加斯评论-杂志和以色列 Hayom。[2] 她在2015年6月被福布斯列为280亿美元的财富, 使他成为世界上第十八富有的人。[3] 她经常被媒体报道引用为报纸的主人, 包括 JTA。[4]

水银已经制作了4万份这样的摘要--有些是较长的, 小的故障是标准的--对于从维基百科中失踪的男性和女性科学家来说。底漆 发布了一个样本100 今天。bot 不会自动将其输出添加到维基百科中。相反, 它所生成的摘要旨在为维基百科编辑提供一个起点, 他们可以清理错误并检查源代码, 以防止任何算法对站点造成污染。

约翰 Bohannon, 谁带领工作在水银在底漆, 说的人辛苦地倾向于维基百科需要一些算法帮助, 以取得重大进展, 填补项目的相当大的缺陷。"我们可以加速他们的生产," 他说。

这是早期的, 但入门的软件已经开始产生影响。伦敦帝国学院的一位物理学家杰西卡?韦德从 Bohannon 那里得到了一个关于水银的预览。她被提示写一项 Joëlle Pineau, Facebook 的蒙特利尔 AI 实验室的负责人, 世卫组织指出, 该网站缺少水银。"维基百科是令人难以置信的偏见, 而女性在科学方面的代表性却特别糟糕," 韦德说, 他在过去的一年里亲自向该网站添加了近300名女性科学家。"有了水银, 你就不用到处找失踪的名字了, 而且你很快就得到了大量的货源信息."

水银还可以帮助编辑保持现有的维基百科文章最新。今年春季在纽约市进行了一次编辑, 旨在提高美国自然历史博物馆主办的女性科学家的参赛作品。水银提供了它从网络上刮下来的事实, 包括与来源的链接, 在维基百科 bios 稀少的女性科学家身上。组织这次活动的博物馆研究员玛丽亚 Strangas 说, 它帮助25位首次编辑在短短两个小时内更新了大约70名女性科学家的网页。"它放大了事件对维基百科的影响," Strangas 说。

水银是从工具和数据的副产品, 底漆用于服务客户, 包括美国情报机构和大型金融公司。启动提供了摄取内部或外部数据-思考新闻提要或内部文档的软件, 并生成图形或书面报告。

底漆的项目开始时, Bohannon 会见了韦德和其他人试图改善在维基百科上的妇女代表在去年的一个会议上, 并开始怀疑, 如果算法可以帮助。他后来听取了维基百科基金会的建议, 这个非营利组织是 wiki 的东道主。

第一步是收集关于科学家的3万篇维基百科文章, 用来训练算法, 以检测与在网站上有条目的研究员相关的新闻文章中的信号。水银利用这一知识找到著名的失踪的名字, 通过交叉引用现有的维基百科条目的名单上的20万科学作者从学术搜索引擎被称为语义学者。该软件提供了从5亿篇新闻文章的集合中写出缺失条目所需的事实, 并将其反馈给一个培训系统, 从过去的示例中生成传记条目。

水银远不是第一次尝试使维基百科雄心勃勃的目标更容易驾驭。机器人已经 自动修复打字错误或破坏行为, 例如。维基媒体基金会正在研究如何通过绘制以一种语言存在但不在其他方面的文章来自动填写维基百科。

底漆正在努力使水银多语种, 最初扩大到俄罗斯和中国, 并扩大到涵盖其他主题, 如政治家。但它不打算永远让水银自动添加到该网站。"总有人类在循环中," Gourley 说, 底漆的首席执行官肖恩。"这个项目是关于问, 你如何最好地使用有限数量的参与人类, 你有吗?

维基百科臭名昭著的一丝不苟社区可能会密切关注水银的帮助所产生的内容。一个问题是, 这个旨在修复盲点的工具是否有自己的盲点。韦德已经注意到, 该工具的建议似乎偏向于美国人, 这呼应了维基百科本身的缺点。韦德说: "我们需要格外小心, 这样我们就不会在机器学习系统中传递任何偏见."


更多精彩的有线故事

Leave A Reply

Your email address will not be published.