向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

如何让机器理解“什么是公平”

时间:2018-11-25 作者:Junko Yoshida 阅读:
“什么是公平”,就算是人类自己也没有统一的标准,它有时取决于语境。不论是在家里,还是在学校,教导小孩要公平是至关重要的,但说起来容易做起来难。正因为如此,我们要如何才能将社会上所说的“公平”的细微差别传递给人工智能系统呢?

“什么是公平”,就算是人类自己也没有统一的标准,它有时取决于语境。不论是在家里,还是在学校,教导小孩要公平是至关重要的,但说起来容易做起来难。正因为如此,我们要如何才能将社会上所说的“公平”的细微差别传递给人工智能(AI)系统呢?JPCEETC-电子工程专辑

IBM研究院的一组研究人员是着手解决该难题的先驱。IBM为开发人员推出了一款名为“AI Fairness 360”的工具包。作为这项工作的一部分,IBM为企业提供一种新的“基于云的、偏差(bias)检测和消除服务”,企业可以使用它来测试和验证AI驱动的系统的行为。JPCEETC-电子工程专辑
SaskaMojsilovic.pngJPCEETC-电子工程专辑
图1:SaskaMojsilovicJPCEETC-电子工程专辑

在接受EE TImes的电话采访时,IBM研究院院士SaskaMojsilovic告诉我们,科学家和AI从业者太过于关注AI的准确性。通常,人们关于AI的第一个问题是,“机器可以击败人类吗?”JPCEETC-电子工程专辑

但公平呢?例如,AI中的公平缺位可能会导致在医疗保健中或自动驾驶车辆造成灾难性后果,她说。JPCEETC-电子工程专辑

如果用于训练机器的数据集有偏差怎么办?如果AI无法解释它是如何做出决定的,那么我们怎样才能验证其“正确性?”AI可以揭示在AI处理过程中数据是否被以某种方式操纵过吗?AI是否可以向我们保证其数据从未(包括处理前和处理后)受到攻击或篡改吗?简言之,是否存在AI内省?简单回答:没有。JPCEETC-电子工程专辑

Mojsilovic表示,如果不对AI用户、开发人员和从业者开放,AI系统就无法获得社会的信任。JPCEETC-电子工程专辑

分解公平

一个更大的问题是如何教导机器什么是公平。Mojsilovic指出,“因为我们是科学家,我们做的第一件事就是分解‘公平’。我们需要从这着手。”他们将公平分解为AI实现中的指标、算法和偏差。JPCEETC-电子工程专辑
Kush Varshney.pngJPCEETC-电子工程专辑
图2:Kush VarshneyJPCEETC-电子工程专辑

IBM研究科学家Kush Varshney解释说,其团队研究了AI算法和AI决策的偏差和公平性。“有个人的公平,也有团体的公平。我们研究了群体的不同属性——从性别到种族。还考虑了法律和监管问题。”最后,团队最终测量了30个不同的指标,以寻找数据集、AI模型和算法中的偏差。JPCEETC-电子工程专辑

这些发现已纳入IBM不久前推出的AI Fairness 360工具箱中。IBM将其描述为“一个全面的指标开源工具包,用于检查数据集和机器学习模型中不期望的偏差。”JPCEETC-电子工程专辑
20181125-AI-fairness.PNGJPCEETC-电子工程专辑
图3:减小整个AI生命周期的偏差。(来源:IBM)JPCEETC-电子工程专辑

图片翻译:解释器;数据偏差检测和偏差消除;用户/业务策略;模型偏差检测和偏差消除;数据偏差检测;预处理;训练数据;建模;测试;配置;反馈JPCEETC-电子工程专辑
JPCEETC-电子工程专辑
虽然许多科学家已经在努力发现AI算法中的歧视(discrimination),但Mojsilovic说IBM的方法不同,它不仅包括发现偏差的算法,且还包括用于消除偏差的工具。JPCEETC-电子工程专辑

在基础层面,你必定会问:由计算机科学家——定义公平?这通常不是社会科学家的活吗?意识到这种不搭调,IBM明确表示Mojsilovic和Varshney都没有闭门造车。他们引入了许多学者和研究机构。Varshney参加了由卡内基国际事务伦理委员会主办的Uehiro-Carnegie-Oxford伦理会议。 Mojsilovic参加了由加州大学伯克利分校法学院赞助的加州伯克利人工智能工作组。JPCEETC-电子工程专辑

算法中立吗?

一段时间以来,社会科学家一直在指出AI偏差问题。JPCEETC-电子工程专辑
Young Mie Kim.pngJPCEETC-电子工程专辑
图4:Young Mie KimJPCEETC-电子工程专辑

威斯康星大学麦迪逊分校新闻与大众传播学院教授Young Mie Kim解释说,“AI歧视(或AI偏差)可能发生在它隐含或明确地强化现有不平等的社会秩序和偏见(例如,性别、种族、年龄、社会/经济状况等)时。”例子从抽样误差(例如,由于抽样方法的不适当或困难导致某些人口统计数据不充分)到机器训练(建模)中的人为偏差。 Kim认为,即使在设计或建模中采用的“战略决策”也存在AI偏差,例如政治广告算法。JPCEETC-电子工程专辑

在她最近题为“算法机会:数字广告和政治参与的不平等”的研究中,Kim展示了在基于算法的决策中不平等是如何被强化的。JPCEETC-电子工程专辑

技术社区可能会争辩说“算法是中立的”或者可以“受过教育”(训练有素)。 Kim指出,“也就是说,他们并不承认在算法开发的任何阶段都会出现偏差。”JPCEETC-电子工程专辑

可解释的AI

不只是消费者害怕AI。许多计算机科学家也表达了担忧。JPCEETC-电子工程专辑

威斯康星大学计算机科学助理教授AwsAlbarghouthi告诉EE Times,“从短期看,我担心越来越多地使用数据驱动的决策,这有可能传播偏见和不公正。从长远看,我担心AI在战争自动化方面的使用。”JPCEETC-电子工程专辑
Loris D’Antoni.pngJPCEETC-电子工程专辑
图5:Loris D’AntoniJPCEETC-电子工程专辑

AI无法解释其决策带来持续焦虑。威斯康星大学计算机科学助理教授Loris D'Antoni告诉我们,“现在,程序员开始将强大的机器学习算法作为编程工具箱中的工具。然而,这些算法复杂、难以预测、难以解释。例如,没人知道由此产生的机器学习模型究竟做了什么。在他看来,“总的来说,自动化决策需要被理解和规范,并且可能以正规的方式进行。”JPCEETC-电子工程专辑

对于流程的每个步骤,从训练数据和处理到测试和部署,IBM指出其工具包提供的解释 可显示:在两种决策中、哪些因素倾向于支持哪一方;对推荐的信心以及支持这种信心的因素。JPCEETC-电子工程专辑

IBM希望AI Fairness 360工具包将被广泛使用,以便开发人员可以为其做出贡献,帮助建立对AI的信任。JPCEETC-电子工程专辑

与此同时,IBM将为企业提供其新的软件服务,旨在自动检测偏差并解释AI在需要做决策时,是如何做出决策的。它在IBM Cloud上运行,可帮助企业管理AI系统。JPCEETC-电子工程专辑

IBM称,其在IBM Cloud上的公平性监控服务将与来自各种机器学习框架模型和AI构建环境(如Watson、TensorFlow、SparkML、AWS SageMaker和AzureML)配合使用。“这意味着组织可以借力这些新控制以服务于企业使用的大多数流行的AI框架,”IBM称。IBM也承诺提供定制服务。“还可对软件服务进行编程,以监控任何业务工作流程的独特决策因素,使其能够根据特定的组织用途进行定制。”JPCEETC-电子工程专辑

好的开始

越来越意识到AI中算法公平问题的AI研究界,对IBM的新产品表示欢迎。威斯康星大学的计算机科学家D'Antoni告诉我们,“看到公平检查技术进入业界并付诸实践,真的令人兴奋。”他补充道,“我认为该工具将使AI研究界更加意识到该问题的重要性。”JPCEETC-电子工程专辑

Albarghouthi称IBM的努力“开了个好头”。JPCEETC-电子工程专辑

但是为了让AI Fairness 360工具包真正变得有效,应该使许多需要理解它的开发人员能用到它。Albarghouthi解释说,该工具需要“与研究界探索的最新的公平技术共同发展。”JPCEETC-电子工程专辑

他告诫说,“如果研究和理解超越了目前的定义和技术,”那么该工具很可能会停滞不前。JPCEETC-电子工程专辑

公平问题

最后,任何成全或破坏AI公平工具包的因素都会回溯到如何定义公平这一棘手问题。IBM的Mojsilovic承认,在不同应用中,公平有不同表现。正如人类对公平有不同看法,用户、客户和公众可能会根据情况对公平有不同评判。JPCEETC-电子工程专辑
AwsAlbarghouthi.pngJPCEETC-电子工程专辑
图6:AwsAlbarghouthiJPCEETC-电子工程专辑

当被问及AI公平工具包的缺陷时,Albarghouthi表示,问题之一是“存在于公平性定义的选择以及其是否足够。”毕竟,公平“在很大程度上取决于领域、其敏感性和涉及的监管。”他补充说:“我确信,这些工具只有在其使用成为机器学习管道的标准部分时才有效。”JPCEETC-电子工程专辑

D'Antoni表达了他自己的担忧。“有很多关于公平和偏差的定义,很难将它们全部考虑在内且其实现也并非能毕其功于一役。”换句话说,“公平定义往往是‘冲突的,’他说。“存在的不可能出现的结果表明,某些公平概念不能同时诉诸实施。”JPCEETC-电子工程专辑
此外,还有一个事实是“机器学习社区目前尚未接受过如何了解现有的公平和偏差定义的含义以及如何使用它们,”他补充道。JPCEETC-电子工程专辑

社会科学家Kim同意。“对这种[AI偏见]问题的认识是抗击AI歧视的第一步,也是最重要的一步。”她指出,“在人类社会中,我们提出了一些减轻不平等和歧视的政策和法规。但问题是AI仍是个秘密。与大多数情况一样,数据和建模是专有的。这使得任何公共政策或监管讨论/辩论更加困难。“JPCEETC-电子工程专辑

透明度

理解了定义公平性时的复杂性和权衡取舍之后,IBM研究人员认为,优先事项应该是AI实践和实施的透明度。JPCEETC-电子工程专辑

IBM的Mojsilovic建议由AI服务开发商和提供商完成并自愿发布供应商的符合性声明(她称之为情况说明书)“以提高其服务的透明度并产生对它们的信任。”她将其比作“食品营养标签”,或“器具信息表”。JPCEETC-电子工程专辑

业界需要有关部署在不同服务中的AI系统信息的标准。 IBM敏锐地意识到这不会在一夜之间发生。正如营养标签花了很长时间才逐步发展起来一样,情况说明书的开发可能是个漫长过程。Mojsilovic警告说,业界才刚刚开始其人工智能之旅。JPCEETC-电子工程专辑

与IBM类似,研究界也在与AI公平问题斗争。在这个悬而未决的领域,IBM的AI Fairness工具箱似乎具有开创性。 D'Antoni告诉我们,“我不知道现有的用于AI模型的通用公平检查工具。”JPCEETC-电子工程专辑

另一方面,他补充说,“研究界提出了许多令人兴奋的原型工具。例如,Kramer等人提出的FairTest和来自我们自己团队的FairSquare。”JPCEETC-电子工程专辑

 本文同步刊登于《电子工程专辑》11月刊杂志JPCEETC-电子工程专辑

qrcode_EETCwechat_120.jpgJPCEETC-电子工程专辑

关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”JPCEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
您可能感兴趣的文章
  • 史上最大FPGA芯片集成900万个系统逻辑单元 最新FPGA VU19P,据称是迄今为止全球最大容量的 FPGA,集成了900万个系统逻辑单元,所包含的晶体管数量高达350亿个。VU19P采用16 纳米 (nm) 工艺,拥有有史以来单颗芯片的最高逻辑密度和最大I/O 数量,可用于复杂ASIC 和 SoC 的仿真与原型设计。
  • 上下并行互通,建筑物联网将颠覆未来 长期以来,由于安装和维护成本不断上升,以及规划和维护建筑所需的专业门槛提升,高效建筑管理系统仅在大型建筑物中可行。现今的建筑自动化系统越来越多地基于无线物联网技术,易于部署、操作和修改。全新低功耗广域蜂窝网络(LPWAN)正在为新一代应用奠定基础,诸如蓝牙5.0和蓝牙mesh网络这类短距离通信技术的创新也在发挥同样的作用。
  • 智能与AI能够为工业4.0的数据连接创造什么价值? 用一个词来总结工厂追求工业4.0的原因,那就是“效率”。或者说实现更低的成本,更简单的生产和运维,这成为实质上推动工业4.0发展的最重要动力……
  • 第一届中国IC产业规模城市排名榜出炉:上海第一,深圳第四 第一版中国集成电路产业规模城市排行榜以百亿为基础排列。过百亿的15个城市集成电路产业规模合计为8280亿元,前10大城市集成电路产业规模合计为7370亿元,占比89%。2018年无锡成为继上海之后 ,第二个产业规模超过1000亿的城市。
  • 存储器和晶圆代工厂商面临“Hyperscaler”科技巨头提 为了满足从云端运算到IoT等新应用需求,Google、Facebook和Amazon等“超大规模业者”(hyperscaler)正以AI/ML作为开发下一代架构的重要基础,重塑半导体产业…
  • AI会变成危险分子,是机器学习算法扭曲? 在大数据时代,隐私法正迅速成为任何数字安全对话的主要元素。对于那些业务建立在消费者数据之上的公司,消费者的信任正在发展成为其业务模式的重要组成部分。相比之下,人工智能的“公平性”还处于20年前隐私讨论的处境。它还没有上升到许多人的意识层面,至少目前还没有。
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告