DRAPA利用人工智能帮助情报界提高分析能力

云脑智库 2022-09-28 00:00

在过去的几十年里,人工智能(AI)系统的开发和培训出现了爆炸性的增长,这些系统现在已经嵌入到跨越几个关键行业的数字计算过程中。人类语言技术(HLT)领域是受益于人工智能的一个领域,特别是机器学习(ML)技术和统计方法。这些方法为许多语言技术提供了重大改进,如机器翻译、信息检索、名称实体检测、事件检测、知识库创建等等。这些技术已经成功地部署在政府、国防和商业环境中,例如用于呼叫中心、预订服务和个人助理。


然而,机器学习的缺点是需要大量的注释数据进行训练,以达到各种应用所需的准确性。机器学习技术也很脆弱,无法处理新的数据源、主题、媒体和词汇表。应用于自然语言的机器学习的这些弱点是由于完全依赖语言的统计方面,而不考虑其意义。


为此,“基于人工智能的语言习得”(GAILA)项目作为美国防高级研究计划局(DARPA)“人工智能探索”(AIE)课题推出,旨在使计算机能够以类似于儿童的方式获取语言。儿童获得语言的基础是他们对周围世界的听觉和视觉信息的感知。观察移动图像并将其与听觉刺激相一致的过程使他们能够将一连串的声音(一个词)与这个词所代表的世界的具体或抽象元素的某些方面联系起来。儿童从机器学习系统所需的极小部分例子中,学会破译观察到的场景的哪些方面与信息中的不同词语有关。序列信息、单词形式的变化和其他附加信息帮助儿童对他们所学的概念进行更精细的分类,这些概念涉及事件或行动(通常由动词表达)、参与这些事件的对象或实体(通常是名词),以及这些实体和事件的属性和关系(形容词和介词短语)。GAILA试图研究和开发一个基础语言获取模型和一个自动语言获取原型,学习理解英语文本和语音,使信息更易于被自动分析使用。


与此同时,美国国防部(DOD)和情报界需要能够稳健和自动分析大量多媒体的计算系统。这些系统还必须与人沟通和合作,以解决模糊不清的问题,并随着时间的推移提高性能。


然而,当前的机器学习方法导致人工智能智能体不能通过对话与人类互动,除非在有限的、专门设计的应用中。目前的计算范式依赖于统计方法,缺乏足够多样化和有代表性的注释数据进行训练,以达到成功实施所需的准确性。此外,这些智能体缺乏理解概念的能力,如物体的属性和能力,这使他们无法处理以前未见过的物体、活动、场景或实体。

“环境驱动的概念学习”(ECOLE)项目Logo

DARPA的“环境驱动的概念学习”(ECOLE)项目旨在通过创建能够不断从语言和视觉输入中学习的人工智能智能体,从根本上改善这些技术。其目标是在对时间敏感、任务关键的国防部分析任务中实现对图像、视频和多媒体文件的人机协作分析,其中可靠性和稳健性是至关重要的。


据DARPA信息创新办公室(I2O)负责ECOLE的项目经理威廉·科维(William Corvey)博士介绍说:“当前的多媒体分析系统缺乏内省。此外,过去构建的符号表示法根本无法扩展。ECOLE的核心创新是教人工智能学习具有面状和概念性质的表征——例如可以与人类伙伴反复讨论的表征;可以推理的表征;以及可以随时概括的表征。”


ECOLE的成果将广泛适用于一系列技术领域——从语义网社区、对互联网上的信息进行推理的商业公司和机器人行业,到为识别物体和活动而处理图像或视频的公共安全组织,以及任何需要对图像和视频数据进行强健的自动推理的群体 ,例如自动驾驶汽车所要求的。


在此之前,威廉·科维管理着“基于人工智能的语言习得”项目。ECOLE试图在这一研究领域的基础上扩展多媒体分析的具体应用。该项目的范围将包括开发算法,通过与人类分析者的互动学习,可以识别、表示和建立形成特定对象的符号和背景模型的属性。


威廉·科维表示:“代表多媒体内容的整体性和可扩展性将需要在无监督学习和将获得的知识提升到符号水平方面进行创新。我们的目标是弥合最先进的符号推理器与完全无监督学习之间的差距,后者目前只能执行像课程范围内的图像说明的任务。”


ECOLE是一个为期四年的项目,分为三个阶段。前两个18个月的阶段将需要进行基础研究,以制作神经符号支架,这将推动该领域在所有人工智能应用领域的多媒体计算分析方面取得进展。在为期12个月的第三阶段,ECOLE将专注于开发与地理空间情报工作流程有关的问题。

ECOLE项目时间表

ECOLE将包括两个技术领域(TAs)分布式课程学习与人机协作分析

 

技术领域一(TA1):分布式课程学习

TA1将涉及利用多媒体数据来构建一个自动课程,以便从对物体的观察中逐步学习,获得关于其属性和能力的知识。对于活动来说,该课程应该能够学习一系列行动对相关物体的影响,包括表示物体的前状态、它们的轨迹和它们的后状态的能力。ECOLE的高效学习应该通过数据驱动、基于课程的主动学习和用户互动来完成,这需要课程设计方面的专业知识来实现与机器的互动,以确定学习中存在哪些差距,并自动改变相应的学习计划。ECOLE将扩展课程学习的现有技术水平,自动将不同的流媒体实例结构化为越来越复杂的神经符号表示学习任务。人类伙伴将对学习过程提供反馈,但不期望建立课程或在TA2中定义的协作分析过程之外对训练实例进行标记。


为解决TA1的问题,提案书应描述以下内容:

1.计划开发一种能力,以无监督的方式自动发现物体的属性和承受力,不需要为新特征的发现机制提供额外的输入,这些特征将如何被用来识别物体,并使用学到的属性和承受力描述物体。

2. 计划开发自动发现活动的前状态、轨迹和后状态以及参与活动的对象的能力,以及描述如何使用状态表示和相关对象来识别和描述活动,以及预测其效果。

3. 计划储存所获得的知识,根据需要检索知识以确定概念,并利用这些知识进行推理以促进高效学习。

4. 计划建立区分物体和活动的描述性和基本属性的能力,以及在以前学过的表述中修改属性的能力。


技术领域二(TA2):人机协作分析

TA2将涉及构建一个人机界面(HMI),以反复改进ECOLE的表述,同时加快多模态数据的分析,包括多媒体和社会媒体。人机界面的核心功能是允许人类分析师与ECOLE的学习表示直接互动,因为它们被应用于对一组特定数据实例的理解。作为一个概念性的例子,在一个图像分析任务中,学习过程可能涉及的范围包括:通过使用有标题的边界框来验证对属性或承受力的感知,这些边界框可以被纠正、重新标记或增强。应用于图像分析的变化随后将被传播到学习表征中。同样,应用于学习表征的变化将改变图像实例的分析。


为了解决TA2的问题,提案书应该描述以下内容:

1.拟议的人机界面,包括所提供的框架将如何加快分析速度,并允许对TA1的表示进行增强和修正,以促进学习。

2.在人机交互过程中处理误解的方法,使交互能够有效地继续。

3. 适应多个用户同时与TA1系统表征互动的机制。

4. 有助于自动分析报告的分析输出格式。

云脑智库 努力是一种生活态度,与年龄无关!专注搬运、分享、发表雷达、卫通、通信、化合物半导体等技术应用、行业调研、前沿技术探索!专注相控阵、太赫兹、微波光子、光学等前沿技术学习、分享
评论 (0)
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦