
 
(资料图)
【总编辑圈点】
苦于缺乏谈判技巧的人们,或许未来可以求助于人工智能(AI)了。英国《自然·通讯》杂志6日报告,“深度思维”公司研发的一种“AI代理”会谈判并能达成协议,其已在测试平台中胜过其他无此能力的代理。这一成果展示了一种深度强化学习方法,用其建模的“AI代理”可与其他人工代理沟通合作,在玩游戏时共同制定计划。
开发能展现出代理间合作和沟通的AI十分重要。流行桌面游戏《外交》为此类行为提供了有用的测试平台,它包含玩家之间复杂的沟通、谈判和形成同盟,而AI一直很难达成这些。要赢得游戏,《外交》需要推断在场玩家的未来计划、玩家间的承诺,和他们的诚实合作。过去的“AI代理”在单个玩家或两个竞争性玩家的游戏中取得过成功,其中玩家之间没有交流。
英国“深度思维”研究团队此次设计了一种深度强化学习方法,让代理可以协商同盟、共同制定计划。研究人员创造出了模拟玩家的代理,形成团队,尝试胜过其他队伍的策略。通过预测可能的未来游戏状态,这一学习算法允许代理对未来行动达成一致,识别有益交易。为接近人类水平的表现,他们还通过检验一些代理间承诺破裂的场景(代理背离了过去的协议),调查了诚实合作的条件。
这些成果有助于“AI代理”形成灵活沟通机制,使其能根据环境调整策略。此外,这些发现还表明,对违反协议的同伴的制裁倾向会大大降低这类违反者的优势,有助于形成大多可信的交流,尽管情况最初更有利于违反协议者。
我们现在也常会跟AI打交道。它热情洋溢、语调轻快地推销商品,介绍活动,提供售后服务。不过,通常情况下我们很快就能发现电话那头的是AI。它很难灵活变通,也回答不了超出设置之外的问题。在“深度思维”公司的这项研究中,AI已经能上谈判桌了。它们不仅会审时度势,还会合纵连横,并惩罚谈判上的不可信者。当然,人类不可能放心直接让AI谈判,但这类尝试可以让AI形成灵活沟通机制,从而增进它们在其他许多领域的表现。(科技日报 记者张梦然)
关键词: 强化学习 研究人员 审时度势萨多拉尼是在《赛尔号》中登场的虚拟人物,是萨帕克的暗黑形态,为萨多的进化体,位于暗黑武斗场第八门,它将暗黑能量融入自身,肢体变得非
对于一个纯粹的、高尚的、脱离不了低级趣味的人来说,还有什么事比预言应验更让人值得炫耀的吗?记得在《千元四核芯之战 MT6589对比高通8x2
新建文件夹的快捷键是什么?怎样一次性批量创建多个文件夹?可能还有同学不清楚,小编整理了相关内容,接下来一起随小编来看看吧!新建文件夹
随着4G时代的来临,短视频、直播等行业获得了发展机会,要对自己的声音进行一层程度的修饰,这就需要用到声卡,那么,声卡效果怎样进行调试
首先,小编可以很明确的告诉大家,在2345看图王上是可以打开查看PDF文件的。在电脑上安装2345看图王的时候,系统就自动安装有相应的2345看
升华泵的抽气机理是什么?升华泵的抽气机理是化学吸附。主要部件是由活性金属钛(Ti)制作的灯丝,通过电流加热灯丝,使得金属钛升华并吸附沉
荣耀手环zero怎么连接手机 荣耀zero手环换电池教程?1、首次使用时,您需要通过穿戴APP连接手环,同步数据成功后才能使用查看时间、健康监
10月份广汽集团生产了多少辆汽车?广汽集团发布产销快报,公布了其 2022 年 10 月份的最新数据。10 月份广汽集团生产汽车 23 48 万辆
光是我们日常生活中不可或缺的一种物质,我们平时所见到的光都是有太阳引起的,月亮上的光也是通过反射太阳才能看见的。大家都知道光的速度
游戏中强迫心理主要有哪几种呈现方式?在游戏中,强迫心理主要有这几种呈现方式:强迫观念,主要体现在玩家对游戏细节的完美主义追求。又可