美国团队报告“Go-Explore”算法可回溯过去、解决复杂任务

英国《自然》杂志24日发表一项人工智能研究成果：美国团队报告了一类增强学习，可回溯过去、解决复杂任务，真正改善了对复杂环境的探索方式，有望应用于机器人、语言理解和药物设计领域。这类算法被统称为“Go-Explore”，其已经在一款经典游戏的算法挑战中得分超过了人类玩家和先进的人工智能系统。该成果被认为正朝着实现真正“智能学习体”迈出了重要一步。

增强学习，可让人工智能系统通过探索和理解复杂环境来进行决策，并学习如何以最优的方式获得奖励。奖励可以包括机器人抵达特定位置或是在电脑游戏中达到一定的等级。然而，当遇到很少给予反馈的复杂环境时，现阶段的加强学习算法就很容易碰壁，这让人工智能专家们非常苦恼。

美国“OpenAI”是由诸多硅谷巨头联合建立的人工智能非营利组织，推动者包括美国创业孵化器Y Combinator总裁萨姆·阿尔特曼、美国太空技术探索公司(SpaceX)创始人埃隆·马斯克等，其目标是希望能够预防人工智能的灾难性影响，并推动人工智能发挥积极作用。此次，“OpenAI”的科学家艾德兰·艾克菲特、朱斯特·赫伊津哈及团队，提出了有效探索面临的两个主要障碍，并设计了一类算法来解决这些障碍。

研究人员表示，“Go-Explore”可以对环境进行全面探索，同时构建一个档案库来记住它去过的地方，确保自己不会忘记通往有望成功的期中阶段或是最终胜利(奖励)的路线。其在雅达利经典游戏中的得分，超过了人类玩家和先进的人工智能系统，研究人员用这类算法，解决了之前未能解决的2600个雅达利游戏，验证了这类算法的潜力。“Go-Explore”在算法挑战《蒙特祖马的复仇》中的得分是之前的4倍，在另一个算法挑战《玛雅人的冒险》中的得分也超过了人类玩家的平均水平。而相对的，此前的算法一分都拿不到。

“Go-Explore”算法还能完成一个模拟机器人任务，在这项任务中，它必须用机械臂把东西捡起来并放到4个架子中的一个架子上，其中两个架子被关在两扇门的后面。

研究人员指出，记住并回到有望成功的探索区域的简单原则是一种强大、通用的探索方法。他们认为最新的算法有望应用于机器人、语言理解和药物设计。

(科技日报)

推荐内容

美国团队报告“Go-Explore”算法 可回溯过去、解决复杂任务

《神经成像》：致幻剂通过打破大脑障碍改变意识

塑料化学品邻苯二甲酸盐损害儿童大脑发育 邻苯二甲酸盐或占产品成分20%

全面推进依法治国 国家法律法规数据库开通

戴着脑电帽控制机械臂写汉字 新的世界纪录诞生

将发光材料打成像素图案 OLED屏幕将进入喷墨打印时代

联合国发布全球环境报告 自然已现三大环境危机

云南成我国野生毒菌中毒的重灾区 我国剧毒蘑菇快速检测新方法

TaVSR1-B基因决定小麦孕穗期根系深度

肿瘤转移复发“见人下菜碟” 身心都要“硬”才有希望打“胜仗”

从生鲜领域到医药领域 快递业连接千城百业

NASA发布“毅力”号火星车登陆火星新视频、全景图及“火星声音”

天问一号成功被火星引力捕获 揭开天问一号火星环绕器神秘面纱

新材料将锂离子电池容量增加3倍 延长锂离子使用寿命

益生菌可有效对抗沙门氏菌 相关研究结果发表在《微生物学前沿》上

胆管“类器官”可用于修复人体受损肝脏 有望缓解器官移植面临困境

新型智能隐形眼镜被开发 可改善视力监测糖尿病和心脏病等

人肠道内鉴定出超14万种病毒 大多数病毒以DNA作为遗传物质

我国中东部地区天气迅猛回暖 是真的“入春”还是冬暖“冒进”？

多地气温迎来大跳水 黄淮江淮等地将有明显降雨过程

120万年前猛犸象DNA测序有新发现 研究揭示猛犸象新谱系

科学家构建水稻全基因组功能单倍型数据集 提出亚洲栽培稻多起源假说

中国科大研制出新型隔离电源芯片 有效提高芯片转换效率和功率密度

突破单一显微成像技术探测局限 科学家实现单分子多维度内禀参量精密测量

为冰雪运动装上“科技的眼睛” 助力运动员训练插上科技翅膀

晴多雨少格局维持 我国多地气温将创今年来新高

“慧眼”卫星研究成果引起国际轰动 中国将为人类天文学发展贡献更大力量

我国高温测井技术跻身国际先进行列 为实现大规模产业化应用奠定基础

鼻咽癌免疫疗法获批 成全球首个获批鼻咽癌治疗的抗PD-1单抗

科学家揭示肠道菌群性别和年龄特征 性别对平谷人群肠道菌群影响最强

意大利一医院用手术机器人切除肿瘤 手术机器人临床中被应用于清醒的人

重庆靠工业立市 “十四五”工业总量目标突破3万亿元

中欧班列累计开行数量突破万列大关 为提振全球经济输送“中国力量”

实施全面生育政策试点方案 解决东北地区人口减少问题

第二批72家重点实验室名单公布 14家中药重点实验室在列

NASA“毅力号”登陆火星 将迈出收集火星样本任务第一步

慧眼支撑 快速射电暴起源磁星爆发成2020年最受关注科学研究成果

天问一号开启绕火之旅 3个月后将在火星着陆

科学家提取出史上最古老DNA 样本来自俄罗斯西伯利亚地区冻土层

我国率先发现高性能纳米闪烁体长余辉材料 手机也能拍摄X光片

贵州茅台科研人员被推荐为中国工程院院士引热议 贵州官方回应质疑

长五B火箭正在奔赴文昌 即将执行空间站核心舱发射任务

鹅座X1恒星级黑洞被精确测量 包含21倍太阳质量黑洞自转速度接近光速

《天体物理杂志快报》发表成果：光学波段信号可当探测热木星大气逃逸探针

我国发布高性能77GHz毫米波芯片及模组 探测距离达到38.5米

美开发一种新型皮肤贴片 可穿戴多合一健康监视器

新式数字银行正在崛起 推动普惠金融深化发展

双面串联装置效能优越 第三代太阳能电池效率实现飞跃

石墨烯-钙钛矿新型X射线探测器问世 大大提高医疗成像设备性能

SpaceX推进SN10研发 或在周五展开Starship新原型机SN10测试

美国团队报告“Go-Explore”算法可回溯过去、解决复杂任务

塑料化学品邻苯二甲酸盐损害儿童大脑发育邻苯二甲酸盐或占产品成分20%

全面推进依法治国国家法律法规数据库开通

戴着脑电帽控制机械臂写汉字新的世界纪录诞生

联合国发布全球环境报告自然已现三大环境危机

云南成我国野生毒菌中毒的重灾区我国剧毒蘑菇快速检测新方法

从生鲜领域到医药领域快递业连接千城百业

天问一号成功被火星引力捕获揭开天问一号火星环绕器神秘面纱

新材料将锂离子电池容量增加3倍延长锂离子使用寿命

益生菌可有效对抗沙门氏菌相关研究结果发表在《微生物学前沿》上

胆管“类器官”可用于修复人体受损肝脏有望缓解器官移植面临困境

新型智能隐形眼镜被开发可改善视力监测糖尿病和心脏病等

人肠道内鉴定出超14万种病毒大多数病毒以DNA作为遗传物质

我国中东部地区天气迅猛回暖是真的“入春”还是冬暖“冒进”？

多地气温迎来大跳水黄淮江淮等地将有明显降雨过程

120万年前猛犸象DNA测序有新发现研究揭示猛犸象新谱系

科学家构建水稻全基因组功能单倍型数据集提出亚洲栽培稻多起源假说

中国科大研制出新型隔离电源芯片有效提高芯片转换效率和功率密度

突破单一显微成像技术探测局限科学家实现单分子多维度内禀参量精密测量

晴多雨少格局维持我国多地气温将创今年来新高

“慧眼”卫星研究成果引起国际轰动中国将为人类天文学发展贡献更大力量

我国高温测井技术跻身国际先进行列为实现大规模产业化应用奠定基础

鼻咽癌免疫疗法获批成全球首个获批鼻咽癌治疗的抗PD-1单抗

科学家揭示肠道菌群性别和年龄特征性别对平谷人群肠道菌群影响最强

意大利一医院用手术机器人切除肿瘤手术机器人临床中被应用于清醒的人

中欧班列累计开行数量突破万列大关为提振全球经济输送“中国力量”

实施全面生育政策试点方案解决东北地区人口减少问题

NASA“毅力号”登陆火星将迈出收集火星样本任务第一步

慧眼支撑快速射电暴起源磁星爆发成2020年最受关注科学研究成果

我国率先发现高性能纳米闪烁体长余辉材料手机也能拍摄X光片

贵州茅台科研人员被推荐为中国工程院院士引热议贵州官方回应质疑

长五B火箭正在奔赴文昌即将执行空间站核心舱发射任务

鹅座X1恒星级黑洞被精确测量包含21倍太阳质量黑洞自转速度接近光速

我国发布高性能77GHz毫米波芯片及模组探测距离达到38.5米

美开发一种新型皮肤贴片可穿戴多合一健康监视器

新式数字银行正在崛起推动普惠金融深化发展

双面串联装置效能优越第三代太阳能电池效率实现飞跃

石墨烯-钙钛矿新型X射线探测器问世大大提高医疗成像设备性能

SpaceX推进SN10研发或在周五展开Starship新原型机SN10测试