来源:中国新闻网
国际著名学术期刊《自然》最新发表一篇计算机科学研究论文称,一种人工智能控制器能让平流层的气球一连数周待在原地,这一研究结果代表深度强化学习向现实世界应用迈进了重要的一步,将提高全自动环境监测成为现实的可能性。
该论文指,填充氦气的“超压”气球常被用来在高层大气开展实验,比如气象监测,如果被风吹偏了航道,它们就要返回驻点。深度强化学习可以训练人工智能系统进行决策,对于超压气球来说,这些决策包括采取哪些行动来保持它们的位置不变。
论文通讯作者、加拿大蒙特利尔谷歌研究院马克·贝勒马尔(Marc Bellemare)和同事训练了一种人工智能控制器,这种控制器能根据风的历史记录、预报、局地风观测和其他因素(如氦气损失和电池疲劳),决定是否要移动气球。研究者利用一种数据增强算法来解释数据中的空白,他们将这种命名为StationSeeker的技术应用到分布在全球各地的Loon气球上,包括一项在太平洋上空进行的为期39天的受控实验。实验显示,受到StationSeeker控制的气球能成功实现自主导航,一旦被吹偏航道,它们能比传统控制器控制的气球更快地回到驻点。
英国牛津大学斯科特·奥斯普瑞(Scott Osprey)在《自然》同时发表的“新闻与观点”文章中表示,深度强化学习的应用此前已在受控环境(如电脑游戏)中得到演示,其受控环境拥有完整的数据集和明确定义的参数。但现实世界的可预测性更差,比如关于环境中风的数据就不完整,因而很难采取最优调整,让气球保持在原位。因此,马克·贝勒马尔和同事的研究成果代表了增强学习在现实世界应用的一次巨大进步。
“金九”发力失败 “银十”车市同样无力 同比下降4% 中汽协发布10月车市数据
日前,中国汽车工业协会(以下简称中汽协)公布了最新一期中国汽车市场销量数据:10月份中国汽车产销量分别为229 5万辆和228 4万辆,环比增长
经销商库存系数迎来四连降 10月库存水平降至警戒线下
11月11日,中国汽车流通协会发布了10月汽车经销商库存调查结果。结果显示,10月汽车经销商综合库存系数为1 39,同比下降26 1%,环比下降7 1
2025年后 我国所有车型有望全部采用中国工况 部分企业先行
汽车工况是汽车行业重要的共性基础,也是车辆、能耗、测试方法和限值方法的基础,此前,我国采用NEDC(欧3 4排放标准的一型试验)工况,消费
10月车市下滑收窄:强势品牌恒强 新能源“四连降” 补贴“退坡”市场趋冷
10月,我国狭义乘用车销量为1843406辆,环比上涨3 5%,同比下滑5 7%,下滑幅度收窄,但仍是自2016年来的最差10月。车市寒冬也加剧了马太效
冷门专业背后的火爆需求 殡葬专业大学生:这行值得尊重 并非“吃死人饭”
把失去的人重新唤回,赋予永恒的美丽。这个过程平静细致而温柔,重要的是充满爱。在这个世界上,每天都会有生命诞生,每天也会有生命离...
关于我们 加入我们 联系我们 商务合作 粤ICP备18023326号-32
中国创氪网 www.chuanganwang.cn 版权所有
投稿投诉联系邮箱:8 8 6 2 3 9 5@qq.com