温尼伯站

 找回密码
 注册用户
搜索
热搜: 接送 租房
查看: 523|回复: 0
上一主题 下一主题

[综合资讯] 如何提高训练机器人的效率? 外媒:正强化法

[复制链接]

14万

主题

14万

帖子

29万

积分

管理员

有bug,有问题请私信。

Rank: 9Rank: 9Rank: 9

积分
290469
跳转到指定楼层
楼主
发表于 2020-10-27 02:17:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【环球网科技综合报道】10月27日消息,据外媒报道,约翰斯·霍普金斯大学博士生安德鲁·洪特(Andrew Hundt) 近日发布一篇新论文,指出应通过正强化法训练机器人学习新技能。

这篇论文的核心思想是,在训练机器人的过程中,应采用正强化法,即相比于在它做错时进行惩罚,更应在它做对时进行激励。而对于机器人来说,这种激励机制是以评分系统的形式呈现的,类似玩游戏一样,根据执行任务的情况获得积分。



安德鲁表示,这种方法能够大大缩短训练机器人执行任务的时间。“机器人希望能得到更高的分数,所以它们很快就可以完成相关任务。过去机器人需要一个月的练习才能达到100%的准确性,现在只用两天就能做到。”

不过他也指出,目前机器人执行的这些任务仍然是比较初级的,比如堆积木。但在未来,机器人有望通过正强化法完成更复杂和有意义的任务。
【郑重声明】温尼伯站坛刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经本网同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册用户

本版积分规则



手机版|温尼伯站

JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!

GMT-5, 2025-1-12 02:50 , Processed in 0.070556 second(s), 37 queries , Gzip On.

温尼伯站版权所有

All right reserved by Winnipeg Chinese Media.

快速回复 返回顶部 返回列表