极客号(Xqh8.com) 12月5日 消息:谷歌子公司DeepMind推出了一款突破性的人工智能代理系统,能够直接从人类教师那里学习任务。该系统通过观察和模仿行动来模拟人类任务执行,展示了一种被称为“文化传递”的新型模仿学习形式。
在《自然》杂志上发表的研究详细介绍了文化传递的过程,使得人工智能模型能够在不依赖预先收集的人类数据的情况下学习。这种类似观看视频教程的方法不仅使人工智能代理能够复制人类行为,还能随着时间的推移记忆观察到的行为。
图源备注:图片由AI生成,图片授权服务商Midjourney
这种少次模仿过程发生在一个名为GoalCycle3D的模拟环境中,人工智能代理在其中从未与人类互动过的情况下从人类示范者那里学到了东西。值得注意的是,该代理成功执行了任务并保留了在“专家离开后”记忆示范的能力。
这一创新方法在培训机器人系统方面具有重要意义,简化了自动化任务的流程,如搬运和放置箱子。此外,其应用范围还可以扩展到客户服务系统,通过交互式学习提供更个性化和适应性的支持。
DeepMind研究的一个显著方面是其解决了与昂贵的人类数据收集和任务固有变化相关的挑战。该论文强调了这种新的培训方法不仅消除了大型数据集的需求,而且还解决了隐私问题,因为人工智能通过实时观察学习,而无需存储大量数据。
以前在以模仿为重点的人工智能培训方面的研究主要集中在单个任务上,缺乏适应多个任务的少次学习器的能力。相比之下,DeepMind的方法涉及一个由神经网络驱动的基于代理的系统,其权重使用深度强化学习进行训练。
尽管这一开创性概念为文化演化在人工智能通用智能发展中发挥作用铺平了道路,但它确实存在一些局限性。人工智能代理可能会错误地概括观察到的行为,而且尽管训练场景取得了成功,但需要更广泛的场景来确定该技术在各种任务中的有效性。
总之,DeepMind的新人工智能代理系统在模仿学习领域取得了重大进展,具有在机器人、客户服务等领域的潜在应用。随着技术的进步,它为更有效且注重隐私的人工智能培训开辟了道路,标志着人工通用智能追求中的一个显著进步。