李飞飞团队提出零样本泛化的技术,性能超越SOTA!
Posted Charmve
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了李飞飞团队提出零样本泛化的技术,性能超越SOTA!相关的知识,希望对你有一定的参考价值。
点击上方“迈微AI研习社”,选择“星标★”公众号
重磅干货,第一时间送达
没错!又是李飞飞!
走在队伍前面的,是来自斯坦福大学的博士,李飞飞的门生!
先来看看李飞飞团队这次在arXiv上发表了的论文题目:
SECANT:用于视觉策略零样本泛化的自专家克隆
废话少说,给大家介绍一下这篇论文的大致内容。
论文介绍
简要介绍
强化学习中的泛化(generalization),是指通过不断跟环境交互,产生出一种网络的记忆性。
这个网络能够根据环境中特定的信号完成相应的动作,经过训练的agent能够记住在什么状态下要做什么,还能通过识别状态的细微差别来采取不同的动作。
再通俗一点,就是在未见过的测试数据上也能够进行预测。
因此,提升模型的泛化是机器学习领域中的一个重要研究。
特别是视觉强化学习方面,泛化很容易被高维观察空间中,一些无关痛痒的因素分散了注意力。
开发者涨薪指南 48位大咖的思考法则、工作方式、逻辑体系以上是关于李飞飞团队提出零样本泛化的技术,性能超越SOTA!的主要内容,如果未能解决你的问题,请参考以下文章
时间序列的建模新思路:清华李飞飞团队等提出强记忆力E3D-LSTM网络
时间序列的建模新思路:清华李飞飞团队等提出强记忆力 E3D-LSTM 网络
CV往哪卷?李飞飞指出三颗「北极星」:具身智能,视觉推理和场景理解