Paper Detail

VAMPO: Policy Optimization for Improving Visual Dynamics in Video Action ModelsVAMPO：面向视频动作模型视觉动力学的策略优化方法

cs.CV端到端CV热门获取具身智能多模态

VAMPO Authors

2026年03月20日

arXiv: 2603.19370v1

作者人数

1

标签数量

5

内容状态

含 PDF

原文 + 中文

同页查看标题和摘要的双语信息

PDF 预览

直接在详情页阅读或下载论文全文

深度分析

继续下钻到 AI 生成的结构化解读

摘要 / Abstract

This paper presents VAMPO, a post-training framework that improves visual dynamics in video action models for robot control. The key contribution is formulating multi-step denoising as a sequential decision process and optimizing the denoising policy with rewards defined over expert visual dynamics in latent space. The approach addresses the objective mismatch in current diffusion-based video predictors by explicitly optimizing precision-critical visual dynamics needed for manipulation tasks.

摘要 / Abstract

分类 / Categories

深度分析