FactorPortrait: Controllable Portrait Animation via
Disentangled Expression, Pose, and Viewpoint

Jiapeng Tang^1,2, Kai Li¹, Chengxiang Yin¹, Liuhao Ge¹, Fei Jiang¹, Jiu Xu¹, Matthias Niessner², Christian Häne¹, Timur Bagautdinov¹, Egor Zakharov¹, Peihong Guo¹

¹Meta Reality Labs ²Technical University of Munich

arXiv Main Page Phone Dataset Studio Dataset
ViewSweep Dataset DynamicSweep Dataset

Studio Dataset

It is a multi-view video dataset captured in a professional studio, similar to Ava-256. It captures diverse facial expressions, head movements, and gaze directions. Each video is captured from a fixed viewpoint. In this dataset, we want to generate static novel view videos with changes in pose and expression.

Input GAGA CAP4D HunyuanPortrait Ours GT

FactorPortrait: Controllable Portrait Animation via Disentangled Expression, Pose, and Viewpoint

Studio Dataset

FactorPortrait: Controllable Portrait Animation via
Disentangled Expression, Pose, and Viewpoint