东京工业大学的研究团队稍早发布了一套仅用一般 RGB 视频,就能预测画面中人物未来动向的「FuturePose」系统。
「FuturePose」约可猜出人类 0.5 秒后的位置。系统参考画面本身像素的流向,先通过机器学习与 AI 来定位关节,再由定位出来的关节和摆动方向,去推断 3D 环境中的位置。