2024年将是视频之年。虽然机器人和嵌入式代理才刚刚起步,但我认为AI视频将在未来12个月内迎来突破性发展。包括输入和输出两个方面。
曾经,专家们一度非常有信心。
这一功能的背后是阿里通义实验室自研的视频生成模型Animate Anyone。在Github上,该项目的Star数短短数日就超过1万,被认为是近期大模型领域最受欢迎的大模型算法之一。
除了模仿学习,斯坦福团队还开发了低成本的全身遥操作系统Mobile ALOHA,用于收集双臂移动操作数据。该系统将机器人安装在轮式底座上,实现了全身远程操控。研究人员可以通过遥控器控制机器人的移动和操作,从而完成各种复杂的任务。这个全身远程操控系统的设计简单直接,使用方便灵活,为机器人的操作提供了便利。
根据介绍,该行动计划在2024年底前完成超过8万个重点场所的移动网络深度覆盖,覆盖2.5万公里铁路和35万公里公路以及150条地铁线路。