(一)通用——解决机器人高需求和低渗透率的矛盾1.机器人进化路径:从固定到移动,从独立到协作,从单一到通用服务机器人商业化落地的前提是产品能提供真实价值,真实价值的判断在于机器人能否通用。我们认为原因在于:目前大多数服务机器人都或多或少的存在场景适应性的问题,如无法适应环境变化,环境变化后,用户无法通过简单操作实现场景适配;智能化程度低,行人避障及功能表现不理想;机器人部署流程复杂(如SLAM建图、目标点标注等),所有部署操作只能由机器人现场部署工程师执行,使用者难以操作及参与,且当需要变更时,仍需现场部署工程师进行操作。以上问题在工业机器人领域同样存在,影响了工业机器人渗透率的提升,直到协作机器人的出现。2.如何让机器人更加通用?使机器人更加通用,需要机器人的感知能力、思考和决策能力、行动执行能力的全面提升。感知世界的能力(机器人的眼睛):机器人自主移动的感知和定位技术中激光和视觉导航是主流应用方案。计算机视觉的发展经历了基于以特征描述子代表的传统视觉方法、以CNN卷积神经网络为代表的深度学习技术,目前通用的视觉大模型正处于研究探索阶段,人形机器人的场景相对工业机器人更通用、更复杂,视觉大模型的AllinOne的多任务训练方案能使得机器人更好地适应人类生活场景。思考和决策的能力(机器人的大脑):目前的机器人都是专用机器人,只能在限定场景中应用,即使是机器人抓取,基于计算机视觉,仍然是在限定场景中,算法仅用于识别物体,如何做、做什么仍需要人的定义。人类工具和环境的适应性,不用再为了机器人而造工具。执行能力(机器人的四肢):行动能力(腿)+精细操作(手)。把机器人做成人形,就是为了让机器人的执行能力更加通用。3.人形机器人进入商业化前夜第一台人形机器人WABOT-1(1973年)。本田E系列机器人(1986~1993年),奠定稳定行走基础。本田P系列机器人(1993-1997年)"ASIMO(2000~2011)。HPR系列机器人(1998~2018)代替建筑行业的繁重工作。波士顿动力(1986~2023):腿足式机器人运控技术最前沿,军事化应用特征明显。Digit系列机器人(2019~2023):具备行走能力,专注物流领域商业化。小米“铁大“机器人(2022):21年小米曾发布一款机械狗Cyber dog,是其在足式机器人的首次尝试。特斯拉Optimus机器人(2022年):推动人形机器人商业化。交互型机器人索菲亚(2015)和阿梅卡(2021),面部表情拟人化的尝试。(二)AI大模型+人形机器人:给机器人提供常识1.AI大模型训练过程及发展趋势大模型=预训练+微调。(二)AI大模型+人形机器人:给机器人提供常识1.AI大模型训练过程及发展趋势大模型=预训练+微调。2.AI大模型让人形机器人具备通用任务解决能力AI大模型将会从语音、视觉、决策、控制等多方面实现同人形机器人的结合,形成感知、决策、控制闭环,大大提升机器人的“智慧”程度:语音:ChatGPT作为一种预训练语言模型,可以被应用于机器人与人类之间的自然语言交互。例如,机器人可以通过ChatGPT来理解人类的自然语言指令,并根据指令进行相应的动作。视觉:视觉大模型赋能人形机器人识别更精确,场景更通用。决策:通用语言、环境感知能力是自动化决策的基础,多模态大模型契合人形机器人的决策需求。决策:通用语言、环境感知能力是自动化决策的基础,多模态大模型契合人形机器人的决策需求。微软提出ChatGPT for Robotics,利用ChatGPT解决机器人应用程序编写问题。人类可以从机器人流程中的in the loop变为on the loop人类在机器人pipeline中的任务主要是:1)首先,定义一组高级机器人API或函数库。2)为ChatGPT编写一个文本提示,描述任务目标,同时明确说明高级库中的哪些函数可用。3)用户通过直接检查或使用模拟器来评估ChatGPT的代码输出。4)当用户对解决方案感到满意时,就可以将最终的代码部署到机器人上。ChatGPT可以以zero-shot的方式解决简单的机器人任务。在人类用户on the loop交互下,ChatGPT可以完成更复杂的机器人控制任务。ChatGPT的对话系统能够解析观察并输出相关操作。(三)人形,让机器人的运动执行更加通用执行能力(机器人的四肢):行动能力(腿)+精细操作(手)。把机器人做成人形,是为了让机器人的执行能力更加通用。波士顿动力Altas定位于技术的前瞻性研究,侧重探索技术应用的可能性而非商业化。特斯拉Optimus发心于人形机器人的规模化、商业化、标准化,商业化的目标驱动下,成本、能耗成为特斯拉团队的考量指标。1.驱动:液压驱动VS电动驱动(1)电驱成本低、易于维护、控制精度高,商业化潜力高主流人形机器人的驱动方案包括液压驱动和电气驱动(伺服电机+减速器)两种。(2)波士顿动力Atlas:采用“液压驱动”方案波士顿动力全身共28个液压执行器,可执行高负载复杂动作。(3)特斯拉Optimus:采用“电动驱动”方案单台Optimus全身40个执行器,是单台多关节机器人的6~7倍。旋转关节方案(肩、髋、腰腹):伺服电机+减速器,我们推测,单台人形机器人将搭载6台RV减速器(髋、腰腹)和8台谐波减速器(肩、腕)摆动角度不大的关节(膝、肘、踝、腕):线形执行器(伺服电机+丝杠)。行星滚柱丝杠以其高承载、高刚度、长寿命的特点或成为人形机器人线性执行器的关键传动装置,通过适配人形机器人需求实现降本是大规模放量的前提。机械手:Optimus单手包括6个执行器,可实现11个自由度,由微型电机驱动,“欠驱动”方案性价比高,“绳驱“传动结构不确定性较大。机械手驱动方案差异较大,电机的轻量化、低成本是关键。空心杯电机结构紧凑、能量密度高、能耗低,和人形机器人机械手需求契合度高。特斯拉Optimus机械手采取电机+腱绳驱动的方式,可能对手部传动方案进行优化。2.环境感知:深度相机+激光雷达VS纯视觉方案用于实现机器人自主移动的感知和定位技术原理主要包括视觉、激光、超声波、GPS、IMU等,对应机器人感知系统的不同传感器类别。(1)波士顿动力Atlas:深度相机+激光雷达波士顿动力Atlas感知方案融合深度相机和激光雷达,基于多平面分割算法实现步态规划。(2)特斯拉Optimus:纯视觉方案,成本更低特斯拉Optimus环境感知采用基于摄像头的纯视觉方案,移植特斯拉全自动驾驶系统,成本更低。3.运动控制:尚未形成通用的控制器解决方案运控算法是核心竞争力,各家人形机器人控制算法均为自研。(1)运动控制算法:思路相似,均为离线行为库和实时调整波斯顿动力Atlas:基于离线行为库和模型预测控制(MPC)实现行为控制。特斯拉Optimus:步态规划算法思路和Altas类似,运动规划器生成参考轨迹,控制器根据传感器信息实时调整优化行为,控制算法尚不成熟。类似的,Optimus上肢操作借助基于动捕和逆运动学映射构成的离线行为库,通过实时轨迹优化实现自适应操作。(2)运动控制器:多为自主设计,不同厂商需求差异大人形机器人采集并处理多种模态数据,执行机构复杂程度远高于工业机器人,对控制器实时算力、集成度要求高。人形机器人控制器多为自主设计,不同厂商需求差异大。波士顿动力Atlas:机器人本体搭载3台工控机负责运控系统的计算。特斯拉Optimus:复用特斯拉汽车的感知和计算能力,在全自动驾驶FSD芯片基础上开发适合人形机器人的控制器系统。(四)投资结论及产业链梳理目前人形机器人厂商多为自行采购上游零件,集成以实现对自家机器人的适配,控制算法和控制器的设计是机器人运动控制的核心和壁垒,可能会延续工业机器人厂商负责本体制造+控制器部分的产业链分工。相比工业机器人,人形机器人硬件需求更复杂、更多元。减速器、伺服电机、线性执行器、滚柱丝杠是人形机器人的运动控制产业链中价值量较大的硬件设备。不是简单的研报搬运,更多精选个股整理研究不易,觉得有用的欢迎留言和点赞支持下,谢谢!