7月31日,中信出版「你好读者·公开课」聚焦人形机器人这一前沿领域,邀请美国东北大学教授、人工智能与人形机器人专家李向明带来分享。
作为改革开放后首批计算机专业毕业生,李教授堪称技术迭代的见证者,曾推动摩托罗拉经典机型 A760 问世,也曾在摩托罗拉参与了全球首款触摸屏手机的研发。转型学术界后,他深耕AI与智慧城市研究,著有12本专著,最新力作《人形机器人》以32章篇幅、约40个场景故事,将高深技术转化为通俗解读。
本次直播中,他从个人经历切入,系统拆解了人形机器人的技术逻辑、产业现状、社会影响及未来图景。
本文浓缩李向明的直播深度分享,文末附精华笔记长图,直播回放、更多学习资料可根据文末指引领取。
作为技术演进的亲历者与预见者,李向明的职业轨迹本身就是一部浓缩的技术进化史,他见证了计算机从大型机到PC,从功能机到智能手机的全过程。在他看来,人形机器人就是智能终端的下一个必然阶段。
他回忆道,1980年代在798厂计算中心工作时,大型机还要整间机房来存放,谁能想到几十年后,口袋里的手机算力会远超它?
转型人形机器人研究,源于他对技术趋势的敏锐判断。智能手机将计算从桌面解放到掌心,但它仍局限于2D交互;而人形机器人是计算进入3D空间的终极形态,就像人从爬行到直立行走,是一次质的飞跃。
他特别提到摩托罗拉A760的研发经历,他们当时就意识到,触摸交互会颠覆键盘,但没想到AI会让机器拥有“自主意识”。现在看,当年的Linux开源系统、触摸屏技术,其实都是人形机器人“大脑”与“感官”的雏形。
至于机器为何执着于“人形”设计?李向明强调,人类身体是经过百万年进化的最优解,13个关键关节、双目视觉、直立行走,这些都不是偶然,是它们让我们能使用工具、适应环境、传递情感。
人形机器人复刻这一结构,本质是让机器融入人类世界而非改造人类世界。
除此以外,人形设计还具有极大的实用性和经济性优势:它更容易推动行业形成标准化量产的模式。
从技术开发到零部件制造,采用人形结构可以实现高度模块化生产,同时降低适配成本。
把工业机器人和人形机器人混为一谈是种极大的误解。
传统工业机器人是“被编程的工具”,比如汽车生产线的机械臂,只能重复焊接、搬运等单一任务,它的世界里只有“if-then”(如果…就…),遇到程序外的情况就会瘫痪。
而人形机器人的核心是“AI大脑+类人肢体”的结合。
李向明以让机器人去买酱油为例,生动展示其复杂性:它需要识别红绿灯过马路(计算机视觉),避开突然冲出的小孩和电动车(传感器融合),记住你常买的品牌(记忆与学习),遇到流浪汉乞讨时判断是否给予帮助(伦理决策),回来时发现电梯坏了还得爬楼梯(运动控制)。这一系列动作,没有哪个工业机器人能完成。
目前,中国优必选的Walker已能完成端茶、开门等家务,美国特斯拉的Optimus则凭借xAI大模型展现出更大的自主性优势。
这些进展证明,人形机器人已从“能走”迈向“会想”。
李向明指出,人形机器人的“大脑”必须突破通用人工智能(AGI)。
当前的AI是“专科生”,比如DeepSeek擅长语言,Midjourney能画图,但它们无法像人类一样跨领域思考。
比如让机器人照顾老人,需要它同时具备提醒吃药(时间管理)、识别情绪(情感理解)、处理突发疾病(应急决策)等能力,这要求AI从单一技能升级为综合智能,至少还需3-5年来突破。
如果说AGI是软件难题,那肢体控制就是硬件噩梦。李向明以手指为例,人类手指能捏起绣花针,也能抓起篮球,而目前最先进的机器人手指连拧瓶盖都费劲。
关节材料也需突破,既要轻量化,避免能耗过高,又要高强度,支撑得起身体重量。他特别提到步态控制,真正实用的机器人需要在湿滑地板、碎石路等复杂地形稳定行走,这涉及动力学建模与实时反馈,目前误差率仍然很高。
当前人形机器人的成本堪比豪车,但李向明对成本下降充满信心。他参照手机发展,曾经的“大哥大”售价超过1万元,现在的千元机早就在功能上完全超越它。
因此,当人形机器人大规模量产,成本能降至1万美元以内,甚至更低。量产的关键在于标准化,就像智能手机统一了屏幕尺寸、接口规格,人形机器人也需要统一关节参数、传感器协议。
商业模式上,除了直接购买,租赁将成为重要方式,比如养老机构可月租1000元租用护理机器人,比请护工(月薪4000元)更划算。
社会冲击与应对:就业重构、UBI与伦理准则
未来10年,重复性劳动将逐步被人形机器人替代,首先被影响的可能有流水线工人、快递分拣员、环卫工等。
但李向明强调,历史证明技术会创造新职业,就像农业机械化催生了农机维修、种子研发等岗位,人形机器人将带来机器人训练师、伦理咨询师、故障诊断师等新职业。
为应对短期失业冲击,李向明支持通过“机器人税”筹集UBI(universal basic income,全民基本收入)资金,用于给被机器人替代工作的人发放基本生活费。
事实上,UBI的模式在欧洲、北美和非洲的某些地区已经初见成效。
没有规则的技术是极度危险的。李向明提出,人形机器人必须内置“三大定律+五大准则”:
阿西莫夫机器人三定律:不伤害人类、服从人类命令(除非违背第一定律)、保护自身(除非违背前两定律);
五大准则(李向明补充):
a. 共情能力,如识别老人哭泣时主动安慰,而非机械执行任务;
b. 决策透明,如主动调整家具位置时,需向主人解释原因并取得同意;
c. 赋能人类,如帮助残障人士通过脑机接口控制假肢;
d. 生态友好,如避免使用污染材料,行动时不破坏植被;
e. 可控进化,如软件升级需经用户同意,禁止自主“变异”。
未来三十年图景:从工业应用到人机共生
李向明将人形机器人的发展划分为三个阶段,每个阶段都有清晰的技术标志与应用场景。
这十年,机器人主要在“3D”场景发挥作用,即 Dangerous(高危)、Dirty(肮脏)、Dull(无聊重复)场景。
危险领域:矿井救援、核废料处理、地震救灾;
肮脏工作:下水道疏通、垃圾分拣;
重复劳动:电子厂贴片、快递仓库分拣。
2. 第二阶段(2035-2045年):“走进生活”的智慧城市服务
随着技术成熟,人形机器人将渗透到生活场景。
家庭:照顾老人(提醒吃药、监测心率)、辅导孩子(从小学到大学课程全覆盖)、家务全包(做饭、洗衣、整理房间);
商业:商场导购(根据顾客偏好推荐商品)、餐厅服务(记住常客口味)、酒店接待(办理入住并搬运行李);
公共服务:医院导诊(指引科室、预约挂号)、社区巡逻(识别安全隐患)、图书馆整理(自动上架、借阅登记)。
李向明特别提到零售场景,机器人能记住你妹妹下周结婚,主动推荐适合你去参加婚礼的红色连衣裙,并搭配同色系首饰,比人类导购更贴心。
到那时,机器人可能拥有仿生皮肤、情感模块,成为家庭的虚拟成员。
生理融合:通过脑机接口,人类得以意念控制机器人肢体,瘫痪者能重新行走;
意识延伸:将记忆、性格上传至机器人,实现数字永生;
社会分工:人类专注创意(艺术、科研、哲学),机器人承担生产与服务,工作不再是生存必需,而是自我实现的选择。
中国的机遇与挑战:在万亿赛道中抢占先机
李向明认为,中国在人形机器人领域有很好的发展机遇,具体体现在三方面:
1. 产业链优势:打造从零部件到整机的全链条能力。人形机器人光有“大脑”(人工智能)还不够,必须有精度足够的肢体来支持“大脑”的行动,因此,抢先搞定组成机器人肢体的各零部件的关键技术,就能在整个产业链上占据优势。
目前,特斯拉Optimus的电机、传感器、减速器等核心部件中,大约有80%来自中国供应商,只有中国才能提供这种精度高,但价格还低的零部件,这种成本与精度的平衡就是中国制造业的核心竞争力。
2. 场景红利:老龄化与新基建的双重需求。中国60岁以上人口占比已超20%,用机器人支持养老的需求客观且迫切。同时,智慧城市建设需要大量服务机器人,这也为技术迭代提供了“练兵场”。
3. 政策支持:从研发到落地的全周期扶持。在中国,技术的发展将获得更全面的政策支持,例如地方政府通过产业园提供场地、减免税收,国家层面则设立专项基金支持核心技术攻关。
对比之下,欧洲对AI监管过严,美国巨头专注AGI的研发竞争,而中国实用主义路线能更快推动技术的落地。
但李向明也提醒了可能的风险,如果AGI算法、芯片算力这类核心技术仍依赖进口,未来还需强力突破“卡脖子”环节,否则可能沦为组装工厂。
教育与个人应对:在变革中找到自身定位
人形机器人将重塑就业市场,教育必须从知识灌输转向能力培养。
李向明指出,教学应该以实践作为手段和目的。
比如,让学生从小尝试用乐高组装人形机器人,自主编程来实现机器人踢足球、跳广场舞,在亲手的实践中理解机械结构与AI逻辑,而非死记公式。
他给家长的建议是,不要逼孩子刷题考名校,而是学会去发现孩子的兴趣。喜欢生物的可以研究机器人仿生皮肤,热爱艺术的可以设计人机交互界面,对法律感兴趣的可以钻研机器人伦理条款。
最后,李向明重申了技术乐观主义的底层逻辑:技术将服务于人,而非替代人。有人担心机器人会统治人类,这是科幻片的夸张。李向明结合自身经历解释:“我父母是安徽农民,当年靠四亩田勉强温饱,而现在技术让粮食产量翻了十倍,人类反而有更多时间追求精神生活,这就是技术发展的意义。”