|
最近两天看了不少资料,有个判断越来越清晰:2026年就是AI Agent上车元年。 这事到底变在哪?以前的语音助手,本质就是"你说啥我干啥",感知完直接执行,中间没脑子。AI Agent不一样,它多了两层——认知层和决策层。说白了,它不光听你说了什么,还在想你到底想要什么。 举个例子。你说"我有点闷",传统座舱可能直接开窗。但Agent会结合车内温湿度、空气质量、你的驾驶时长、甚至你的表情和语调来判断——你是真的闷,还是心情不好?前者开窗,后者放首歌跟你聊两句。 这背后靠的是多模态融合感知。现在主流方案是三条腿走路:麦克风阵列听声音,摄像头看表情,生物传感器测心率皮电。鸿蒙座舱甚至加了颗星闪传感器,能通过多普勒效应捕捉0.1毫米的胸腔微动,后排婴儿睡没睡着都知道。 架构上也在变。阿里在智己上用了MoE混合专家架构,多个Agent各管一摊,复杂任务动态调度,不再是一个大模型啥都干但啥都不精。端侧大模型也在加速落地,科大讯飞已经铺开0.5B到7B的多尺寸矩阵,断网也能跑完"感知-推理-决策-执行"的完整闭环。 但说实话,冷思考也得有。安全边界怎么划?座舱Agent能调空调,智驾Agent能控车速,谁优先?模型幻觉在出行场景里是要命的。这些问题行业还没标准答案。 一句话:座舱的终局不是堆屏幕,是真正"懂你"。谁先把Agent闭环跑稳,谁就拿到下个十年的票。
|