
本年春节,OpenClaw 火了。短短两个月不到,它又冷下去了——又一场 AI 利用层面的吵杂。
吵杂散了,没东谈主知谈下一个 OpenClaw 是谁,也没东谈主知谈这些东西究竟在措置什么问题。
用影像旗舰手机拍下一张夜景当中的东谈主脸,细节澄莹到能看见眼眶里的水光。但手机可能并不明晰,主角刚才是否哽咽,也就无法交融这张佳作的心境布景;再用长焦技巧把数百米外的一个路东谈主拉到面前,细节纤毫毕现。但你问手机:这个东谈主是震恐赶路,如故在找什么东西?手机仍然不知谈。
今天的 agent 能写代码、能操控网页、能把一份 PDF 整理成会议纪要。这些它齐作念得可以。但这些事情有一个共同点:处理的全是东谈主类依然事前转好法子的信息。文献、数据库、网页,齐是数字化过的天下。一朝濒临物理天下,一扇门、一段行为、一个神志,它们是失明的。
从今天的大模子,到能实在读懂物理天下的所谓「具身智能」,中间有一谈领域,现在莫得东谈主说得明晰怎样填。
这谈领域,是胡柏山在博鳌亚洲论坛上花了最多时刻讲的一件事。
胡柏山是 vivo 总裁兼首席运营官。在博鳌亚洲论坛,他告诉爱范儿,我方有一个很径直的判断:「在明确的物理大模子莫得出来之前,要有好的体验,就要把物理天下的信息转机到数字天下。」
他服气,这件事,不仅手机可以作念,何况应该用手机去作念。致使在改日十年里,其它开拓齐很难替代。

拼大脑,莫得护城河
往常两年,险些所有这个词手机厂商齐在说「AI 手机」。大模子接入、智能助手升级、端侧算力晋升,这些智力以肉眼可见的速率在普及。
客岁 DeepSeek 横空出世,本年 OpenClaw 引爆推敲,各家齐在抢着把最新的模子智力塞进我方的居品。
这场武备竞赛,有一个势必的结局:大模子的高度商品化、同质化、可替代化。
「大脑同质化很严重,大模子和大模子之间分别不大,仅仅时刻先后的分别。」胡柏山对爱范儿暗示。这句话归纳了他对通盘 AI 手机竞争形状的判断,也即:拼模子智力,莫得护城河。
你比友商快三个月上线某大模子,以及大模子驱动的 agent 功能;友商六个月后跟上,用的模子和 agent 智力齐比你更强。时刻上的率先、蹂躏的财富和元气心灵,卷出的工时和损耗的职工健康,价值又是什么?
于是,实在的互异化只可在别处找。
vivo 给出的谜底是「感知」。

感知,是 vivo 刚刚莳植的新技艺赛谈。
中外互联网公司和手机品牌纷繁加快进攻「AI 手机」。行业一度以为模子智力会成为手机厂商的护城河。
在胡柏山看来,内容并非如斯。「比拟模子而言,累积下来的场景数据才最有互异化。」紧接着他补了一句:「诚然,该作念如故要作念,要作念就找合乎咱们的,可以作念慢少量,晚少量也 ok。」
当被问及「淌若不看好大说话模子,vivo 会否发力天下模子」时,他的回答愈加保守却又径直:「天下模子也很大。咱们如故找合乎咱们的技艺旅途。咱们先把手机模子搞好,小模子搞好。」
面前 AI / 互联网科技巨头大打东谈主才争夺战,顶级研究精英如 NBA 巨星般抢手,转会费一再破损新高。但胡柏山并不认为 vivo 应该为这团火再添柴。他告诉爱范儿,先想明晰念念路,看清标的,定好技艺平台,再发力,所有这个词不迟。
在这个所有这个词东谈主齐在比拼模子智力和 AI 东谈主才储备的时刻点上,掌门东谈主径直把 vivo 的优残障与活动纲目张开在媒体面前。这种坦诚令东谈主印象真切:vivo 的矜重、严慎, 究竟有何宅心?

胡柏山在博鳌亚洲论坛峰会接收媒体采访
胡柏山恢复称,vivo 从不规避竞争。比拟模子、算力,改日最大的互异化是来自于场景数据。
场景数据,是随着使用活动缓缓累积的,不成批发,不成抄近路——影像数据尤其如斯。流程十年光学硬件累积、用果真场景历练出来的感知判断,莫得捷径。
而这些累积与判断,组成了 vivo 接下来押注的「感知」的底层。这些东西,其他东谈主(不管友商如故互联网/AI 公司)想要,也只可我方去累积。
这就回到了刚才那谈领域。大模子的历练数据是互联网信息,而这些信息依然被数字化。但践诺天下里大无数有价值的信息,还没被数字化。那些无法或很难被转机,或者转机起来资本极高的数据,成为了 AI 走向践诺天下的休止。
光芒、空间、东谈主脸、行为、心境,这些东西存在于物理天下,需要被感知、被转机,智力成为模子可以处理的输入。谁的感知作念得好,谁就为止了大模子进入践诺天下的那扇门。
现在,莫得东谈主知谈这扇门后头是什么,也莫得东谈主知谈终末会是谁站在那处。
押注「感知」
感知不仅仅「更好的相机」,这少量 vivo 很明晰。
胡柏山说,相机是纪录器具,它等你按下快门。但感知是另一件事:捏续不雅察、交融正在发生什么,把这些信息转机成开拓可以径直使用的输入。7×24 小时,不需要你触发。
从「纪录」到「感知」,中间隔着一个系统架构的重建。
胡柏山给这件事起了个名字:「感知一体」。字面意义,是感知到的信息和开拓的方案系统要即时买通。这少量,现在还作念不到。
难点在于,原始的感知场景数据,比如一段视频、一张图、麦克风收到的声息,体量重大,法子紊乱,里面大部分是噪声。把这些原始信号转机成手机实在「读得懂」的结构化信息,需要一整套挑升的处理链路。
「怎样把数据颐养成手机能够读懂的数据,是最难的。这个限度开源资源少,需要自主探索,」他说。
这亦然为什么 vivo 在里面把感知设为一级技艺赛谈。
「一级」意味着感知不再是影像部门底下的一个子标的,它会统揽包括视、听、嗅、触等多种感官种类,和感知标的。
不外,vivo 的感知研究与研发责任仍处在初期阶段。胡柏山用 vivo 的通讯研究院作念了一个类比:大要 200 东谈主的团队,从 4G 运行捏续参加,走过 5G,现在在作念 6G,依然十几年了。
关于感知赛谈,他的预期是相似的节拍:小团队作战,先构建表现。表现澄莹了,运行加油门;恭候软硬件生态进修了后,油门再往下踩。「有一种渐进式加快、螺旋飞腾的嗅觉。咱们拒却一脚油门一脚刹车。」
胡柏山不但愿 vivo 作念感知蓄意,以及作念任何事情,出现拍脑门、砸大钱的作念法。他认为,感知是一个天花板很高,但今天没东谈主能讲解晰正确的技艺演进道路是什么的东西。「咱们准备好用五年、十年的周期来捏续参加。但咱们对这件事的表现获取,要交替渐进。表现没到,砸钱齐是烂尾工程。」
感知赛谈是一个判断,但判断要落地,需要现成的累积。
vivo 的底牌是十年影像。具体看,这十年千里淀的东西有两层。
第一层是硬件。与蔡司的配合,米兰milan(中国)体育官方网站如今依然走到了聚会研发的深水阶段,传感器尺寸这一轮 X300 Ultra 的主摄升到了 1/1.12 英寸,和索尼的配合在往晋升半导体转机后果的标的走——他提到了感官技艺方面的「磨铁成针」,一种可以把感光元件的进光转机率,从 90% 推到 110% 以上致使更高的新技艺旅途。
在硬件层面,胡柏山的判断和行业不雅察者及媒体大致换取,传感器尺寸依然卷到了角落收益递减的阶段,接下来更大的空间在转机后果和外挂形态——在 X300 Ultra 上,vivo 依然作念了 200mm、400mm 定焦增距镜,还有更多在路上。

第二层是算法和表现。
vivo 三年前提倡长焦大底,两年后全行业跟上。但跟上硬件很容易,「为什么是阿谁时刻点作念这件事」,这个判断很难。vivo 为什么选拔在阿谁时刻点上作念这件事,动机来自于在影像上多年领跑的教化所酿成的表现——莫得可以搬运和复制的捷径。
「算法跟表现强推敲——表现知谈要什么标的,算法匹配,这是需乞降技艺的有机勾通,敌手很难快速跟上。」
这个逻辑蔓延到端侧 AI 上不异莳植。在 X300 Ultra 上,vivo 初次提倡了一种「多 agent」理念,也即:
你举起手机拍一张相片,有个 agent 在判断你在拍什么、用多远的焦段、在什么光芒下——这个判断,以前需要用户我方去作念。而另一个 agent 在整理你的相册,阐明你往常的修图民风推选或自动添加滤镜,又或者它能自动把几段素材剪成一条可以径直发的短视频。
这不是那种合股的「超等 agent」,比如 Gemini 或豆包手机助手那样的,而是每个场景一个专项 agent,既互通有无,又各干各的。
胡柏山的根由很内容:现存的硬件算力撑不起一个什么齐管的大 agent,手机AI的发展要勾通硬件的智力上限来鼓动。
这些责任仰仗 vivo 在端侧 AI 推理上的捏续参加。据爱范儿了解,vivo 是手机厂商当中面前在算力购买上费钱最多的——不仅是云表算力,接下来的押注标的,是在旗舰机上镶嵌专用的算力芯片。
vivo 的节拍是:先把不要务及时反应的 agent 作念好,影像和相册是刻下优先级;全域感知是五到十年的规画,always-on、全时段在线、所有这个词感官买通,这是最终的标的。
一切交给时刻
今后十年的 vivo,会去往什么标的?
胡柏山给了一个省略的道路图:手机是现在用户的中枢居品,往后至少 10 年也仍然不变;MR 需要三到四年;机器东谈主是五年以上。
这三个标的不是各自悲怆的押注,底层是归拢套感知智力在不同形态上的蔓延。
vivo 客岁莳植了机器东谈主 Lab,聚焦「大脑和眼睛」。当被问及面前阐扬如何,胡柏山很径直地摊牌:「2025年把阶段性规画梳理地愈加明晰,2026年进入通盘旅途的澄莹蓄意。」
但这关于 vivo 来说并不是问题。
在一个各家齐在发布机器东谈主样机、争相声称「具身智能元年」的节点,承认我方还没手搓出什物,是一种未几见的坦诚。胡柏山说「手搓一个机器东谈主不是咱们要干的。」
vivo 的机器东谈主逻辑,和感知赛谈的参加逻辑是一套:先想明晰规画用户是谁,再界说场景,再识别中枢技艺为止点,再等技艺进修度到位。
胡柏山告诉爱范儿,面前 vivo 还在论证第一步。他们倾向于劳动年青东谈主,这也恰是 vivo 从旗舰到年青系列居品线一直但愿霸占心智的群体。vivo 的第一代家庭机器东谈主,可能的泉源,是顾问宠物和叠穿着也说不定。
但这个场景,会不会太小?胡柏山认为,不成一上来就作念通用机器东谈主,不可能刚一运行就把所有这个词的场景齐作念好。淌若你非要那么作念,最终的终端也只然而每个场景齐不足格。
诚然,今天的具身智能机器东谈主,可能作念预录制的跳舞能作念到一百分,其他场景齐莫得宽裕的劝服力。特殊是在家务场景,「就说打鸡蛋这件事,想要作念到百分百告捷率,东谈主齐不一定,机器东谈主十年内也作念不到。」
胡柏山但愿,vivo 的机器东谈主能够先把一件具体的事情作念到 60-70 分,然后一代一代泛化,优化现存的场景,再赢得新的智力。
喂好了宠物,数据就来了。数据够了,机器东谈主就知谈这只狗每天几点饿,进而知谈这家东谈主几点起床,进而知谈这家东谈主的活命节律。不需要一步到位,因为每一步齐在为下一步备料。胡柏山管这叫「一齐下蛋」。
这个逻辑,和在手机端押注感知的逻辑,是合股的:先把影像 agent 作念好,场景数据够了,感知智力才往外蔓延。
但在机器东谈主的傍边,手机饰演什么变装?「手机是最懂你的随身数字助理。你的活动民风、偏好、你可爱养什么宠物,齐在手机里。」胡柏山说,机器东谈主早期作念不好的事,手机可以遥控介入补足。
就像自动驾驶的早期,东谈主类一直在侵略,侵略产生数据,数据让系统越来越好。「手机和机器东谈主之间,数据是买通的。」
诚然,他也莫得把话说满。感知这个赛谈,其他东谈主也在作念。包括苹果、谷歌等在内齐有我方的感知蓄意框架。vivo 在这个方朝上的竞争空间,更多在手机端的小模子感知这个细分标的。这是除了苹果除外的大厂,暂时莫得要点难得的地点。
本年,胡柏山给机器东谈主 Lab 设的任务,是把旅途丹青出来:规画用户、中枢场景、重要技艺节点、以及「技艺进修到可以营业化」的时刻预期。
vivo 叫停了 AI 眼镜模样。他算了一笔账:一年几十万台,不符共规画体量;两年内又作念不出互异化;技艺平台面前也撑不起 80 分以上的体验(逾越 30g 戴在鼻子上会很累)——三个条目一个齐没过,砍掉没舛讹。
「三年后作念也不震恐,它不是重要品类。」
不外,这个决定放在今天的布景下,如故有点逆势。2025 年 AI 眼镜是行业里最热的新品类之一,这个事实有目共睹。Ray-Ban Meta 卖爆,国内跟进者一茬接一茬。
首创东谈主兼 CEO 沈炜在年会上暗示,vivo 本年的政策是「少押注,押重注」。vivo 选拔给 AI 眼镜按下暂停键,但将感知赛谈的存在地位升级,其实是合股的逻辑和筛选程序的一体两面:一个赛谈的天花板够不够高、vivo 自己的互异化属性够不够、技艺平台能不成扶持长期参加。
这种念念路,与近期 OpenAI 等在内的硅谷巨头,摒弃「支线任务」,聚焦实在长板的念念路殊途同归。
2026 年采取的谈路,vivo 会走到哪,现在胡柏山也还给不出谜底。感知一体化的技艺繁难还莫得解,端侧专用芯片的落地有难度,机器东谈主的旅途图本年才刚运行画。
胡柏山知谈这些,也莫得规避。他说,表现到了加油门,表现没到宁可慢。
手机行业正在履历一个奇怪的时刻:换机周期拉长到四十个月,中国市集年销量从岑岭期的五亿多部跌到现在约 2.5 亿部,存量市集的天花板澄莹可见;但 AI 带来的智力跃升,又让所有这个词东谈主以为什么地点似乎还藏着少量增量。
胡柏山的判断是,从 Smartphone(智妙手机)到 Agent Phone(智能体手机),才是把存量市集变成增量市集的契机。而感知,是这个契机里他认为最难被复制的护城河。
接下来交给时刻米兰milan(中国)体育官方网站。
开云体育官方网站 - KAIYUN