⚡ News

谷歌Gemini智能家居AI升级:摄像头视觉自动化,更懂你家

谷歌Gemini智能家居AI升级:摄像头视觉自动化,更懂你家

谷歌正对其智能家居AI助手——Gemini for Home进行重大更新,核心亮点是AI驱动的摄像头自动化功能、显著提升的可靠性及Google Home应用的改进。Gemini for Home于2025年10月启动早期访问,并已全面接管谷歌智能家居摄像头、音箱、门铃和显示屏上的Google Assistant角色。

此次更新最引人注目的功能,是利用Gemini的视觉智能来触发智能家居例程。在2026年的I/O大会上,谷歌已为兼容摄像头和音箱的“Google Home Gemini内置计划”铺平道路。现在,Gemini for Home能识别包裹投放、玻璃破碎等特定视觉事件,并根据用户的自然语言指令,自动启动相应的智能家居自动化。用户只需简单描述期望的触发事件,并指定监测摄像头,便能将摄像头的“所见”转化为家庭活动的“所为”。

除了增强的视觉自动化,Gemini for Home的性能和可靠性也得到全面优化。AI助手现在能更有效地理解和执行多个并发请求,并支持更自然的口语表达。谷歌表示,Gemini将显著减少任务执行失败的误报,并能更准确地管理用户设置的闹钟和计时器。此外,Apple Music订阅用户可在Google Home设备上恢复使用该服务,Google Home应用也更新了“熟悉的面孔”添加和反馈提交流程。

这些新功能已向Gemini for Home已上线的19个国家和地区的现有用户开放,但企业或Family Link儿童账户除外。值得注意的是,谷歌曾于2025年10月宣布的新版Google Home Speaker,原定2026年春季发货,至今仍未开放订购,成为谷歌智能家居版图中一个待补的空白。

【AgentUpdate 深度解析】谷歌此次对Gemini for Home的更新,尤其是其基于摄像头视觉的AI自动化能力,是AI Agent生态在智能家居领域迈出的关键一步。传统智能家居多依赖预设条件或语音指令,而Gemini将视觉感知融入Agent的决策循环,使其能更主动、更智能地响应环境变化。这与亚马逊Alexa或苹果HomeKit等竞品相比,在感知维度上实现了显著拓宽。Alexa虽然也提供部分情境感知,但其视觉处理能力远未达到Gemini通过自然语言配置复杂视觉触发的水平。苹果HomeKit则更侧重隐私和设备间的协同,视觉AI应用相对保守。Gemini的突破在于其将大型视觉模型(LVM)的能力下放到边缘设备,使得“所见即所为”成为可能。长远来看,这将推动智能家居Agent从被动执行者转向主动观察者和预测者,例如通过分析日常模式预测潜在需求、识别异常行为并提前预警。这为构建真正上下文感知、能自主学习和演进的家庭AI Agent奠定了基础,预示着未来Agent将不再局限于单一任务,而是能够实现跨模态的复杂推理和决策,真正成为家庭的智能管家。

↗ 阅读原文