谷歌在周二上午的“Android Show: I/O Edition 2026”活动上,正式发布了基于 Gemini AI 驱动的 Gboard 语音听写功能:Rambler。此举让谷歌直接与 Wispr Flow 和 Typeless 等近年来在桌面端和移动端风头正劲的 AI 听写应用展开竞争。尽管这些初创公司已积累了相当规模的受众,但大多尚未在安卓生态中站稳脚跟。
与竞品类似,Rambler 可以自动剔除“嗯”、“啊”等语气助词,并能精准理解句中纠错。例如,如果你说“我们周三下午 3 点在老地方喝咖啡……呃,改成下午 2 点”,它能识别并实时更新时间,无需手动修改。
该功能的核心在于 Gemini 多语言模型,其最大的亮点是支持“语码转换”(Code Switching)。这意味着用户可以在句子中随时切换语言(如从英语切换到印地语),Rambler 能够无缝跟随且不丢失上下文。这种能力极大地还原了多语言人群真实的交流习惯,而大多数西方听写应用在支持此类功能方面进展缓慢。
在隐私方面,谷歌强调 Gboard 会明确提示用户 Rambler 正在运行,且系统不会存储任何语音录音,音频仅用于实时转录。Android 核心体验总监 Ben Greenwood 表示,谷歌结合了设备端与云端的协同处理,并在隐私保护上投入多年,旨在向那些对第三方应用数据处理安全性存疑的用户提供更可靠的选择。
此前,包括 Wispr Flow、Superwhisper 和 Typeless 在内的一系列听写应用主要活跃在桌面端和 iOS 平台。谷歌上个月甚至在 iOS 上发布了由 Gemma 模型驱动的离线听写应用 AI Edge Eloquent。而 Rambler 则是谷歌填补安卓端空白的最强信号。该功能将于今年夏季首先在三星 Galaxy 和谷歌 Pixel 手机上推出,随后覆盖更多安卓设备。
谷歌的核心优势在于分发渠道:Gboard 是绝大多数安卓手机的默认键盘。当平台巨头从操作系统层面切入市场时,独立应用必须提供更强的准确度、更深层的功能或更极致的隐私保障,才能说服用户额外下载。对于初创公司而言,竞争的焦点已不再是能否做出好的产品,而是能否做出让用户愿意主动去搜索并下载的产品。