#multimodal-ai
探索与 multimodal-ai 相关的全量生态内容池。
相关产品 (2)
Google Gemma
开源社区
Google Gemma 是 Google DeepMind 推出的一系列轻量级、最先进的开源大语言模型家族,其核心技术源自 Google 的 Gemini 模型。该系列涵盖 1B、4B、12B 和 27B 等多种参数规模,具备强大的多模态理解能力(支持文本与图像输入)和长达 128K tokens 的超长上下文处理能力。凭借高效设计,Gemma 可在单张 GPU 乃至个人笔记本电脑上流畅运行,极大降低了本地部署和开发的门槛,是轻量级应用、原型开发及资源受限环境下AI部署的理想选择。
OpenClaw
开源社区
OpenClaw 是一个领先的开源自主AI Agent平台,赋能个人用户在本地设备部署并运行专属AI助手。它通过逾20种主流消息应用(如WhatsApp、Telegram、Discord等)无缝连接大型语言模型与本地文件系统。平台具备强大的多模态交互能力,涵盖Shell命令执行、文件管理、网页自动化、语音听写及实时画布控制。OpenClaw 致力于提供快速、始终在线且高度可定制的个人助手体验,并以严格的DM安全策略确保用户隐私。凭借超336K的GitHub星标,它已成为全球最大的AI Agent开源项目之一,致力于助力实现设备智能化与任务自动化。