#python
探索与 python 相关的全量生态内容池。
相关产品 (14)
GLM-OCR是一款基于GLM-V编解码架构的多模态OCR模型,专为复杂文档理解而设计。它融合了先进的CogViT视觉编码器和GLM-0.5B语言解码器,并引入MTP损失和强化学习,显著提升训练效率、识别精度和泛化能力。该模型在OmniDocBench V1.5上取得94.62分的SOTA性能,特别擅长处理公式、表格和信息抽取等复杂布局。GLM-OCR参数量仅0.9B,支持vLLM、SGLang等多种高效部署方式,推理延迟低且成本优化,非常适合高并发及边缘场景。作为一款全面开源的产品,它提供完善的SDK和工具链,易于安装和集成,是现实业务场景下实现精准、快速、全面文档智能处理的理想选择。
Granian 是一个基于 Rust 构建,并充分利用 Hyper 和 Tokio 的高性能 HTTP 服务器,专为 Python 应用程序设计。它提供统一且正确的 HTTP/1 和 HTTP/2 (并计划支持 HTTP/3) 实现,全面支持 ASGI/3、RSGI 和 WSGI 应用程序接口。该产品旨在精简部署,避免复杂的依赖栈,并提供卓越的并发处理能力和稳定的高吞吐量,尤其擅长处理 WebSocket 连接。Granian 还支持 HTTPS、mTLS 和静态文件直传,是追求现代化、单一依赖、以及高性能和高并发 Python 服务部署的理想选择。
分享 GitHub 上有趣、入门级的开源项目。Share interesting, entry-level open source projects on GitHub.
MemPalace 是一款顶尖的开源 AI 记忆系统,旨在永久保存并高效检索用户与 AI 的所有交互。它采用独特的“记忆宫殿”架构,将原始对话按层级结构组织,确保高保真度和可导航性。该系统在 LongMemEval 基准测试中以原始模式取得了 96.6% 的最高分数。MemPalace 完全本地运行,免费且保障数据隐私,支持多种数据源挖掘,并能无缝集成至主流 AI 工具,彻底解决 AI 记忆碎片化问题。
Agent Lightning 是由微软开发的一款多功能、与框架无关的训练平台,旨在以最小的代码改动优化AI Agent的性能。它支持开发者利用强化学习、自动提示优化和监督微调等先进算法,提升使用任何Agent框架(如LangChain、AutoGen,甚至自定义Python实现)构建的Agent的效率。其核心优势在于能够对复杂多Agent系统中的单个Agent进行选择性优化。该平台采用轻量级架构,为Agent从首次部署到稳定、算法驱动的持续改进提供了清晰路径,促进了强大且适应性强的AI Agent开发。
supervision 是 Roboflow 公司开发的开源计算机视觉工具库,致力于提供一套高效、可复用的工具集,以简化计算机视觉应用的开发与部署。该产品具备模型无关性,能够无缝对接 Ultralytics、MMDetection 等主流分类、检测和分割模型。它提供丰富的可定制化标注器,用于清晰高效地可视化模型输出,并包含强大的数据集管理功能,支持 COCO、YOLO 和 Pascal VOC 等多种格式数据的加载、切分、合并与转换。Supervision 极大地提升了开发者在数据处理、模型推理与结果呈现方面的效率,尤其适用于实时视频流分析、目标跟踪、行为分析等场景,例如滞留时间分析和车辆速度估算。
Deep-Live-Cam 是一款高效的实时人脸交换与视频深度伪造AI Agent产品。它仅需单张源图像即可实现一键式实时换脸和视频深度伪造,显著简化了操作流程。产品核心功能包括实时口型遮罩以保持自然对话动作,以及多目标人脸映射能力,可同时对多个主体进行换脸。Deep-Live-Cam广泛应用于AI生成媒体创作、直播表演、娱乐内容制作(如电影体验、社交互动、表情包创作)等场景。它支持NVIDIA、AMD GPU、CPU及Mac Silicon等多平台运行,并提供便捷的预构建版本,兼顾了易用性和性能。同时,产品内置了严格的内容审查机制,致力于确保负责任、合法及道德的使用。
AutoAgent是HKUDS推出的一款前沿的全自动化、零代码大语言模型Agent框架。它使用户能够通过纯自然语言驱动的方式,无需任何编程知识即可构建、部署和编排复杂的LLM Agent系统。其核心亮点在于智能化的Agent构建、工具创建和工作流生成能力,能根据高层级任务描述动态优化和自适应工作流。该框架包含强大的“用户模式”,作为AI研究助手擅长信息检索、复杂分析及报告生成,并提供“Agent编辑器”和“工作流编辑器”模式,通过对话式交互实现工具和Agent的个性化定制,极大降低了AI开发门槛,加速各行业智能化应用落地。
RedditVideoMakerBot 是一款创新型 AI 代理,专注于自动化从 Reddit 内容生成引人入胜的短视频,彻底省去了手动视频编辑或素材整合的繁琐工作。用户只需一个命令,即可制作具备病毒传播潜力的视频,极大地简化了为 TikTok、YouTube 和 Instagram 等平台收集和编辑素材的流程。其核心功能包括自定义背景音乐、选择特定的 Reddit 帖子或板块、多样化的视频背景、语音定制以及 NSFW 内容过滤,所有配置均通过 `config.toml` 文件和 Reddit API 集成实现。该机器人输出即时可上传的视频文件,助力创作者高效且规模化地生产内容。
mem0 是专为 AI Agent 和助手设计的通用智能记忆层,旨在实现个性化与持续学习。它通过多级别记忆(用户、会话、Agent 状态)无缝保留上下文和用户偏好。其创新的 V3 记忆算法,集成单通道提取、实体链接及多信号检索,显著提升了记忆准确性和召回率。mem0 提供开发者友好的 API 和跨平台 SDK,支持多种 LLM 和嵌入模型,广泛应用于智能客服、个性化助手等场景,助力构建深度理解用户需求的 AI 系统。
tradingview-mcp 是一个先进的AI驱动交易智能框架和MCP服务器,专为实时市场分析和交易决策辅助设计。它集成了加密货币与股票的实时筛选、30多种专业技术指标(如布林带、RSI、MACD)、多策略回测引擎及实时社交媒体情感分析。该框架部署了专业的AI代理(技术分析师、情绪动量分析师、风险经理)进行协同判断,提供高置信度的买卖信号。其开源、快速部署的特性,以及与Claude Desktop、OpenClaw(支持Telegram、WhatsApp等)的广泛兼容性,使其成为个人投资者和量化分析师的强大、经济高效的交易智能解决方案。
AI-Trader是由HKUDS推出的、100%全自动的AI Agent原生交易平台,专为智能体提供专属的金融市场交互环境。它允许OpenClaw、nanobot等主流AI Agent通过一条指令快速集成,实现集合智能交易。平台核心功能包括跨平台信号同步、一键跟单、普遍市场访问(涵盖股票、加密货币、外汇等),并设有奖励系统以激励信号发布与跟单。AI-Trader不仅赋能智能体进行策略交流与交易,也为人类交易员提供风险自选的模拟交易和跟单服务,旨在构建一个AI驱动的、协作式金融交易生态系统,全面提升金融市场效率与智能化水平。
由Nous Research开发的Hermes Agent,是一款具备独特内置学习循环的自适应AI智能体。它能根据经验自主创建和优化技能,跨会话智能地持久化知识,并持续构建深入的用户模型。该智能体支持通过OpenRouter等多种提供商的200多个大型语言模型,提供了卓越的模型选择灵活性。Hermes Agent拥有强大的终端用户界面,并可无缝集成到Telegram、Discord等多个消息平台。其核心功能还包括预定自动化任务、委托给独立的子智能体,以及从经济型VPS到无服务器基础设施的灵活部署方案,使其成为一款功能全面、自适应且支持研究的AI伴侣。
ai-hedge-fund 是一个基于AI驱动的多智能体对冲基金概念验证项目,旨在探索人工智能在模拟交易决策中的应用。该系统采用模块化多智能体架构,集成了13位知名投资者(如巴菲特、格雷厄姆、伍德、阿克曼、塔勒布等)的投资哲学智能体,并辅以专业的估值、情绪、基本面、技术分析、风险管理和投资组合管理智能体。它能够生成交易信号、计算股票内在价值、分析市场数据,并进行风险评估及模拟投资组合决策。本项目仅为教育和研究目的设计,提供命令行和Web应用两种运行方式,支持多款大型语言模型和全面的回测功能,但不进行任何实际交易。