darwin-skill
by alchaincyf
介绍
达尔文.skill 受 Andrej Karpathy 的 autoresearch 启发,是一个用于优化 AI Agent Skills 的工具。它通过自主实验循环,评估 Skill 的结构质量和实际效果,并只保留带来可测量改进的修改。系统采用双重评估(静态分析与实测验证)和“棘轮机制”,确保 Skill 分数只升不降。它能在每个优化阶段暂停,等待用户确认,从而实现“人在回路”的协作优化,提升 Skill 的持续进化能力。
功能特征
- 受 Andrej Karpathy autoresearch 启发,实现 Skill 的迭代优化
- 双重评估机制:结合结构评分(60分)与实际效果验证(40分)
- 棘轮机制:只保留改进,自动回滚退步,确保分数只升不降
- 8 维度评估体系:全面量化 Skill 质量
- 人在回路 (Human-in-the-Loop):每个优化阶段需用户确认
支持平台
webdesktop