担心AI篡改数据？教你用ChatGPT写本地工具精准处理PDF

最近，我的妻子加入了一家教堂唱诗班。她需要练习大量新歌，但这些歌谱都是印在黄色纸张上的小册子。为了方便阅读，她想把这些歌谱扫描成 PDF，去除背景黄色，然后放大打印在 8.5x11 英寸的白纸上。如果直接复印，不仅极度消耗彩色墨盒，而且黑白打印出来的灰色背景会更加模糊，甚至连乐谱播放软件 PlayScore 2 都无法正常识别。

起初，我建议使用 Photoshop 处理，但由于每张扫描件的曝光不同，需要对每张图微调滑块，过程极其繁琐。于是，我们转向了拥有 ChatGPT Plus 账号的 AI 协助。虽然直接向 ChatGPT 输入指令“帮我把这个 PDF 的黄色背景换成白色”能够生成结果，但我们很快发现了问题：生成的 PDF 分辨率极低，更糟糕的是，AI 的非确定性（Non-deterministic）特征可能会在无意中修改音符或歌词，导致练习出错。

传统编程是确定性的（Deterministic），输入相同，输出必然相同。而大语言模型（LLM）则是基于概率的，同样的输入可能会得到不同的输出。为了兼顾 AI 的高效和传统代码的精准，我决定改变策略：不让 ChatGPT 直接处理文件，而是让它为我编写一个本地运行的 Python 命令行工具。

在 ChatGPT 的协助下，我们编写了一个使用 pdf2image 和 Pillow 库的 Python 脚本。该脚本将 PDF 转换为图像，通过设定精确的 RGB 阈值过滤掉黄色背景，将其替换为纯白，然后再将图像重新打包为高清 PDF。整个处理过程完全在本地运行，数据不经过任何第三方云端，且算法逻辑 100% 确定，绝无篡改乐谱的风险。最终，我们得到了完美、清晰且高分辨率的打印乐谱。

AgentUpdate 深度解析

本文展示了 AI 时代一个极其关键的范式转变：从“让 AI 直接处理数据（LLM-as-a-Processor）”转向“让 AI 生成确定性工具（LLM-as-a-Toolmaker）”。在 AI Agent 生态中，大模型的非确定性和幻觉（Hallucination）一直是企业级应用落地的最大硬伤。通过动态生成并运行本地代码（如 Python Interpreter），Agent 可以将模糊的自然语言意图转化为精确的、确定性的算法步骤。这种“代码生成+本地执行”的沙箱模式，不仅完美规避了数据隐私安全问题，更确保了关键任务的数据一致性。未来，顶尖的 AI Agent 将不再仅仅是内容生成器，而是能够根据用户即时需求，现场编写、测试并交付微型软件工具（Micro-software）的超级工程师。

担心AI篡改数据？教你用ChatGPT写本地工具精准处理PDF

推荐阅读

解决MCP Token暴涨：探索AI Agent的“元工具”设计模式

特朗普政府或入股OpenAI！美拟建公共财富基金共享AI红利

避坑指南：Claude Code在Windows下的编码Bug与Hook实践

相关工具与资源推荐

相关技能市场

Anthropic Agent Skills

43 Agent Skills