#deep-learning
探索与 deep-learning 相关的全量生态内容池。
相关产品 (2)
magika
开源社区
由 Google 开发的 Magika 是一款创新的 AI 驱动文件类型检测工具,它利用深度学习的最新进展提供卓越的检测精度。Magika 采用一个高度优化、仅数兆字节大小的定制模型,即使在单核 CPU 上也能在毫秒级内实现精准的文件类型识别。该工具在涵盖 200 多种内容类型(包括二进制和文本格式)的约 1 亿个样本数据集上进行训练和评估,在测试集上平均准确率高达 99%,尤其在文本内容类型上表现出色。Magika 目前已在 Google 内部大规模应用,每周处理数千亿样本,用于提升 Gmail、Drive 和安全浏览文件的安全性,并与 VirusTotal 等第三方平台集成。它以命令行工具、Python API 及多种语言绑定形式提供,为开发者和安全专家提供了高效、灵活且高度可靠的文件识别解决方案。
LLMs-from-scratch
开源社区
LLMs-from-scratch 是 Sebastian Raschka 编写的《从头构建大型语言模型》一书的官方代码库,旨在帮助读者从零开始,逐步构建一个类似 GPT 的大型语言模型。它详细演示了 LLM 的开发、预训练和微调过程,其方法与大型基础模型(如 ChatGPT 背后的模型)的创建方式相呼应。该项目使用 PyTorch 实现所有代码,不依赖外部 LLM 库,并提供了加载预训练模型权重进行微调的功能,适用于教育与深度理解 LLM 原理。