开源项目 · AI 开发者工具

AI Skills:开源项目装机必备

163 个GitHub最热门AI开源项目。从Agent框架到MCP工具,从RAG引擎到应用生成器——拿来即用,开源免费。

163 开源项目
9 分类
0 标签
St
开源 ⭐ 160k+
多模态 / 视觉 / 语音
最流行的Stable Diffusion Web界面。插件生态丰富,功能全面。
查看详情 →
Co
开源 ⭐ 80k+
多模态 / 视觉 / 语音
节点式图像生成工作流。灵活的可视化AI图像管道编辑器。
查看详情 →
Fo
开源 ⭐ 45k+
多模态 / 视觉 / 语音
离线Midjourney替代。一键安装,免调参数,自动优化出好图。
查看详情 →
Op
开源 ⭐ 82k+
多模态 / 视觉 / 语音
计算机视觉经典库。2500+算法,AI视觉应用的基础设施。
查看详情 →
Ul
Ultralytics ⭐ 40k+
多模态 / 视觉 / 语音
YOLO目标检测。训练/部署/推理一体化,SOTA实时检测。
查看详情 →
Wh
OpenAI ⭐ 85k+
多模态 / 视觉 / 语音
OpenAI开源语音识别。100+语言,准确率接近人类水平。
查看详情 →
Fa
开源 ⭐ 20k+
多模态 / 视觉 / 语音
Whisper的4x加速版。CTranslate2引擎,低内存,高速度。
查看详情 →
Co
开源 ⭐ 40k+
多模态 / 视觉 / 语音
开源TTS引擎。高质量多语言语音合成,支持声音克隆。
查看详情 →
Ba
Suno AI ⭐ 40k+
多模态 / 视觉 / 语音
Suno的AI文本→音频。生成带情感/笑声/音乐的语音。
查看详情 →
Pi
开源 ⭐ 7k+
多模态 / 视觉 / 语音
实时语音AI管道框架。构建语音Bot/实时对话AI。
查看详情 →
De
开源 ⭐ 50k+
多模态 / 视觉 / 语音
实时视频换脸。摄像头直播一键换脸,AI视觉前沿展示。
查看详情 →
Fa
开源 ⭐ 25k+
多模态 / 视觉 / 语音
AI换脸工具。图片/视频换脸+唇形同步,GUI操作。
查看详情 →

为什么数字游民开发者需要这些开源工具?

跨时区、独立工作、预算有限——开源AI工具是游民开发者的最佳盟友。

学习资源

GitHub Trending 发现 查看 →
MCP官方文档 文档 查看 →
LangChain中文教程 教程 查看 →
Ollama模型库 模型 查看 →
HuggingFace模型库 模型 查看 →
Dify中文文档 文档 查看 →
Aider安装指南 指南 查看 →
ComfyUI工作流分享 示例 查看 →
Open WebUI文档 文档 查看 →
GitHub AI开源集合 集合 查看 →

用开源工具搭建你的AI工作栈

163个GitHub精选项目,全部开源免费。从今天开始,
用MCP扩展你的Agent,用Dify搭建你的工作流。

GitHub Trending MCP Servers