Ai × 数字游民 × 1人公司

Stable Diffusion WebUI

开源 ⭐ 160k+

多模态 / 视觉 / 语音

最流行的Stable Diffusion Web界面。插件生态丰富，功能全面。

查看详情 →

ComfyUI

开源 ⭐ 80k+

多模态 / 视觉 / 语音

节点式图像生成工作流。灵活的可视化AI图像管道编辑器。

查看详情 →

Fooocus

开源 ⭐ 45k+

多模态 / 视觉 / 语音

离线Midjourney替代。一键安装，免调参数，自动优化出好图。

查看详情 →

OpenCV

开源 ⭐ 82k+

多模态 / 视觉 / 语音

计算机视觉经典库。2500+算法，AI视觉应用的基础设施。

查看详情 →

Ultralytics YOLO

Ultralytics ⭐ 40k+

多模态 / 视觉 / 语音

YOLO目标检测。训练/部署/推理一体化，SOTA实时检测。

查看详情 →

Whisper

OpenAI ⭐ 85k+

多模态 / 视觉 / 语音

OpenAI开源语音识别。100+语言，准确率接近人类水平。

查看详情 →

Faster Whisper

开源 ⭐ 20k+

多模态 / 视觉 / 语音

Whisper的4x加速版。CTranslate2引擎，低内存，高速度。

查看详情 →

Coqui TTS

开源 ⭐ 40k+

多模态 / 视觉 / 语音

开源TTS引擎。高质量多语言语音合成，支持声音克隆。

查看详情 →

Bark

Suno AI ⭐ 40k+

多模态 / 视觉 / 语音

Suno的AI文本→音频。生成带情感/笑声/音乐的语音。

查看详情 →

Pipecat

开源 ⭐ 7k+

多模态 / 视觉 / 语音

实时语音AI管道框架。构建语音Bot/实时对话AI。

查看详情 →

Deep-Live-Cam

开源 ⭐ 50k+

多模态 / 视觉 / 语音

实时视频换脸。摄像头直播一键换脸，AI视觉前沿展示。

查看详情 →

FaceFusion

开源 ⭐ 25k+

多模态 / 视觉 / 语音

AI换脸工具。图片/视频换脸+唇形同步，GUI操作。

查看详情 →

跨时区、独立工作、预算有限——开源AI工具是游民开发者的最佳盟友。

学习资源

GitHub Trending 发现查看 →

MCP官方文档文档查看 →

LangChain中文教程教程查看 →

Ollama模型库模型查看 →

HuggingFace模型库模型查看 →

Dify中文文档文档查看 →

Aider安装指南指南查看 →

ComfyUI工作流分享示例查看 →

Open WebUI文档文档查看 →

GitHub AI开源集合集合查看 →

用开源工具搭建你的AI工作栈

163个GitHub精选项目，全部开源免费。从今天开始，
用MCP扩展你的Agent，用Dify搭建你的工作流。

GitHub Trending MCP Servers

AI Skills：开源项目装机必备

为什么数字游民开发者需要这些开源工具？

学习资源

用开源工具搭建你的AI工作栈