多模态 / 视觉 / 语音
最流行的Stable Diffusion Web界面。插件生态丰富,功能全面。
查看详情 →
多模态 / 视觉 / 语音
节点式图像生成工作流。灵活的可视化AI图像管道编辑器。
查看详情 →
多模态 / 视觉 / 语音
离线Midjourney替代。一键安装,免调参数,自动优化出好图。
查看详情 →
多模态 / 视觉 / 语音
计算机视觉经典库。2500+算法,AI视觉应用的基础设施。
查看详情 →
多模态 / 视觉 / 语音
YOLO目标检测。训练/部署/推理一体化,SOTA实时检测。
查看详情 →
多模态 / 视觉 / 语音
OpenAI开源语音识别。100+语言,准确率接近人类水平。
查看详情 →
多模态 / 视觉 / 语音
Whisper的4x加速版。CTranslate2引擎,低内存,高速度。
查看详情 →
多模态 / 视觉 / 语音
开源TTS引擎。高质量多语言语音合成,支持声音克隆。
查看详情 →
多模态 / 视觉 / 语音
Suno的AI文本→音频。生成带情感/笑声/音乐的语音。
查看详情 →
多模态 / 视觉 / 语音
实时语音AI管道框架。构建语音Bot/实时对话AI。
查看详情 →
多模态 / 视觉 / 语音
实时视频换脸。摄像头直播一键换脸,AI视觉前沿展示。
查看详情 →
多模态 / 视觉 / 语音
AI换脸工具。图片/视频换脸+唇形同步,GUI操作。
查看详情 →