AI 秀

ai开源项目

OpenClawOpenClaw（曾用名 Clawdbot、Moltbot）是开源、本地优先的AI Agent（智能体）执行引擎，于2025年底首次发布，2026年初因病毒式传播成为GitHub上增长最快的项目之一。
DeepFaceSwapDeepFaceSwap 是一种基于深度学习的换脸技术，主要用于在图像和视频中实现人脸替换。
GitDiagramGitDiagram是一款开源工具，能够将GitHub仓库快速转化为交互式架构图，帮助开发者快速理解项目结构。
MagicQuillMagicQuill是一个开源的智能交互式图像编辑系统，由香港科技大学、蚂蚁集团、浙江大学、香港大学等机构的研究人员共同开发。它结合了用户友好的界面和强大的 AI 功能，使用户可以通过简单的笔触和提示词轻松完成复杂的图像编辑任务。
BizGenBizGen是一款由清华大学智能信息处理实验室与微软研究院联合开发的AI信息图生成工具，专注于将长篇文章内容一键转化为专业级的信息图和幻灯片。它解决了传统工具在处理长文本时常见的文字模糊、排版混乱等问题，为用户提供高效便捷的视
SuperSonicSuperSonic是一个由腾讯音乐开源的新一代 AI+BI 平台，融合了 Chat BI（基于大语言模型的自然语言查询）和Headless BI（基于语义层的数据模型管理）。
PandaGPTPandaGPT是一款基于OpenAI先进模型的多模态AI工具，旨在提高文件读取效率和知识获取的便利性。它结合了先进的自然语言处理技术和多模态理解能力，为用户提供了一种智能、便捷的文件阅读和知识管理解决方案。
MuseVMuseV是由腾讯音乐娱乐集团的天琴实验室（TMElyra Lab）开源的虚拟人视频生成框架，基于扩散模型技术开发。
VoiceCanvasVoiceCanvas是一款开源的多语言语音合成平台，利用先进的人工智能技术提供高质量的文字转语音服务。它支持超过50种语言，并集成了OpenAI TTS、AWS Polly和MiniMax等多种领先的语音合成服务。
UVR5UVR5（Ultimate Vocal Remover 5）是一款功能强大的AI人声伴奏音频分离软件，能够利用深度学习模型从音频文件中分离出人声和伴奏。它在音乐制作、音频编辑、学习等多种场景中都非常有用。
Zero123Zero123是一种从单个图像到一致多视图的扩散基础模型，旨在使用单视图输入生成 3D一致的多视图图像。
StereoCrafterStereoCrafter是由腾讯AI实验室与ARC实验室联合开发的一个开源框架，能够将普通的2D视频转换为沉浸式的立体3D视频。该框架基于深度学习技术，特别是利用扩散模型进行深度估计和立体视频修复，从而实现高质量的3D视频转换。
TangoFluxTangoFlux是一款由新加坡科技设计大学（SUTD）和英伟达（NVIDIA）联合开发的高效文本到音频生成模型。它能够快速将文本提示词转换为高质量的音频内容，支持多种音效和背景音乐的生成。
CrewAICrewAI是一个开源的多智能体协作框架，专为编排具有角色扮演能力的自主AI智能体而设计。它模拟了现实世界中的团队分工，通过协调多个具备特定角色的智能体（Agent）共同完成复杂任务。
Qwen3-CoderQwen3-Coder是阿里巴巴开发的代码模型，能够完成长期任务的强大编码代理，是其迄今为止最具代理能力的代码模型。
AineeAinee是一款开源的AI笔记和学习助手工具，旨在帮助用户提升学习效率和知识管理能力。
UpscaylUpscayl是一款免费开源的AI图像超分辨率工具，专注于通过深度学习模型提升低分辨率图像的清晰度。它利用先进的 AI 技术，能够将模糊的图片放大至高分辨率，同时保持图像的清晰度和细节。
Jan.aiJan.ai是一款免费开源的本地AI聊天助手工具，旨在为用户提供完全离线的 AI 交互体验。
JoyGenJoyGen是由京东科技与香港大学联合开发的音频驱动的3D说话人脸视频生成框架。
RestorePhotosRestorePhotos是一款基于人工智能的在线照片修复工具，专注于修复老旧、模糊或损坏的人脸照片。它采用先进的深度学习模型（如 GFPGAN），可以自动识别并修复照片中的模糊、划痕、褪色等问题，甚至支持黑白照片的上色处理。
ProPainterProPainter是一款AI视频修复工具。它结合了先进的图像修复和特征修复技术，以及高效的Transformer机制，能够高质量地修复和编辑视频内容。
Refly AIRefly AI是一款开源的AI原生创作引擎，旨在通过先进的AI技术帮助用户将创意转化为高质量的生产就绪内容。该平台基于“自由画布”概念设计，集成了多线程对话、知识库整合、上下文记忆、智能搜索以及所见即所得的 AI 文档编辑器等功能，为用
DragGANDragGAN是一种基于生成对抗网络（GAN）的AI图像编辑工具，由马克斯·普朗克研究所（Max Planck Institute）开发。它允许用户通过简单的点击和拖动操作来改变图像中物体的姿势、形状、表情和布局，生成自然且逼真的图像。
Auto-PPTAuto-PPT是一个开源项目，旨在帮助用户自动化生成PowerPoint演示文稿，能够将 Markdown 格式的文本快速转换为专业的 PowerPoint 演示文稿。它利用 python-pptx 库来操作 PowerPoint 文件，并支持自定义模板，以满足不同用户的品牌风格或设计要求。
LogoCreator.ioLogoCreator.io 是一款开源的 AI 驱动的在线 Logo 生成工具，旨在帮助用户快速创建专业且个性化的 Logo。
PengChengStarlingPengChengStarling是一款多语言自动语音识别（ASR）工具，基于 icefall 项目构建。它支持多种语言，包括中文、英语、俄语、越南语、日语、泰语、印度尼西亚语和阿拉伯语。
LiveSketchLiveSketch是一款开源AI生成视频工具，能够通过简单的文本提示将静态手绘草图转化为生动的动画。它为设计师、创意专业人士和普通用户提供了快速、直观的动画创作方式，无需复杂的动画制作经验。
ChatTTS-ForgeChatTTS-Forge是一个围绕 TTS（文本转语音）生成模型开发的开源项目，旨在为开发者和研究者提供一个功能强大的TTS工具箱。它不仅提供了全面的 API 服务，还配备了一个基于Gradio的直观 WebUI，使用户能够方便地进行 TTS 任务。
Ciallo TTSCiallo TTS是一款免费的在线文本转语音（TTS）工具，支持超过300种语言和口音的声音选择，用户可以根据需要调节语速和语调，生成自然流畅的语音效果。它提供即时试听功能，用户可以在下载音频文件之前预听语音质量，确保满足需求。
CodeFormerCodeFormer是一款先进AI图像修复工具，旨在通过深度学习技术修复低质量、模糊或损坏的人脸图像。它结合了变分自编码器（VQGAN）和注意力机制（Transformer），能够高效地修复人脸图像中的缺陷，并增强其细节，使得最终生成的图像更加清晰和自然
Story FlicksStory Flicks是一款基于AI大模型的视频生成工具，能够一键生成包含高清图像、文本、音频和字幕的短视频。用户只需输入故事主题，系统便会自动生成完整的视频内容。
InvokeAIInvokeAI是一个基于Stable Diffusion模型的开源AI绘画工具，旨在通过强大的深度学习技术，将文本描述转化为高质量的视觉图像。
PaintsUndoPaintsUndo是一款AI驱动的绘画过程生成工具，能够将任意图像“拆解”成一个绘画过程视频，展示从线稿到填色以及局部细节调整的全过程。
Krillin AIKrillin AI是一款基于大型语言模型（LLMs）的视频翻译、配音和语音克隆工具，专为视频创作者和内容出海者设计。它支持一键部署全流程，可将视频从下载到成品输出一键完成，适配抖音、小红书、哔哩哔哩、视频号、快手、YouTube、TikTok等主流平
Scribble DiffusionScribble Diffusion是一款开源AI图像生成工具，能够将简单的草图或涂鸦转化为高质量的艺术作品。
AI-RenderAI-Render是一款Blender 插件，旨在将 Stable Diffusion 的强大AI图像生成能力无缝集成到 Blender 的 3D 建模和渲染工作流程中。它允许用户通过简单的文本提示和场景设置，快速生成高质量的 AI 图像，而无需在本地运行复杂代码。
SkyReels-V2SkyReels-V2 是由昆仑万维 SkyReels 团队开发的全球首个使用扩散强迫（Diffusion-forcing）框架的无限时长电影生成模型。它结合了多模态大语言模型（MLLM）、多阶段预训练、强化学习等前沿技术，能够生成高质量、无限时长的视频内容。
StarVectorStarVector是一个由 ServiceNow Research、Mila – Quebec AI Institute 和 ETS Montreal联合开发的开源多模态视觉语言模型，专门用于将图像和文本转换为高质量的可缩放矢量图形（SVG）代码。
MagicEditMagicEdit是一款由字节跳动开发的AI驱动的图像和视频编辑工具，旨在通过先进的AI技术简化图像和视频的编辑过程，提供高质量的编辑体验。
VISION XLVISION XL是一款高效的视频修复和超分辨率工具，基于潜在扩散模型技术，专注于解决高清视频的逆问题。该工具能够修复视频中的缺失部分、去除模糊，并显著提升视频的清晰度，最高可达四倍超分辨率。
DeepFaceLiveDeepFaceLive是一款开源的实时AI换脸工具，主要用于视频通话和直播场景，能够将用户的脸替换为其他人的脸或虚拟角色，提供高保真的视觉体验。
腾讯混元3D腾讯混元3D是由腾讯推出的一站式3D内容创作平台，混元3D通过创新的AI技术架构，可以在短短10秒内完成3D模型的生成。腾讯混元3D基于自研的Hunyuan3D生成大模型，结合了Diffusion技术与多模态理解能力，能够高效捕捉几何形状和纹理细节，快速生成
Stable VideoStable Video是一个基于AI的视频生成平台，基于 Stability AI 发布的开源的AI视频大模型：Stable Video Diffusion，旨在帮助用户将文本或图像转化为引人入胜的视频内容，它能够以每秒3到30帧的可定制帧率生成14帧和25帧的视频。
FollowFollow是一款由RSSHub平台出品的开源RSS信息浏览工具，也被称为下一代信息浏览器。它集成了人工智能、区块链和社交等功能，致力于为用户提供一个现代、快速、便捷的一体化信息中心。无论是文章还是播客、音乐、视频等多媒体内容，Follow 都能
LobeChatLobeChat 是一个开源、高性能的AI聊天框架，旨在整合市面上众多主流的AI大模型（如ChatGPT、Gemini Pro、Claude3、Mistral、LLaMA2等），为用户提供统一的平台管理与使用体验。它支持多种功能，包括语
MorphicMorphic 是一款开源的 AI 驱动搜索引擎，配备生成式用户界面（UI），旨在提供更智能、更直观的搜索体验。它利用先进的自然语言处理技术，结合 OpenAI、Gemini 和 Llama3 等多种 AI 模型，能够快速理解和生成对用户问题的回答。
MemFreeMemFree 是一款开源的混合 AI 搜索引擎和 AI 页面生成器。它结合了强大的 AI 模型（如 Claude 3.5 Sonnet）和流行的前端框架（React + Tailwind + Shadcn UI），旨在提供高效的知识管理、节省时间的 AI 摘要以及快速创建 UI 页面等功能。