AI
秀
更多 +
广告合作
免责声明
我要投稿
首页
AI视频
AI创作
AI机器人
AI绘画
AI翻译
AI资讯
更多
ai开源项目
Jan.ai
Jan.ai是一款免费开源的本地AI聊天助手工具,旨在为用户提供完全离线的 AI 交互体验。
JoyGen
JoyGen是由京东科技与香港大学联合开发的音频驱动的3D说话人脸视频生成框架。
RestorePhotos
RestorePhotos是一款基于人工智能的在线照片修复工具,专注于修复老旧、模糊或损坏的人脸照片。它采用先进的深度学习模型(如 GFPGAN),可以自动识别并修复照片中的模糊、划痕、褪色等问题,甚至支持黑白照片的上色处理。
ProPainter
ProPainter是一款AI视频修复工具。它结合了先进的图像修复和特征修复技术,以及高效的Transformer机制,能够高质量地修复和编辑视频内容。
Refly AI
Refly AI是一款开源的AI原生创作引擎,旨在通过先进的AI技术帮助用户将创意转化为高质量的生产就绪内容。该平台基于“自由画布”概念设计,集成了多线程对话、知识库整合、上下文记忆、智能搜索以及所见即所得的 AI 文档编辑器等功能,为用
DragGAN
DragGAN是一种基于生成对抗网络(GAN)的AI图像编辑工具,由马克斯·普朗克研究所(Max Planck Institute)开发。它允许用户通过简单的点击和拖动操作来改变图像中物体的姿势、形状、表情和布局,生成自然且逼真的图像。
Auto-PPT
Auto-PPT是一个开源项目,旨在帮助用户自动化生成PowerPoint演示文稿,能够将 Markdown 格式的文本快速转换为专业的 PowerPoint 演示文稿。它利用 python-pptx 库来操作 PowerPoint 文件,并支持自定义模板,以满足不同用户的品牌风格或设计要求。
LogoCreator.io
LogoCreator.io 是一款开源的 AI 驱动的在线 Logo 生成工具,旨在帮助用户快速创建专业且个性化的 Logo。
PengChengStarling
PengChengStarling是一款多语言自动语音识别(ASR)工具,基于 icefall 项目构建。它支持多种语言,包括中文、英语、俄语、越南语、日语、泰语、印度尼西亚语和阿拉伯语。
LiveSketch
LiveSketch是一款开源AI生成视频工具,能够通过简单的文本提示将静态手绘草图转化为生动的动画。它为设计师、创意专业人士和普通用户提供了快速、直观的动画创作方式,无需复杂的动画制作经验。
ChatTTS-Forge
ChatTTS-Forge是一个围绕 TTS(文本转语音)生成模型开发的开源项目,旨在为开发者和研究者提供一个功能强大的TTS工具箱。它不仅提供了全面的 API 服务,还配备了一个基于Gradio的直观 WebUI,使用户能够方便地进行 TTS 任务。
Ciallo TTS
Ciallo TTS是一款免费的在线文本转语音(TTS)工具,支持超过300种语言和口音的声音选择,用户可以根据需要调节语速和语调,生成自然流畅的语音效果。它提供即时试听功能,用户可以在下载音频文件之前预听语音质量,确保满足需求。
CodeFormer
CodeFormer是一款先进AI图像修复工具,旨在通过深度学习技术修复低质量、模糊或损坏的人脸图像。它结合了变分自编码器(VQGAN)和注意力机制(Transformer),能够高效地修复人脸图像中的缺陷,并增强其细节,使得最终生成的图像更加清晰和自然
Story Flicks
Story Flicks是一款基于AI大模型的视频生成工具,能够一键生成包含高清图像、文本、音频和字幕的短视频。用户只需输入故事主题,系统便会自动生成完整的视频内容。
InvokeAI
InvokeAI是一个基于Stable Diffusion模型的开源AI绘画工具,旨在通过强大的深度学习技术,将文本描述转化为高质量的视觉图像。
PaintsUndo
PaintsUndo是一款AI驱动的绘画过程生成工具,能够将任意图像“拆解”成一个绘画过程视频,展示从线稿到填色以及局部细节调整的全过程。
Krillin AI
Krillin AI是一款基于大型语言模型(LLMs)的视频翻译、配音和语音克隆工具,专为视频创作者和内容出海者设计。它支持一键部署全流程,可将视频从下载到成品输出一键完成,适配抖音、小红书、哔哩哔哩、视频号、快手、YouTube、TikTok等主流平
Scribble Diffusion
Scribble Diffusion是一款开源AI图像生成工具,能够将简单的草图或涂鸦转化为高质量的艺术作品。
AI-Render
AI-Render是一款Blender 插件,旨在将 Stable Diffusion 的强大AI图像生成能力无缝集成到 Blender 的 3D 建模和渲染工作流程中。它允许用户通过简单的文本提示和场景设置,快速生成高质量的 AI 图像,而无需在本地运行复杂代码。
SkyReels-V2
SkyReels-V2 是由昆仑万维 SkyReels 团队开发的全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型。它结合了多模态大语言模型(MLLM)、多阶段预训练、强化学习等前沿技术,能够生成高质量、无限时长的视频内容。
StarVector
StarVector是一个由 ServiceNow Research、Mila – Quebec AI Institute 和 ETS Montreal联合开发的开源多模态视觉语言模型,专门用于将图像和文本转换为高质量的可缩放矢量图形(SVG)代码。
MagicEdit
MagicEdit是一款由字节跳动开发的AI驱动的图像和视频编辑工具,旨在通过先进的AI技术简化图像和视频的编辑过程,提供高质量的编辑体验。
VISION XL
VISION XL是一款高效的视频修复和超分辨率工具,基于潜在扩散模型技术,专注于解决高清视频的逆问题。该工具能够修复视频中的缺失部分、去除模糊,并显著提升视频的清晰度,最高可达四倍超分辨率。
DeepFaceLive
DeepFaceLive是一款开源的实时AI换脸工具,主要用于视频通话和直播场景,能够将用户的脸替换为其他人的脸或虚拟角色,提供高保真的视觉体验。
腾讯混元3D
腾讯混元3D是由腾讯推出的一站式3D内容创作平台,混元3D通过创新的AI技术架构,可以在短短10秒内完成3D模型的生成。腾讯混元3D基于自研的Hunyuan3D生成大模型,结合了Diffusion技术与多模态理解能力,能够高效捕捉几何形状和纹理细节,快速生成
Stable Video
Stable Video是一个基于AI的视频生成平台,基于 Stability AI 发布的开源的AI视频大模型:Stable Video Diffusion,旨在帮助用户将文本或图像转化为引人入胜的视频内容,它能够以每秒3到30帧的可定制帧率生成14帧和25帧的视频。
Follow
Follow是一款由RSSHub平台出品的开源RSS信息浏览工具,也被称为下一代信息浏览器。它集成了人工智能、区块链和社交等功能,致力于为用户提供一个现代、快速、便捷的一体化信息中心。无论是文章还是播客、音乐、视频等多媒体内容,Follow 都能
LobeChat
LobeChat 是一个开源、高性能的AI聊天框架,旨在整合市面上众多主流的AI大模型(如ChatGPT、Gemini Pro、Claude3、Mistral、LLaMA2等),为用户提供统一的平台管理与使用体验。它支持多种功能,包括语
Morphic
Morphic 是一款开源的 AI 驱动搜索引擎,配备生成式用户界面(UI),旨在提供更智能、更直观的搜索体验。它利用先进的自然语言处理技术,结合 OpenAI、Gemini 和 Llama3 等多种 AI 模型,能够快速理解和生成对用户问题的回答。
MemFree
MemFree 是一款开源的混合 AI 搜索引擎和 AI 页面生成器。它结合了强大的 AI 模型(如 Claude 3.5 Sonnet)和流行的前端框架(React + Tailwind + Shadcn UI),旨在提供高效的知识管理、节省时间的 AI 摘要以及快速创建 UI 页面等功能。