人工智能AI相关工具软件 合集整理 一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图 一键整合包一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 一键整合包MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 支持免费商业使用LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext 0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 支持文生视频+图生视频 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 支持magcache加速nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 支持无限生图+图片编辑AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer 一键汉化整合包轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo 六秒出图 支持更换模型字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 一键整合包开源神器来袭!HelloMeme 让你秒变表情包制造机 一键整合包图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI 视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlusAI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频 一键整合包 NarratoAIlmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek打造你的专属AI助手:AingDesk,零门槛部署的未来工具你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 一键整合包复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频E2/F5 TTS AI人工智能 文字转语音工具,可克隆声音,可训练开源 Apt Full 绿色版 一个功能强大、操作便捷的AI生产力工具GPT-SoVITS 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包开源 Waifu2x Extension-GUI(AI图片视频放大) 一款功能强大的图像/视频增强工具CogView4 一键整合包 一个功能强大且易于使用的文本到图像生成模型 支持中文提示词Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseekOvis2图片反推提示词工具 基于AI大模型反推图片批量生成提示词 英伟达6G显卡即可愉快玩耍开源 神器 Stability Matrix 一款功能强大、易于使用的Stable Diffusion管理工具VisoMaster 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持英伟达8G及以上显卡运行 一键整合包InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包MatAnyone 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示开源 免费 Koboldcpp 人人可玩的本地大模型 不管啥显卡,cpu也能跑 附视频演示 支持deepseekAI人工智能 图片高清修复放大Tile-Upscaler 一键汉化整合包万象生图 一款利用先进人工智能技术打造的图像生成与增强软件Jan 一个功能强大的开源ChatGPT替代品ollama 一款功能强大、易于使用的大型语言模型部署工具 附deepseek-r1 安装教程Snapclear 汉化版 AI 图片放大和抠图工具开源 FasterWhisperGUI(音频处理工具) 人声分离 人声识别 字幕处理 附模型下载27video 开源图片批量抠图+视频抠像工具 一键整合包 附视频演示RMBG-2-Studio AI人工智能 抠图神器 一键整合包moondream 开源 AI人工智能 图片反推提示词神器,可批量处理图片提示词 一键整合包InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包开源 DCT-Net_Webui 修改增强版 一款将图片/视频转绘漫画效果工具 支持批量处理 附三倍快乐演示EzAudio: High-quality Text-to-Audio Generator AI文本生成音乐 音效 一键整合包diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包HivisionIDPhotos 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示开源 Fish Speech 文字转语音 可以克隆声音 一键整合包 附效果演示Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 一键整合包开源 CogVideoX 文字生成视频 整合包开源 免费 pyVideoTrans 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装AI 图像增强软件 Aiarty Image Enhancer 一款基于人工智能(AI)技术的图像增强工具神器 开源 CodeFormer 图片+视频+人脸高清修复 解压即用开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示开源 Deep-Live-Cam AI人工智能 图片视频换脸+直播换脸 整合包 支持AMD+英伟达N卡Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示PuLID AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元开源 AI重现人类绘图过程,并生成视频 Paints-UNDO 一键整合包 附视频演示开源 CosyVoice 整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示Diffutoon AI视频转动漫 整合包 附视频演示开源 Tailor v0.1.1 一款功能强大的视频智能裁剪、生成及优化工具开源 MimicBrush 一款创新性AI图像编辑工具 图片局部自动重绘 一键整合包 附模型PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程开源 DiffSynth-Studio 视频风格转绘,视频转动漫 一键整合包 附模型 附官方视频演示开源 免费 ChatTTS 一个用于日常对话的生成式语音模型 自带情感 文字转语音工具免费 AI 人声 替换AI 唱歌 伴奏分离软件 Replay 附视频演示和教程免费 开源 实用、美观的图片放大工具 Real-ESRGAN GUI 操作简单 可以批量处理图片呆萌 开源AI图像视频放大增强工具 Waifu2x GUI 开源 免费 AI图片放大提升质量工具 Real-ESRGAN-GUI-windows 可批量处理 绿色免安装开源 AI声音克隆,用任意声音说话,解压即可使用 clone-voice 附模型开源AI 免费抠图工具,可以批量抠图rembg v2.0.56 抠图速度超快 附教程+视频效果演示开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI开源 免费 换脸工具 roop_unleashed 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示新一代开源 免费 AI换脸神器 FaceFusion 速度更快,效果更惊艳 操作更简单 附视频演示免费 开源 AI视频换脸工具,换脸离线包 RoopGPU 支持AMD显卡 附视频演示人工智能图像放大工具 Topaz Gigapixel AI破解版绿色便携版 附模型开源免费无限制 RWKV Runner-开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all开源 AI人脸替换工具离线版一张图实现视频或者图片换脸,完全免费!附演示视频新一代开源 免费 AI换脸神器 速度更快,效果更惊艳 操作更简单绿色 免安装 人工智能增强图片 Perfectly Clear WorkBench 图像清晰处理 绿色版 已集成插件Stable-diffusion下载量超过100万的大模型表现会如何的?附大模型下载地址开源 免费 音视频驱动图片说话唱歌 超级适合用来做数字人主播,效果惊艳 AniPortrait免费使用 麻薯AI变声器 2.0 内含模型开源 免费 RVC WebUI v1228 (AI歌曲翻唱工具) 附视频教程和200+语音模型AI 视频质量增强工具 Perfectly Clear Video 免费 绿色 免安装 智能AI批量一键抠图 文末有我详细使用效果图对比绿色 免安装 AI人工智能图像处理工具 Luminar Neo中文破解版 便携版ChatGPT-国内版 电脑手机均直接在线体验, 回复速度超快 无需API 无需科学上网Chatbox(ChatGPT API工具) 单文件版免费开源的 AI 图像放大提升增强画质工具,跨平台 upscayl Stable Diffusion(AI绘画) 喵手WebUI – 自更新一键下载安装汉化版 两大AI绘图工具Stable Diffusion 和Fooocus 面前 我的rx580 还能打几年? 附二者生成图片对比 再附下载地址SpleeterGUI 开源 免费 人声背景音乐分离工具 无需联网 内附模型Winxvideo AI v2.1 强大的视频转换处理软件 绿色便携版开源 免费 AI工具 视频补帧 速度超快 让视频更丝滑 附视频演示 附下载地址神器 操作简单 最佳自动视频增强器 HitPaw Video Enhancer 可转换为动漫效果视频开源人工智能的代码编辑器 Cursor-快速构建软件代码ChatGPT更简单操作的工具来了,比上次分享的更简单操作基于AI的创新图像编辑软件 Luminar Neo v1.6.2.10854 / Luminar AI v1.5.3.10043NovelAI-人工智能辅助写作、讲故事DeepL-人工智能语言辅助开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.92手把手教你在线制作 LeiaPix Converter 图片转换为3D视频 操作简单 文末有视频演示解压即可使用 DragGAN 革命性的人工智能工具 开源 完美P图 AI修图工具 通过关键点来进行修图Stable Diffusion(AI绘画) 绘世 WebUI – 自更新一键下载安装汉化版 Topaz Video AI破解版(人工智能视频修复,视频增强软件) Topaz Photo AI(图片增强工具) 绿色便携版 (去升级集成全部离线模型完整版)新一代开源 免费 AI换脸神器 速度更快,效果更惊艳 操作更简单AI人工智能 免费 在线 批量抠图 扣人像 效果不错 高清画质AI 人工智能 音视频转字幕小工具 ,支持上百种语言,离线视频翻译神器,批量处理,操作极其简单手机软件 安卓APP 偶遇一个安卓APP, AI智能助手 可以试试 看截图多图预览 VideoProc Converter AI 视频处理转换软件特别版持续更新ing
合集 一些常用的软件工具整理合集,方便大伙下载使用,想起来什么就整理一下,如果大伙需要整理什么东西,可以留言,有空我会弄上去整理本人喜欢用的电脑必装的一些软件和工具原创 ffmpeg 视频教程合集一些乱七八糟的东西,但是超级有用 建议收藏win10 win11原版系统官方 最新下载地址整理人工智能AI相关工具软件win系统优化清理工具整理音乐下载播放软件工具整理视频播放工具整理
软件 工具 # 图形图像 # 开源 # 绘图 开源 Rnote 矢量绘图工具 一款功能强大且易于使用的基于矢量的开源绘图应用程序 v0.13.1 Rnote是一款功能强大且易于使用的基于矢量的开源绘图应用程序,专为草图、手写笔记以及文档和图片的注释而设计。其目标用户群体广泛,包括学生、教师以及拥有绘图板的专业用户。Rnote的核心优势在于其灵活性和适应性。它支持PDF和图片的导入导出,使得用户能够轻松地将外部文件整合到他们的创作中。此外,Rnote提供了无限画布,用户可以根据需要自由发... 2025-12-13 软件 2980 0
软件 工具 # 游戏娱乐 # 绿色软件 # 开源 # 效率工具 开源 Magpie 窗口全屏工具:提升画质,让不支持全屏化的游戏也能全屏显示 v0.12.1 Magpie是一个轻量级的窗口缩放工具,它集成了多种高效的缩放算法和过滤器,旨在提升游戏图形质量,并使非全屏游戏能够以全屏模式显示。这款软件以其丰富的功能和用户友好的界面而脱颖而出。Magpie的核心功能包括能够将任意窗口缩放至全屏模式,同时提供了多种内置的缩放算法,如Lanczos、Anime4K、FSR、自适应锐化等,以及多种CRT着色器... 2025-12-13 软件 1.2万 0
AI#开源 工具 # 日常应用 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具 # 整合包 GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212 GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音(Text-to-Speech, TTS)系统。它基于大语言模型(LLM),专注于实现可控、富有情感表达的零样本语音克隆,并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频,即可克隆任意声音,无需微调或说... 2025-12-12 AI,开源 4061 6
AI#开源 语音 # 工具 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包 "90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211 🎙️ VibeVoice:你的超级AI配音员"把文字变成自然对话的魔法工具"🌟 什么是VibeVoice?想象一下,有一位永不疲倦的配音员,能一口气生成90分钟不间断的语音内容,还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice,一款革命性的AI语音生成工具!💡 它能为你做什么?(实用场景)场景用途效... 2025-12-11 AI,开源 7452 19
软件 工具 # 翻译 # 绿色软件 # 截图 # 开源 # OCR 开源 Sunny 截图工具 自带翻译和OCR 便携版 v5.0.1 这个工具我试了一下,给我第一个感觉就是及其简洁美观,跟我现在用pixpin有点像。也许等某天我用腻了pixpin这个工具就会是一个很好的替代品了。Sunny 截图是一款设计简洁且美观的截图软件工具,适用于 Windows、MacOS 和 Linux 平台。这款软件工具不仅界面简洁,而且功能丰富,能够满足用户在不同平台上进行截图的需求。软件特色... 2025-12-11 软件 3699 1
AI#开源 工具 # 日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包 AI音乐生成工具v2.0 基于 DiffRhythm 二次开发。webui界面 不卡死,速度快 英伟达显卡6g即可运行, 一键整合包 DiffRhythm:基于差分节奏建模的通用音乐流派分类开源项目DiffRhythm是由ASLP实验室提出的开源项目,旨在通过创新的差分节奏建模(Differential Rhythm Modeling)框架解决音乐流派分类任务。该项目结合传统信号处理与深度学习技术,从节奏这一音乐核心要素出发,构建了具有强解释性和泛化能力的分类模型。其代码已... 2025-12-7 AI,开源 5576 6
软件 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 截图 # 图片处理 # 免费 # 效率工具 免费 绿色软件 带数标的截图工具v2 来自傻木 截图时常常需要那种带步骤的,例如第一步点什么,第二步选什么现在截图工具都没有打标功能,例如标注具体步骤的一怒之下写了一个带数标的默认不显示数标,点一下工具栏的数标图标即可显示1-16数标为什么只有1-16?一张图里面如果含有超过16个步骤,那就是灾难级别的步骤了,我相信你不会遇到这种已更新,没有做开机自启功能,如有需要,自己放在启动菜单内即可... 2025-12-4 软件 2872 0
软件 工具 # 绿色软件 # win11 # 系统升级 Windows 11安装环境检测工具 | WhyNotWin11 开源绿色免安装 v2.7.0 介绍WhyNotWin11是一款专为Windows用户设计的系统升级检测工具,旨在帮助用户检测其计算机硬件是否满足升级到Windows 11的最低要求。这款软件由开发者rcmaehl创建,是一个小巧、实用且开源的应用程序,为用户提供了一个快速、简便的预评估途径,以确定他们的设备是否能够顺利升级到Windows 11。软件特点跨平台支持:Why... 2025-12-3 软件 2830 0
AI 工具 # 日常应用 # 绿色软件 # 图片处理 # 人工智能 # AI # 免费 魔搭+Pollinations 批量AI文生图工具 27pic-api v10 无需显卡,无需搭建解压即可运行。支持最新Z-Image-Turbo 文生图 大伙都知道,我直接分享过挂机流工作流,还有批量提示词工具。但是考虑到平时电脑也还有别的用途,老是用显卡来挂机生图,也是很耽误事。所以我就想利用各大平台的API来生成图片,这样就不会占用本地的资源又可以实现批量文生图的需求。所以今天花了一点时间做出来这个 AI文生图工具 27pic-api,暂时就取这个名字吧。远程调用魔塔的API&n... 2025-12-1 AI 1.4万 26
软件 工具 # 系统工具 # 日常应用 # 网络工具 # 下载工具 # 系统优化 # 绿色软件 # 系统维护 # 免费 # 效率工具 神器 云图工具箱2.5.7 一款安全方便快捷的Windows工具箱 可下载windows系统 云图工具箱 一款安全方便快捷的Windows工具箱一款方便,安全,快捷,的工具箱致力于让用户用最方便的方式,用上最纯净的软件云图工具箱(wintool)可以帮助Windows用户解决非常多日常遇到的问题,给用户带来更多的便利。软件包含了许多平时我们经常会用到的小功能,可以帮助用户更好地使用Windows系统,十分的方... 2025-11-28 软件 3746 0
软件 工具 # 日常应用 # 开源 # 笔记 # 效率工具 开源 blossom 一个功能丰富的云端双链笔记软件 v1.17.1 Blossom是一个功能丰富的云端双链笔记软件,它支持私有部署,允许用户将笔记、图片及个人计划安排安全地保存在自己的服务器中,实现跨设备的实时同步。这一特性使得Blossom不仅是一个强大的知识管理工具,还兼顾了数据隐私保护的需求。Blossom的核心特点之一是其完善的文件关系管理。它内置了图床功能,不依赖第三方存储服务,用户可以直接在应用中... 2025-11-25 软件 3252 1
软件 安卓 # 开源 # 免费 # 投屏 开源安卓投屏工具 QtScrcpy 中文免费版 v3.3.3 QtScrcpy是一个开源项目,它基于Scrcpy进行重构,旨在提供一个功能强大且易于使用的工具,用于通过电脑控制Android设备。QtScrcpy不仅支持实时预览和录制手机屏幕,还具备跨平台、轻量级和非侵入性等特点,使其成为开发者调试、游戏玩家分享游戏过程或教师进行在线教学的理想选择。QtScrcpy的核心功能包括实时显示安卓设备的屏幕内... 2025-11-25 软件 3391 0
软件 工具 # 绿色软件 # 开源 # 人工智能 # AI 开源 Apt Full 绿色版 一个功能强大、操作便捷的AI生产力工具 v2.9.15.0 该项目集成了多种AI模型,特别是提供了私人专属的ChatGPT AI智能助理,能够处理各种文本任务,为用户提供智能辅助。此外,它还能一键批量智能处理图片和视频,包括但不限于图片无损放大、擦除水印、转换为卡通漫画风格、转制3D效果、上色修复、人脸修复等,以及视频的无损放大、擦除水印、转换为卡通漫画风格、转制3D、上色修复、插值补帧等功能。总之,... 2025-11-25 软件 7979 7
AI#开源 工具 # 系统工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 大模型 # 效率工具 告别灵感枯竭?试试 AI-Writing 的智能创作能力 AI智能写作辅导软件 v1.2 AI-Writing 是一个旨在利用人工智能模型来辅助文本创作的开源项目。它可以帮助用户提高写作效率,适用于文章撰写、文案生成、内容润色、创意激发等多种场景。该项目可能整合了当前主流的自然语言处理(NLP)模型,比如 GPT、ChatGLM、BERT 等,以实现以下功能:✨ 主要功能特性自动续写根据用户输入的开头段落或句子,自动生成后续内容。... 2025-11-22 AI,开源 3555 0
AI 工具 # 视频处理 # 绿色软件 # 人工智能 # AI # 大模型 # 整合包 AI智能去水印神器 27Watermark v2.0 一键去除视频水印,保持原画质 v20251012 针对sora和通义AI生成的视频水印去除 效果非常好 📖 什么是27Watermark?27Watermark 是一款基于先进AI技术的智能视频和图片去水印工具。它使用最新的FLUX.1-Kontext模型,能够智能识别并移除视频和图片中的水印,同时完美保持原始内容的完整性和质量。🎯 核心功能✨ 智能去水印精准识别:AI自动识别水印位置和类型智能修复:用周围背景自然填补水印区域质量保持:保持原始... 2025-11-21 AI 7652 0
AI#开源 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包 图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.70 ComfyUI 是一个基于节点(Node-based)的图形界面工具,专为使用 Stable Diffusion及其衍生模型进行图像生成而设计。它通过可视化的流程图方式,让用户无需编写代码即可构建复杂的生成工作流。🧩 1. 可视化流程图系统节点式编辑器:将每一个操作(如加载模型、输入提示词、图像采样等)封装为独立节点,用户可以通过拖拽连接这些... 2025-11-19 AI,开源 7836 3
AI 图像处理 # 变脸 # 人工智能 # AI # 换脸 # 整合包 开源 AI人脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频 这是热心网友万能君做的一个整合包,整合包里面已经包含了几个换脸项目和一些高清修复功能等,具体可以看下图截图所示。要顺利使用这个工具,必须做好以下几点第一个 这个工具只支持CPU+N卡。如果需要使用N卡,一定要先安装好驱动和CUDA。第二个 一定要安装好运行库。https://www.jian27.com/html/2290.html第三个 所... 2025-11-13 AI 514.9万 10220
AI#开源 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 一键整合包 Step-Audio-EditX v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉” 🧠 什么是 Step-Audio-EditX?Step-Audio-EditX 是由 StepFun AI 团队开源的一款 30 亿参数(3B)的大语言模型(LLM)驱动的先进音频编辑系统,专注于 高表现力、可迭代、细粒度的语音编辑与零样本语音合成(TTS)。它不仅能高质量克隆任意人声,还能对语音的情绪、说话风格、副语言特征(如笑声、叹息等)... 2025-11-12 AI,开源 4376 2
AI#开源 工具 # 系统工具 # 日常应用 # 音乐 # 绿色软件 # 开源 # 人工智能 # AI # 效率工具 # 整合包 输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包 腾讯 AI Lab 推出的一个 “AI 自动生成完整歌曲” 的免费工具。你只需要提供一段歌词,它就能帮你自动配上人声 + 伴奏,生成一首像模像样的歌,支持中文和英文!🎤 它能做什么?你写歌词,AI 唱出来:你只要写下带结构的歌词(比如“[主歌]……[副歌]……”),AI 会自动配上旋律、人声和背景音乐。支持风格定制:你可以指定歌曲风格(比如“... 2025-11-9 AI,开源 6671 17
AI 工具 # 日常应用 # 视频处理 # 绿色软件 # 人工智能 # AI # 效率工具 告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0 基于 Ovis2.5-2B 多模态大模型 · 中文支持 · 批量处理 · 智能检索✨ 核心功能🔍 智能视频内容理解自动分析视频内容,生成结构化中文描述,包括:人物性别、年龄段(儿童/少年/青年/中年/老年)发型发色、服装款式与颜色动作行为(如跳水、游泳、站立、互动)场景环境(户外/室内、植被、天气、水域类型)3等等⚡ 高效批量处理递归扫描整个... 2025-11-5 AI 2851 3
AI 工具 # 系统工具 # 日常应用 # 文本 # 绿色软件 # 办公软件 # 开源 # 人工智能 # AI # 文本编辑 # 效率工具 # 整合包 中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数 剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。✅ 核... 2025-11-4 AI 2.3万 94
软件 工具 # 绿色软件 # 截图 # 开源 # 截屏 # 屏幕工具 flameshot 一款开源的屏幕截图工具 v13.3.0 Flameshot是一款开源的屏幕截图工具,专为Linux用户设计,但也能在Windows和macOS上通过适当的包装和安装方法运行。它以其直观的用户界面和丰富的功能集而闻名,为用户提供了快速捕捉屏幕内容、编辑和分享截图的便捷方式。Flameshot支持多种截图模式,包括全屏截图、窗口截图、区域截图以及滚动截图(用于捕获超出屏幕长度的内容,如... 2025-11-4 软件 3246 0
AI#开源 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具 # 整合包 AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103 SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成(TTS)系统,专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容(如主持人 + 嘉宾);能处理长文本输入,保持语音连贯性和角色一致性;适... 2025-11-3 AI,开源 4746 1
AI#开源 Android # 安卓 # 手机软件 不只是语音合成:MiMo-Audio 能理解、能生成、还能创作声音,一键整合包 v20251018 🎧 什么是 MiMo-Audio?MiMo-Audio 是小米推出的一个能听、会说、还能创作声音的智能 AI 模型。你可以把它想象成一个“超级语音大脑”——不仅能听懂你说的话,还能模仿你的声音说话、讲故事、主持节目,甚至帮你把一段话变成不同风格的语音(比如更温柔、更激昂)。🌟 它厉害在哪里?不用专门训练就能学会新任务(Few-Shot Lea... 2025-10-25 AI,开源 2870 0
AI#开源 图像处理 # 工具 # 视频处理 # 图形图像 # pdf # 开源 # 图片处理 # 人工智能 # AI # gif # 免费 # 效率工具 # 整合包 支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题 Qwen3-VL 一键整合包 v20251024 基于 Qwen3-VL-4B-Instruct 的多模态智能交互平台📌 简介本应用是一个基于 通义千问 Qwen3-VL-4B-Instruct 大模型的多模态推理系统,支持对 图像、视频、PDF 文档、GIF 动图 等多种媒体内容进行智能理解与分析,并能自动生成精准描述、解答问题或提取关键信息。借助 Gradio 构建的直观 Web 界面,... 2025-10-24 AI,开源 3977 0
AI#开源 图像处理 # 工具 # 日常应用 # 绿色软件 # 办公软件 # 图形图像 # pdf # 开源 # 图片处理 # 人工智能 # AI # OCR # 免费 # 效率工具 # 整合包 DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023 🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二... 2025-10-22 AI,开源 3610 4
AI#开源 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包 一句话改图,两张图参考——DreamOmni2 让 AI 理解你的编辑意图 一键整合包优化版 v20251014 支持风格迁移、物体替换、光照调整等全能图像编辑 DreamOmni2 是一个“万能图像编辑器” —— 你给它两张图 + 一句指令,它就能智能地把第一张图“改”成你想要的样子,参考第二张图的风格、内容、细节等。🖼️ 它能做什么?(举几个例子)你想做什么DREAMOMNI2 能做到把照片里的衣服换成另一件✅ 上传原图 + 新衣服图 + 指令:“把第一张图的衣服换成第二张的”让人物发型和参考图一... 2025-10-13 AI,开源 3790 0
AI#开源 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI AI 一键换装 + 换姿势:你的虚拟造型师来了! Leffa v20251010 一键整合包 🎯 这个工具能做什么?这是一个 AI 换装 + 换姿势 的智能图像生成工具,名字叫 Leffa。它能帮你完成两件很酷的事情:1️⃣ 虚拟试衣(AI 换衣服) 👗你只需要提供:一张你自己的全身照片(人像)一张你喜欢的衣服照片AI 就会自动把这件衣服“穿”到你身上,生成一张逼真的试穿效果图!✅ 支持上衣、裤子、连衣裙等多种服装类型✅ 衣服纹理、褶... 2025-10-10 AI,开源 8181 1
AI#开源 语音 # 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包 Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包 v20251008 🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n... 2025-10-8 AI,开源 5290 0
AI#开源 开源 国产AI画画太强了!一句话生成高清美图,支持中文提示词,最低6G英伟达即可运行,15秒出图 Qwen-Image+Edit一键整合包 v20250828 新增 qwen-image-edit-2509-lightningv2.0-20250927 整合包 Qwen-Image 是由通义实验室推出的多模态大模型,集成在 Qwen(通义千问)系列中,专注于实现强大的图文理解与生成能力。该模型基于 Qwen 的语言理解基础,深度融合视觉模块,使其能够同时处理和理解图像与文本信息,支持跨模态任务,如图像描述生成、视觉问答(VQA)、图文匹配、图像理解与推理等。核心特点:强大的图文理解能力Qwen-Im... 2025-9-27 AI,开源 7342 10
AI#开源 图像处理 # 工具 # 日常应用 # 视频处理 # 绿色软件 # 图形图像 # 开源 # 抠像 # 抠图 # 人工智能 # AI # 免费 # 效率工具 # 整合包 27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示 这个工具基于AI大模型BiRefNet文件二次开发。可以对视频进行抠像。速度快,效果也不错。对显卡占用很低,8G的英伟达显卡就可以流畅运行了。操作极其简单,无需任何基础 会点鼠标即可。下面截图几张抠像效果演示20241209 v1.1 更新记录1 保留白色和黑色背景这2种视频抠像,新增了一个自定义背景图片抠像。2... 2025-9-23 AI,开源 1.5万 55
AI#开源 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 抠像 # 抠图 # 人工智能 # AI # 整合包 不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920 BiRefNet 是一个专注于 高分辨率二值图像分割(Dichotomous Image Segmentation, DIS) 的开源深度学习模型。它在背景移除、前景提取、掩码生成等任务中表现出卓越性能,广泛应用于:图像编辑与合成视觉特效处理自动抠图(无需 Trimap)数字内容创作(如 Blender 插件、AI 绘画工具集成)🚀 核心特性... 2025-9-21 AI,开源 8424 2