神器 开源AsrTools v1.1.0 AI 视频自动生成字幕 解压即可使用

神器 开源AsrTools v1.1.0 AI 视频自动生成字幕 解压即可使用

WEIFENG2333/AsrTools是一个功能强大的开源项目,专注于提供高效、便捷的字幕生成和处理工具。该项目基于LLM(大型语言模型)技术,实现了智能字幕助手VideoCaptioner,无需GPU支持,即可一键完成高质量字幕视频合成。以下是对该项目的详细介绍:项目背景与特色AsrTools项目旨在解决视频字幕制作过程中的繁琐与低效问题...
开源 0
InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

这个项目群里的小伙伴 推荐了好多次了,之前我也试过做整合包,做完后发现BUG太多了,我就删了,看到作者最近又更新了,所以抽空把这个整合包做出来了。效果嘛 你们自己看。先来一张官方的示例图下面是我跑完的效果下面继续看我用其他图片跑的出来的效果跑一张图片大概需要3-4分钟。下面是界面截图下面是这个项目的AI介绍nstantIR 是一个在 GitH...
AI,开源 0
开源 免费 RVC WebUI v2.2.231006支持AMD+N卡+I卡 (AI歌曲翻唱工具)  附视频教程和200+语音模型

开源 免费 RVC WebUI v2.2.231006支持AMD+N卡+I卡 (AI歌曲翻唱工具) 附视频教程和200+语音模型

RVC 是一款前沿的音色替换项目,可以进行歌曲的翻唱和实时的变声,具有低延迟、优秀的变声效果、声音模型扩展性、个性化和先进的深度学习技术等特点。该项目的核心功能之一是有更高的自由性和声音模型扩展性,可以对任意动漫角色和人物进行实时的声音转换,前提是进行训练声音模型。这为用户提供了极大的自由度和创新空间。,这种声音模型的转换是通过深度学习实现的...
开源 0
复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术,该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍:项目背景:肖像图像动画技术:该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像,在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...
AI,开源 0
开源免费 inkscape v1.4.0 全新跨平台的矢量图形设计软件,可替代PS、AI、CDR工具!

开源免费 inkscape v1.4.0 全新跨平台的矢量图形设计软件,可替代PS、AI、CDR工具!

Inkscape 是一款开源矢量图形编辑软件,它为设计师、艺术家和开发人员提供了创建和编辑矢量图形的工具。作为一款免费软件,Inkscape 可以在 Windows、Mac OS X 和 Linux 系统上运行,为用户提供强大的矢量设计功能。下面我将为您介绍 Inkscape 的主要特点和功能。1. 矢量绘图:Inkscape 使用矢量图形来...
开源 0
diffusers-image-outpaint  超强AI人工智能扩图工具 一键整合包

diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目,它为图像外绘(image outpainting)提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域,有时我们需要对图像进行扩展或修复,尤其是在图像的边缘部分进行外绘,以创造出更完整或更具创意的图像效果。Diffusers Image...
AI,开源 0
免费 开源 AI视频换脸工具,换脸离线包 RoopGPU v1.3.2 支持AMD显卡 附视频演示

免费 开源 AI视频换脸工具,换脸离线包 RoopGPU v1.3.2 支持AMD显卡 附视频演示

roop 这个项目,原作者已经放弃了,转去做facefusion了。我这2天在整理我的网站上的一些开源项目,然后想更新下这个项目的最终版本。原来分享的不是最终版,估计想最终版也许值得珍藏。就去研究了下。发现这个版本居然是支持A卡来跑的。速度还不错,就花了点时间做成了整合包。今天分享出来,整合包代码全部开源,我没有加密任何文件,有很多人喜欢把启...
软件,开源 0
EzAudio: High-quality Text-to-Audio Generator AI文本生成音乐 音效 一键整合包 20240929修改增强

EzAudio: High-quality Text-to-Audio Generator AI文本生成音乐 音效 一键整合包 20240929修改增强

超级实用的一个AI开源工具,可以输入文本来生成各种声音,感觉这个很有实用场景啊,群里小伙伴推荐的一个项目。我花了点时间做成了整合包。腾讯AI实验室与约翰霍普金斯大学强强联手,共同推出了EzAudio这一革命性的文本到音频生成模型。EzAudio以其前所未有的高效能与卓越音质,为人工智能与音频技术的融合树立了新的里程碑。EzAudio之所以能在...
AI,软件 0
开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.94 整合包 附全部模型

开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.94 整合包 附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e...
AI,开源 0
开源 Tailor v0.1.5  一款功能强大的视频智能裁剪、生成及优化工具

开源 Tailor v0.1.5 一款功能强大的视频智能裁剪、生成及优化工具

Tailor 是一款功能强大的视频智能裁剪、生成及优化工具。这款软件集成了最先进的人工智能技术,为用户提供了前所未有的视频处理体验。Tailor涵盖了视频剪辑、视频生成和视频优化三大核心功能,共包含10种不同的处理方法。在视频剪辑方面,Tailor拥有精准的人脸识别技术,能够自动捕捉视频中的精彩人脸瞬间,并允许用户轻松选择关注的人脸进行裁剪,...
软件 0
PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目,专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献,其中Zinan Guo和Yanze Wu为等量贡献者,Yanze Wu为通讯作者。PuLID项目的...
AI,开源 0
开源 AI声音克隆,用任意声音说话,解压即可使用 clone-voice v0.908 附模型

开源 AI声音克隆,用任意声音说话,解压即可使用 clone-voice v0.908 附模型

大伙好,我是剑二十七,好像早几天有小伙伴在问是否有声音克隆工具,今天找了一个,而且作者很贴心做成了 可执行文件,解压即可使用。真是超级方便。效果也不错。关键是我没有N卡也可以运行,效率也不错。下面看截图下面是实操过程截图点击开始生成 其他都是默认我没有去录音自己的声音,用的是默认的样品下面是生成后的声音 你们听听。今天比较匆忙 没有...
软件,开源 0
应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

群里一些小伙伴老在讲什么之前的老版本如何如何好用,如何得心应手。说实话我自己没有什么感觉。估计他们这些都是幻觉。但是你们要是喜欢之前的版本,我也是可以再分享出来,时间也是过得好快啊。截图如下 版本如下估计差不多了吧,应该没什么遗漏了。喜欢老版本的可以去下载试试。如果全部收藏的话 大概有170多G。。。你们看截图写在最后的最后,如果对这个工具使...
软件 0
Fooocus v2.5.5 又一款上手快,门槛低的开源AI绘画工具 效率不错 支持AMD显卡

Fooocus v2.5.5 又一款上手快,门槛低的开源AI绘画工具 效率不错 支持AMD显卡

这个开源项目我之前也分享过,但是最近又更新了。文件是在是太大了就一个基本能运行的压缩包 还只是包含了一个模型就是差不多15G,我上传上来都是要半天啊。实在是无语的很。如果你的显卡是N卡就继续看下去,如果是A卡就没有必要看下去了。这个软件只支持n卡。可惜我的显卡也是A卡,所以我只能脑补一些情况。但是我为了小伙伴的福利,还是坚持在网上搜了下其他人...
开源 0
RainCrack全能视频音频格式转码王 v2024.2.2永久免费版 一款集便捷性、广泛性和高效性于一身的媒体转码工具

RainCrack全能视频音频格式转码王 v2024.2.2永久免费版 一款集便捷性、广泛性和高效性于一身的媒体转码工具

RainCrack全能视频音频格式转码王是一款功能强大的媒体转码工具,它以其出色的转换能力和广泛支持的文件格式在广大用户中赢得了极高的口碑。该软件的最新版本为2024.2.2,采用了绿色免安装的设计,用户只需简单解压即可立即使用,无需复杂的安装过程,极大地提高了使用的便捷性。该转码王几乎支持所有常见的视频、音频以及图片格式转换,无论是AVI、...
软件 0
开源 TotalAIChat V1.0.0.1 一款集成了国内多个主流AI聊天机器人的综合型软件

开源 TotalAIChat V1.0.0.1 一款集成了国内多个主流AI聊天机器人的综合型软件

TotalAIChat是一款功能强大的集成型聊天工具,由EffiDataEase团队开发并维护。该软件基于Qt6框架,结合QWebViewEngine与C++编程语言,为用户提供了前所未有的AI聊天体验。它巧妙地集成了国内八大主流聊天机器人,包括问心一言、腾讯元宝、通义千问、豆包、Kimi、开工、360以及讯飞,使得用户能够在一个统一的界面中...
开源 0
漫画制作软件 MediBang Paint Pro v29.1

漫画制作软件 MediBang Paint Pro v29.1

MediBang Paint Pro是一款来自日本的漫画制作软件,支持多平台,完全免费,作为一款专业漫画插画绘图软件,可以让你制作出精美的漫画插画,易于画幅分割,并具备屏幕调色功能,软件还有大量现成的素材,让你制作漫画更为高效!基本简介MediBangPaint Pro是一款于PC上使用的完全免费的插画?漫画制作软件。同时支持Windows与...
软件 0
神器 Civitai-Web-Scraper C站图片下载工具 整合包

神器 Civitai-Web-Scraper C站图片下载工具 整合包

Civitai-Web-Scraper是一款专为挖掘CivitAI平台上丰富的人工智能生成图像及其灵感提示而设计的开源工具。该项目由ScreamingHawk在GitHub上开源,旨在帮助艺术家、设计师、AI研究人员以及普通爱好者轻松访问和获取CivitAI网站上的AI创作内容。主要功能与特点:一键式抓取:Civitai-Web-Scrape...
AI,开源 0
AIO Boot NewGen v23.06.02 一款功能强大、易于使用的多功能USB启动器

AIO Boot NewGen v23.06.02 一款功能强大、易于使用的多功能USB启动器

AIO Boot NewGen是一款经过重新设计的轻量级启动软件,旨在为用户提供更加高效、便捷的启动体验。这款软件作为AIO Boot的升级版本,继承了其作为多功能USB启动器(Multiboot USB Creator)的强大功能,同时引入了全新的界面设计和优化的性能,使得用户能够更加轻松地创建和管理他们的启动媒介。AIO Boot New...
软件 0
AI 视频质量增强工具 Perfectly Clear Video v4.6.1.2690 x64

AI 视频质量增强工具 Perfectly Clear Video v4.6.1.2690 x64

这个工具有个图片质量增强,也是非常强大好用的,今天突然发现居然还有个同款视频增强我马上分享出来,亲测了一下,确实效果也不错神器 人脸自动识别 图像后期处理调色 Perfectly Clear WorkBench v4.6.0.2618 附模型Perfectly Clear Video Mac/WIN 是一款适用于Mac苹果电脑和Windows...
软件 0
FolderPainter v1.3 一款非常实用的文件夹图标调整工具 绿色免安装

FolderPainter v1.3 一款非常实用的文件夹图标调整工具 绿色免安装

Folder Painter是一款专为Windows操作系统设计的文件夹图标调整工具,它以其简单易用、功能丰富的特点赢得了用户的广泛好评。以下是对Folder Painter的详细介绍:一、软件概述Folder Painter允许用户轻松设置文件夹的颜色、更换文件夹样式以及图标,无需进行繁琐的图标替换操作。通过这款软件,用户可以快速美化电脑桌...
软件 0
视频损坏修复工具 Remo Video Repair v1.0.0.28

视频损坏修复工具 Remo Video Repair v1.0.0.28

这个也许有时候可能会用的上,目前我暂时没有遇到视频损坏需要修复的情况。。。我们每个人都偶然发现过损坏或损坏的视频文件,无论该文件是来自数码相机还是电影的个人记录。根据损坏情况,大多数视频都会被放弃或删除,因为这样的标志是无法解决的问题的代名词。但是,有一种工具可以恢复损坏的视频,而不会牺牲质量或损坏的片段。 Remo Video Repair...
软件 0
开源 MyPaint v2.0.1 一款功能强大、易于使用的绘画绘图工具

开源 MyPaint v2.0.1 一款功能强大、易于使用的绘画绘图工具

MyPaint是一款专为艺术家设计的快速且简洁的绘画应用程序,它以其强大的功能和用户友好的界面赢得了广泛的认可。以下是对MyPaint的详细介绍:MyPaint拥有一个无限大的画布,这意味着艺术家们可以在不受限制的空间内自由创作,尽情发挥想象力。同时,它提供了极其可配置的画笔,让艺术家可以根据需要调整画笔的各种参数,如硬度、形状、透明度等,以...
开源 0
开源 MDX23  v1.0.1 一款超强AI背景音人声分离工具

开源 MDX23 v1.0.1 一款超强AI背景音人声分离工具

MVSEP-MDX23-music-separation-model 是一个专为2023年音乐分离挑战赛(MDX'23)设计的音频分离模型,它能够将音乐分解为四个独立的音轨:“低音”、“鼓声”、“人声”和“其他”。该模型在挑战赛中取得了第三名的好成绩(Leaderboard C),证明了其在音乐分离领域的强大实力。此模型基于Demuc...
开源 0
玩游戏必备工具 DirectX修复工具增强版 DirectX Repair V4.3

玩游戏必备工具 DirectX修复工具增强版 DirectX Repair V4.3

玩游戏经常会遇到提示缺少某DLL,用这个即可修复介绍DirectX修复工具(DirectX Repair)是一款系统级工具软件,绿色简便易用,无需安装,可直接运行。主要功能是检测当前系统的DirectX组件及VC++库文件状态,发现异常则进行修复。程序采用易用的一键式设计,只要点“检测并修复”,它就会自动完成校验、检测、下载、修复以及注册全部...
软件 0
开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

waifu2x-caffe 是一个开源软件项目,旨在通过使用深度学习技术来提高图像的分辨率和质量。这个项目最初是由日本工程师lltcggie开发的,基于 Caffe 深度学习框架实现。waifu2x-caffe 的主要功能是将低分辨率的图像放大至高分辨率,并提升图像的视觉质量,尤其在处理动漫风格的图像方面表现出色。这个软件的强大之处在于其通过...
开源 0
来自小日子的免费绘画软件 插画制作工具 MediBang Paint Pro v29.1 中文版

来自小日子的免费绘画软件 插画制作工具 MediBang Paint Pro v29.1 中文版

介绍Medibang Paint Pro 是由日本 medibang 公司研发的一款免费绘画软件,支持 Windows、Mac、Android 系统,可以让你轻松的画出精美的漫画插画,主要是用来绘制插画和漫画,内置有丰富的笔刷、素材、漫画用字体等功能,方便动漫作者进行创作。软件截图软件特点多样笔刷搭载表现原稿质感的G笔尖・圆笔尖,以及可混色水...
软件 0
开源 AI EmotiVoice 易魔声 文本生成语音  一款功能强大且现代的开源文本转语音(TTS)引擎

开源 AI EmotiVoice 易魔声 文本生成语音 一款功能强大且现代的开源文本转语音(TTS)引擎

EmotiVoice(易魔声)是一款功能强大且现代的开源文本转语音(TTS)引擎,由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名,为用户提供了极为丰富的声音选择。以下是对EmotiVoice(易魔声)的详细介绍:一、核心功能双语言支持:EmotiVoice支持中英文两种语言的文本转语音,满足了不同用户的语言需求...
AI,软件 0
LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait是一款由快手科技与中国科学技术大学和复旦大学合作开发的先进AI驱动的肖像动画框架,其项目地址位于https://github.com/KwaiVGI/LivePortrait。该软件旨在通过创新的图像处理技术,将静态的照片转化为栩栩如生的动态视频,为用户带来更加生动有趣的视觉体验。核心特点高效性:LivePortrai...
AI,开源 0
开源 MimicBrush 一款创新性AI图像编辑工具 图片局部自动重绘 一键整合包 附模型

开源 MimicBrush 一款创新性AI图像编辑工具 图片局部自动重绘 一键整合包 附模型

MimicBrush是一款由阿里巴巴、中国香港大学和蚂蚁集团共同研发的创新性AI图像编辑工具,该软件通过先进的AI技术,实现了零样本图像编辑,为用户带来了前所未有的图像编辑体验。核心特点模仿式编辑:MimicBrush能够自动识别并模仿参考图像中的视觉元素,将其应用到源图像中指定的编辑区域,实现精准且自然的图像融合。自动化编辑:用户只需简单指...
开源 0
开源 AI重现人类绘图过程,并生成视频 Paints-UNDO 一键整合包 附视频演示

开源 AI重现人类绘图过程,并生成视频 Paints-UNDO 一键整合包 附视频演示

Paints-Undo是一个专注于数字绘画行为的创新AI模型项目,其目标是为人类艺术家和研究者提供一个基础模型,以更好地理解和模拟人类绘画的过程。Paints-Undo的核心功能在于它能够通过输入图像,反向推导出绘制该图像的一系列步骤。这一功能不仅限于简单的素描、着色等过程,还能模拟复杂的阴影处理、图层变换、颜色曲线调整等人类艺术家在创作过程...
开源 0