字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

AI,开源 4 3439
UNO(Universal Customization)是由字节跳动公司开发并开源的一个通用自定义方法的项目,旨在解决单主体和多主体条件下的图像生成问题,具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程,利用扩散变换器的内在上下文生成能力,生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入,是从文本到图像模型迭代训练而来的多图像条件主体到图像模型。

项目特点

  • 高一致性与可控性 :通过独特的数据合成流程和模型架构,在单主体和多主体驱动生成中,既能保证生成图像的高度一致性,又能确保对生成过程的可控性。
  • 多主体支持 :能够处理多主体条件下的图像生成任务,为复杂场景的图像合成提供了有力支持。
  • 内存优化 :提供了fp8模式,作为对消费级GPU用户的一种低显存使用支持,其峰值显存使用量约为16GB,使得在资源有限的设备上也能进行有效的图像生成。

项目功能

  • 图像生成 :可以根据给定的提示词和参考图像生成相应的图像,如将一个时钟放在海滩上的红色太阳伞下,或将一个雕像放在水晶球中等。
  • 模型训练与推理 :开源了训练代码和推理代码,用户可以根据自己的需求进行模型的进一步训练和定制,以及使用预训练模型进行图像生成推理。

使用方式

  • 环境配置 :项目提供了详细的环境配置指南,用户可以通过创建虚拟环境并安装相应的依赖库来搭建运行环境。
  • 模型检查点下载 :提供了多种下载模型检查点的方式,包括自动下载、使用命令行工具下载以及手动设置环境变量指向已下载的检查点等。
  • 运行示例 :给出了多种运行示例,包括简单的图像生成示例、在dreambench数据集上的评估示例等,方便用户快速上手。

项目意义

该项目为图像生成领域提供了一种新的通用自定义方法,具有广泛的应用前景。对于学术研究而言,开源的代码和模型为研究人员提供了宝贵的实验素材和研究基础,有助于推动该领域的技术进步。对于实际应用,如广告设计、游戏开发、虚拟现实等领域,UNO模型可以为创作者提供强大的图像生成工具,提高创作效率和质量。

开源信息

项目遵循Apache 2.0许可证开源,而模型遵循CC BY-NC 4.0许可证,用户可以在遵守相应许可协议的前提下自由使用、修改和分发项目代码和模型。

2025-04-21_10-56-40.png

整合包说明

1 功能未作修改,只汉化了界面

2 自行安装好cuda12.4,

3 显存低于16G的显卡就不要下载了。这个开源项目很耗资源,可以参考我上面的截图

4 生成的图片 尺寸不要改太大,否则会直接爆显存,可以先生成尺寸小的,找其他图片放大工具放大。

5 如果解压出错,用管理员身份运行winrar 再解压

点击查看

下载有疑问看下这里


相关推荐:

我要评论:

◎欢迎参与讨论,请自觉遵守国家法律法规。

已有 4 条评论

  1. 果汁个性 果汁个性

    解压出错,没权限,

    1. 剑心 剑心

      文末仔细看

  2. 解压失败无法使用 解压失败无法使用

    这个压缩文件格式未知或者数据已经损坏 jian27\Scripts\pip3.exe E:\迅雷下载\UNO\UNO.rar
    这个压缩文件格式未知或者数据已经损坏 jian27\Scripts\wheel.exe E:\迅雷下载\UNO\UNO.rar

    1. 剑心 剑心

      文末仔细看

只显示最新的15条留言