共计 516 个字符,预计需要花费 2 分钟才能阅读完成。
ConsolidatedID
具有多模式细粒度身份保留的肖像生成,是一个面部一致性生成项目,给定一些输入 ID 的图像,可以仅使用单个图像,根据文本提示生成各种个性化 ID 图像,人像生成具有极高的 ID 保真度,不牺牲多样性、文本可控性,几秒钟内快速定制,无需额外的 LoRA 培训。
ConsolidatedID 包含两个关键组件:一个多模态面部提示生成器,它结合了面部特征、相应的面部描述和整体面部上下文,以提高面部细节的精确度;以及通过面部注意力定位策略优化的 ID 保存网络,旨在保持 ID 一致性在面部区域。
ConsolidatedID 主要特点:
- 人像生成具有极高的 ID 保真度,不牺牲多样性、文本可控性
- 将 FaceParsing 和 FaceID 信息引入 Diffusion 模型
- 几秒钟内快速定制,无需额外的 LoRA 培训
- 可以作为适配器与社区中的其他基础模型以及 LoRA 模块进行协作
网站地址
官网:https://ssugarwh.github.io/consistentid.github.io/
正文完