Google推出了一种在 StableDiffusion 图像生成中保证内容特征一致性的方式。这个其实是现在图像生成中一个非常重要的问题，故事可视化、游戏开发资产设计、广告等都需要在生成的时候具备角色或者内容的一致性。…

发布时间: 2023-11-17 15:02:11

1分

数据加载中

Google推出了一种在 StableDiffusion 图像生成中保证内容特征一致性的方式。
这个其实是现在图像生成中一个非常重要的问题，故事可视化、游戏开发资产设计、广告等都需要在生成的时候具备角色或者内容的一致性。…
IT技术
( twitter.com )

Google推出了一种在 StableDiffusion 图像生成中保证内容特征一致性的方式。
这个其实是现在图像生成中一个非常重要的问题，故事可视化、游戏开发资产设计、广告等都需要在生成的时候具备角色或者内容的一致性。
从演示来看效果非常好人物角色和其他内容的特征都保持的非常好，他们有一个示例是一个男人的一生十几张不同年龄段的图片都很像能看出来是一个人。
而且这个项目还可以跟 SD 已有的控制方式结合，比如局部重绘和 Controlnet 等。下面是具体的介绍：

实现方法：
身份聚类：这一步骤涉及首先生成一系列图像，然后将这些图像嵌入到一个语义空间中。接着，使用聚类算法将这些图像分组，每个组代表一种可能的角色身份。这个过程旨在识别出一组视觉上一致的图像，从而确定角色的主要视觉特征。

身份提取：在确定了一组具有高内聚性的图像之后，接下来的步骤是通过在这些图像上训练模型来提炼出一个更一致的角色身份。这意味着模型将学习到特定角色的关键视觉特征，以便在未来的生成中更准确地重现这些特征。

收敛性：方法的最后一个步骤是迭代过程，该过程在达到一定的收敛标准时停止。在每次迭代中，模型基于最新的训练数据生成新的图像，并重新进行聚类和身份提取。这个过程重复进行，直到模型能够可靠地生成具有一致视觉身份的角色为止。

效果验证：
定性和定量比较：在这一部分，作者将他们的方法与其他个性化文本到图像生成技术进行比较。这包括通过视觉和数值指标来评估生成图像的一致性和质量。

用户研究：作者还进行了一项用户研究，以评估他们的方法在实际使用中的效果。这包括让用户评价生成图像的一致性和吸引力。

消融研究：这部分是对方法中不同组件的效果进行评估。通过修改或移除方法的某些部分，作者能够理解每个组成部分对最终结果的贡献。

论文链接：https://t.co/NpKv57BDvT

Markdown支持

评论加载中...

您可能感兴趣的：更多

Google在AI领域的步伐真的加快了，将推出AI生成广告素材的功能，为商家提供更便捷、高效的广告内容创作。该技术首先用于创建效果最大化的广告。此外，Google还将推出一个名为Google Product Studio的产品，利…
IT技术
( twitter.com)

1年前 • sundyme • -- 点击 0 评论

Google太惨了。。。这是接着第二天大跌了。Google现在的问题是革自己的命还是被人革命。Google的 doc套件杀进了微软的核心利益区域，微软采取了一系列措施来对抗Google的核心利益，搜索广告。比如推出Edge，搞c…
推特中文圈
( twitter.com)

1年前 • 雷尼尔 • -- 点击 0 评论

#Crypto工具推荐 googel推出了ChatGPT插件，能够将 ChatGPT 的回答结果并排展示在 Google 搜索页面，非常好用，推荐~
#ChatGPT #OpenAI

安装地址拿走：…
币圈
( twitter.com)

2年前 • Crypto军火库 • -- 点击 0 评论

在google随便搜一下就知道加州的税率是多少了，40%个几把，这种一眼假的新闻还有100多个人点赞，推特确实傻逼多好骗
时政
( twitter.com)

1年前 • 墙国反贼 • -- 点击 0 评论

瓦特发明了蒸汽机，一夜之间，各种瓦特如雨后春笋，冒了出来。就在这周，人工智能(AI)新物种包括了：Google Bard, Adobe Firefly, NVIDIA Foundations, Bing DALL-E, Opera…
时政
( twitter.com)

1年前 • 亚洲金融 Asia Finance • -- 点击 0 评论

Google Photorealistic 3D Tiles刚发布才几天，已经有了这种超酷的虚拟空间传送系统。

输入你想去哪里，GPT帮你翻译成坐标，Google Map找出来位置，Google Photorealistic 3…
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

#工程师学习前两天 Google I/O 大会上的这个沉浸式体验的 3D 地图实在太厉害了，推出了两个新产品 Aerial View API 和 Photorealistic 3D Tiles，可以让开发者使用 Google E…
IT技术
( twitter.com)

1年前 • Tw93 • -- 点击 0 评论

劈柴：

在去年的 Google I.O. 上，我们宣布了 Google AI 的推出。
这是我们团队的一项集合努力，旨在将 AI 的益处带给每个人。
我们希望这项工作能在全球范围内实施，因此我们正在全球各地设立 AI 中心。
A…
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

近期，Google 又在推一种新的端到端加密协议 – Messaging Layer Security (MLS) protocol。
使用这种协议，理论上可以在两个不同的平台间发送和接收信息，即不仅可以在安卓和 iOS 间发送和接收信息，还可以从 Google message 发送信息到 Telegram，并保持端到端加密的特性。

时政
( anotherdayu.com)

1年前 • Dayu • -- 点击 0 评论

IT技术

Google在AI领域的步伐真的加快了，将推出AI生成广告素材的功能，为商家提供更便捷、高效的广告内容创作。该技术首先用于创建效果最大化的广告。此外，Google还将推出一个名为Google Product Studio的产品，利… IT技术 ( twitter.com)

IT技术

推特中文圈

#Crypto工具推荐 googel推出了ChatGPT插件，能够将 ChatGPT 的回答结果并排展示在 Google 搜索页面，非常好用，推荐~ #ChatGPT #OpenAI 安装地址拿走：… 币圈 ( twitter.com)

币圈

在google随便搜一下就知道加州的税率是多少了，40%个几把，这种一眼假的新闻还有100多个人点赞，推特确实傻逼多好骗 时政 ( twitter.com)

时政

瓦特发明了蒸汽机，一夜之间，各种瓦特如雨后春笋，冒了出来。就在这周，人工智能(AI)新物种包括了：Google Bard, Adobe Firefly, NVIDIA Foundations, Bing DALL-E, Opera… 时政 ( twitter.com)

时政

Google Photorealistic 3D Tiles刚发布才几天，已经有了这种超酷的虚拟空间传送系统。 输入你想去哪里，GPT帮你翻译成坐标，Google Map找出来位置，Google Photorealistic 3… IT技术 ( twitter.com)

IT技术

#工程师学习 前两天 Google I/O 大会上的这个沉浸式体验的 3D 地图实在太厉害了，推出了两个新产品 Aerial View API 和 Photorealistic 3D Tiles，可以让开发者使用 Google E… IT技术 ( twitter.com)

IT技术

劈柴： 在去年的 Google I.O. 上，我们宣布了 Google AI 的推出。 这是我们团队的一项集合努力，旨在将 AI 的益处带给每个人。 我们希望这项工作能在全球范围内实施，因此我们正在全球各地设立 AI 中心。 A… IT技术 ( twitter.com)

IT技术

时政

创建一个新帐户

登录

Google在AI领域的步伐真的加快了，将推出AI生成广告素材的功能，为商家提供更便捷、高效的广告内容创作。该技术首先用于创建效果最大化的广告。此外，Google还将推出一个名为Google Product Studio的产品，利…
IT技术
( twitter.com)

#Crypto工具推荐 googel推出了ChatGPT插件，能够将 ChatGPT 的回答结果并排展示在 Google 搜索页面，非常好用，推荐~
#ChatGPT #OpenAI

安装地址拿走：…
币圈
( twitter.com)

在google随便搜一下就知道加州的税率是多少了，40%个几把，这种一眼假的新闻还有100多个人点赞，推特确实傻逼多好骗
时政
( twitter.com)

瓦特发明了蒸汽机，一夜之间，各种瓦特如雨后春笋，冒了出来。就在这周，人工智能(AI)新物种包括了：Google Bard, Adobe Firefly, NVIDIA Foundations, Bing DALL-E, Opera…
时政
( twitter.com)

Google Photorealistic 3D Tiles刚发布才几天，已经有了这种超酷的虚拟空间传送系统。

输入你想去哪里，GPT帮你翻译成坐标，Google Map找出来位置，Google Photorealistic 3…
IT技术
( twitter.com)

#工程师学习前两天 Google I/O 大会上的这个沉浸式体验的 3D 地图实在太厉害了，推出了两个新产品 Aerial View API 和 Photorealistic 3D Tiles，可以让开发者使用 Google E…
IT技术
( twitter.com)

劈柴：

在去年的 Google I.O. 上，我们宣布了 Google AI 的推出。
这是我们团队的一项集合努力，旨在将 AI 的益处带给每个人。
我们希望这项工作能在全球范围内实施，因此我们正在全球各地设立 AI 中心。
A…
IT技术
( twitter.com)