微软开源的一个文本编码器Glyph-ByT5-v2。
支持使用十多种语言生成图片。
还搭配了一个使用这个文本编码器的 SDXL 模型,可以直接生成中文海报和内容。
从演示来看排版都挺好的。
1) 创建了一个高质量的多语言字形文本和图形设计数据集,包含超过100万个字形文本对和1000万个图形设计图像文本对,覆盖另外九种语言;
2) 构建了一个多语言视觉段落基准数据集,包括1000个提示,每种语言100个,用于评估多语言视觉拼写准确性;
3) 采用最新的步进感知偏好学习方法,提高了视觉美学质量。
模型下载:https://t.co/QNHRNOrI65
点击图片查看原图