微信扫码登录,收藏工具可显示到首页
让您更快捷的在首页直接访问你喜爱的工具。
最先进的文本到图像转换技术
Imagen研究亮点
- 我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。
- 我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。
- 我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。
- 我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。
- 在COCO上,我们实现了7.27的最新COCO FID并且人类评价者发现Imagen样本在图像-文本对齐方面与参考图像不相上下。