Imagen Video官网
公告声明:本站仅提供网站信息发布展示,请谨慎判断网站真伪,如果发现网站违法请联系我们删除QQ50169001
百度权重 |
移动权重 |
360权重 |
神马权重 |
搜狗权重 |
头条权重 |
更新权重 |
|
|
|
|
|
|
点击更新
|
特别声明
本站提供的Imagen Video官网信息,均来源于互联网。我们致力于确保所有收录内容在收录时均符合法律法规。本站严格遵守版权法,尊重著作权人的合法权益。
若发现收录内容存在侵权或违法行为,请及时与我们联系。我们将迅速采取措施,断开相关链接并彻底删除侵权内容。请注意,由于网站域名可能经历过期、删除或重新注册等变更,原有链接可能不再代表本站立场。
我们不声明也不保证链接内容的准确性和可靠性。访问者应自行判断链接内容,并对其访问行为负责。如有风险,由访问者自行承担。
我们提醒所有用户:请遵守国家法律法规,谨慎选择并访问网络链接。
Imagen,这是一种文本到图像的扩散模型,具有前所未有的真实感和深度的语言理解。Imagen 建立在大型 Transformer 语言模型在理解文本方面的强大功能之上,并依赖于扩散模型在高保真图像生成方面的优势。
我们的关键发现是,在纯文本语料库上预训练的通用大型语言模型(例如 T5)在为图像合成编码文本方面非常有效:增加 Imagen 中语言模型的大小可以大大提高样本保真度和图像-文本对齐不仅仅是增加图像扩散模型的大小。
Imagen 在 COCO 数据集上获得了 7.27 的新的最先进的 FID 分数,而无需在 COCO 上进行训练,并且人类评估者发现 Imagen 样本在图像-文本对齐方面与 COCO 数据本身相当。为了更深入地评估文本到图像模型,我们引入了 DrawBench,这是一个用于文本到图像模型的全面且具有挑战性的基准。
使用 DrawBench,我们将 Imagen 与最近的方法(包括 VQ-GAN+CLIP、潜在扩散模型和 DALL-E 2)进行比较,发现人类评分者在并排比较中更喜欢 Imagen,无论是在样本质量方面和图文对齐。