您当前的位置: 首页 > 图像影音设计 > 正文
用手机扫一扫点击访问

Imagen Video官网

添加时间2024-08-11 浏览:7人次 TDK更新时间:2024-08-16

腾讯是否拦截 未知 网址是否可以访问 未知
备案号 备案主体
备案类型 审核时间
公告声明:本站仅提供网站信息发布展示,请谨慎判断网站真伪,如果发现网站违法请联系我们删除QQ50169001
百度权重 移动权重 360权重 神马权重 搜狗权重 头条权重 更新权重
点击更新
    特别声明

    本站提供的Imagen Video官网信息,均来源于互联网。我们致力于确保所有收录内容在收录时均符合法律法规。本站严格遵守版权法,尊重著作权人的合法权益。 若发现收录内容存在侵权或违法行为,请及时与我们联系。我们将迅速采取措施,断开相关链接并彻底删除侵权内容。请注意,由于网站域名可能经历过期、删除或重新注册等变更,原有链接可能不再代表本站立场。 我们不声明也不保证链接内容的准确性和可靠性。访问者应自行判断链接内容,并对其访问行为负责。如有风险,由访问者自行承担。 我们提醒所有用户:请遵守国家法律法规,谨慎选择并访问网络链接。

    Imagen Video官网
    Imagen,这是一种文本到图像的扩散模型,具有前所未有的真实感和深度的语言理解。Imagen 建立在大型 Transformer 语言模型在理解文本方面的强大功能之上,并依赖于扩散模型在高保真图像生成方面的优势。 我们的关键发现是,在纯文本语料库上预训练的通用大型语言模型(例如 T5)在为图像合成编码文本方面非常有效:增加 Imagen 中语言模型的大小可以大大提高样本保真度和图像-文本对齐不仅仅是增加图像扩散模型的大小。 Imagen 在 COCO 数据集上获得了 7.27 的新的最先进的 FID 分数,而无需在 COCO 上进行训练,并且人类评估者发现 Imagen 样本在图像-文本对齐方面与 COCO 数据本身相当。为了更深入地评估文本到图像模型,我们引入了 DrawBench,这是一个用于文本到图像模型的全面且具有挑战性的基准。 使用 DrawBench,我们将 Imagen 与最近的方法(包括 VQ-GAN+CLIP、潜在扩散模型和 DALL-E 2)进行比较,发现人类评分者在并排比较中更喜欢 Imagen,无论是在样本质量方面和图文对齐。