铁书网

字:
关灯 护眼
铁书网 > 重生之AI教父 > 378. 绘图AI的三种形式

378. 绘图AI的三种形式

大赛金奖的那副便是midjourney的作品。

    按理来说,这个路线更具美感,既能够起到震撼宣传的效果,又能吸引大量用户,应该是上上之选。

    不过对比开源的扩散模型办法,midjourney使用的是公共平台机器人来处理用户的请求。

    由于其封闭盈利的模式,孟繁岐对这款ai的具体技术细节知之甚少,也不清楚它最为核心的技术关键是什么,因而只得放弃这条线路。

    “如果从前世的知名度和受欢迎情况来看,扩散模型和midjourney会更加稳定,不过dalle在我重生前已经和chatgpt进行了组合,有非常大的潜力,考虑到以后的发展情况的话我需要对两者路线进行融合。”

    正是因为需要集两家之长处,孟繁岐的扩散绘图ai才会比预期要晚了几個月。

    最终形成了一个比较成熟的压缩、扩散、和隐空间再扩散三步走的系统。

    这种整体做法的实验、讨论和最终确定,耗费的时间甚至比正式训练还要久。

    “也不知道量子计算机这种计算性能数量级提升的东西什么时候能弄出来,如果算力够快,其实能省事不少。”孟繁岐想起这件事情还是觉得疲倦。

    之所以要拆分出这么多模块,其中最大的原因就是计算资源消耗的问题。

    图像的分辨率是平方,t方法内的运算又有维度上平方的操作,用户觉得256和512分辨率的图片差不多,可反应到全局则往往会是一个数量级的提升。

    为此,只得将扩散模型的学习步骤放到低纬度空间里进行采样。

    说直白点,就是先把分辨率搞低,从而极大地减少扩散前后步骤的计算量。

    “这样做会不会有损性能?使得生成的图片效果不够好?”决定发布这版本算力上有所阉割的扩散模型,closeai内部>> --
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈
热门推荐
网络神豪:打赏直播十倍返利陆小姐独美后,六个哥哥跪求原谅九州,开局忽悠项羽做我哥末世:开局混沌神雷,为所欲为半岛的星辰舔狗五年,我成女帝夫君你哭什么?