算力爆发!RTX 4080 SUPER本地AI出图效率起飞

2024年4月8日 17 : 58       电脑报原创

在CES 2024上,NVIDIA正式发布了GeForce RTX 40 SUPER系列显卡,其中的RTX 4080 SUPER相对RTX 4080升级又降价,性价比暴增,为4K游戏玩家提供了上佳的选择。而ROG旗下的ROG STRIX RTX 4080 SUPER OC在一众超公版RTX 4080 SUPER中堪称旗舰级代表作,广受发烧级玩家好评。那么,对于需求大显存和强大算力的AIGC用户来说,RTX 4080 SUPER的使用体验又是如何呢?我们不妨就用ROG STRIX RTX 4080 SUPER OC来实战一下吧。

↓点击视频了解AIGC生产↓


ROG STRIX RTX 4080 SUPER OC:诠释全方位的豪华

ROG STRIX RTX 4080 SUPER OC采用了新的ROG STRIX家族式外观设计,在外观风格上加入了大量赛博朋克世界观的元素。导流壳表面采用极具特色的红蓝渐变配色,左上角设计有经过镜面处理的图腾化ROG信仰Logo,与散热风扇上三只自带霓虹效果的“玩家之眼”相互映衬。

散热配置方面,ROG STRIX RTX 4080 SUPER OC采用全新的散热模组设计,配备包围式金属导流壳、金属背板以及压铸金属框架,大幅增强显卡扛变形的能力。而3.5槽大规模散热系统能提供更大的散热空间和更多的散热鳍片,内部采用均热板直触与热管内埋设计,内置4个8毫米和3个6毫米热管。相比传统的均热板设计,可以让显卡在承受500W的热负载时,温度再降低5℃。

显卡还配备3个Axial-tech轴流风扇,风扇直径达到104mm,可提供更大的风量和风压。并且具备中间风扇反转设计,有效减少扰流,提升散热气流利用率。风扇采用双滚珠轴承,拥有比传统油封轴承更长寿命。该风扇支持0dB技术,可以在GPU核心温度低时完全停转,减少低负载时的噪声。显卡尾部还具备2个PWM FanConnectⅡ接口,玩家可以根据需求连接风扇,提升平台整体的散热性能。

供电部分,ROG STRIX RTX 4080 SUPER OC采用超合金数字供电方案,GPU部分使用了MP2888A控制芯片+MP86992(70A)MOSFET,显存部分使用UP9529QQKF+SIC654A(50A)供电方案,可为显卡高频状态运行提供充足而稳定的动力。另外,ROG STRIX RTX 4080 SUPER OC也采用了华硕全自动化制程技术,可以有效消除生产中的人为失误,带来更高的耐用性。

接口部分,ROG STRIX RTX 4080 SUPER OC提供了3个DP 1.4接口和2个HDMI 2.1接口,满足玩家组建多显示器系统和8K分辨率、高刷新率显示器的需求没有任何问题。规格方面,ROG STRIX RTX 4080 SUPER OC的默认的加速频率为2640MHz,OC模式下的加速频率为2670MHz,相比公版频率高出不少(公版为2550MHz)。

大家都知道,Stable Diffusion是当下最火的本地AI出图工具,RTX 4080 SUPER拥有强悍的算力和16GB超大显存,并且拥有无与伦比的CUDA生态,因此也是运行它最高效、兼容性最好的装备。那么接下来就看看ROG STRIX RTX 4080 SUPER OC实际的AI出图表现吧。

超大显存+强劲算力,RTX 4080 SUPER出图太犀利

测试平台

显卡:ROG STRIX RTX 4080 SUPER OC

处理器:Intel酷睿i9 14900K

内存:芝奇DDR5 6000 16GB×2

主板:ROG MAXIMUS Z790 HERO

硬盘:WD_BLACK SN850X 2TB

电源:ROG THOR雷神1200W Platinum II

操作系统:Windows 11专业版23H2

▲生成10张分辨率为512×512的图片,ROG STRIX RTX 4080 SUPER OC仅花费47秒

我们先用Stable Diffusion跑个赛博小姐姐试试,使用麦橘唯美模型、DPM++ 2K Karras采样方式、512×512分辨率、迭代步数50、提示词引导系数7、每批次1张一共10批次,随机种子这里固定为14方便测试对比。从测试结果来看,一共10张图,ROG STRIX RTX 4080 SUPER OC仅花费47秒,效率相当高。

▲把分辨率提升到1024×1024再生成10张图,ROG STRIX RTX 4080 SUPER OC也只花费了99.5秒

觉得512×512分辨率不够用?没关系,我们可以直接把分辨率提升到1024×1024,数量还是1×10张,这样虽然对显存的要求变高了,但RTX 4080 SUPER的16GB大显存依然没有压力,完成的时间为99.5秒,像素量提升到原来的4倍,而时间只增加了一倍多一点点,可见ROG STRIX RTX 4080 SUPER OC出图真的很强。

▲使用高清修复,将刚才生成的512×512图片提升到2048×2048,ROG STRIX RTX 4080 SUPER OC使用时间仅为44.8秒

我们知道,Tile模型的作用之一就是高清修复模糊图片,这里用之前生成的一张512×512的赛博小姐姐图片,放入Tile模型修复,并将分辨率提升4倍至2048×2048,可以看到修复后的整张图片确实精细了很多,增加了不少细节。而ROG STRIX RTX 4080 SUPER OC完成这个操作仅花了44.8秒,而且16GB超大显存在这里也发挥了巨大的作用,让高分辨率AI计算成为可能。

光是ROG STRIX RTX 4080 SUPER OC自己秀肌肉大家可能还感受不到它AI出图的强大性能,所以这里我们用NVIDIA官方的标准来进行了对比。具体设置方面,采样方式为Euler a、采样步数为50、CFG Scale为7.5、每批次出图数为2、批次为10,最后统计每分钟出图数量。可以看到,ROG STRIX RTX 4080 SUPER OC的出图速度大约是RTX 4080的105%,相对RTX 3080 Ti更是提升了42%之多,而相对酷睿i9 13900K来讲的话,则是快了181倍。

此外,RTX 系列GPU还可以通过NVIDIA的TensorRT优化模型,从而进一步大幅提升Stable Diffusion的出图速度。我们使用NVIDIA TensorRT分别对Stable Diffusion XL和Stable Diffusion V1.5的模型进行了优化,由此来对比优化前后ROG STRIX RTX 4080 SUPER OC出图效率的变化。在使用Stable Diffusion V1.5的模型时,我们分别选用了512×512、768×768的出图分辨率,而在使用Stable Diffusion XL模型时选用了1024×1024的出图分辨率(与训练模型的图片分辨率相同)。其他参数方面,采样方式为Euler a、采样步数为50、CFG Scale为7、每批次出图数为1、批次为10。

从测试结果可以看到,使用TensorRT后,ROG STRIX RTX 4080 SUPER OC在三种环境下出图的速度提升了101%、142%和104%,都达到了翻倍以上的增幅,可见TensorRT的效果的确非常出色,值得Stable Diffusion玩家使用——当然,也要搭配ROG STRIX RTX 4080 SUPER OC这样的AI利器才能让它发挥作用。

总结:

RTX 4080 SUPER不光是4K游戏利器,AIGC一样犀利无比

从前面的测试可以看到,ROG STRIX RTX 4080 SUPER OC凭借强大的算力和16GB超大显存的加持,在Stable Diffusion中不但提供了非常强悍的出图效率,也拥有出色的高分辨率出图适应性,确实称得上是远超主流显卡的高端AI出图利器。此外,我们也看到ROG STRIX RTX 4080 SUPER OC拥有豪华的用料与精湛的做工,这也确保了它在满载出图的过程中可以提供可靠的稳定性。总而言之,如果你需要一款能够同时提供4K高帧游戏体验与强悍AI算力的高端装备,那么ROG STRIX RTX 4080 SUPER OC确实是个很好的选择。


  • ......

分享到:

评论区(0条)

  • 您还没有登录,无法评论,请先登录登录