Valve的僅改Linux驅(qū)動(dòng)團(tuán)隊(duì)在即將發(fā)布的Mesa 24.3版本中,對(duì)RADV(Radeon Vulkan)驅(qū)動(dòng)程序進(jìn)行了改進(jìn),動(dòng)行代碼提升了AMD FSR 2在RDNA 2硬件上的暴漲性能,性能提升高達(dá)228%。僅改 需要注意的動(dòng)行代碼是,這種性能提升是暴漲圍繞FSR2示例應(yīng)用程序,而不是僅改FSR2算法本身。 RADV驅(qū)動(dòng)是動(dòng)行代碼Linux操作系統(tǒng)上AMD GPU的開(kāi)源Vulkan驅(qū)動(dòng),因其開(kāi)源特性而受到社區(qū)用戶的暴漲歡迎。 此前,僅改RADV驅(qū)動(dòng)在啟用FSR 2時(shí)的動(dòng)行代碼性能一直不如AMD官方的AMDVLK/AMDGPU-PRO Vulkan驅(qū)動(dòng),這一性能差距已存在近兩年。暴漲 Valve工程師Samuel Pitoiset通過(guò)重新編寫僅十余行代碼,僅改成功解決了這一問(wèn)題。動(dòng)行代碼 問(wèn)題的暴漲核心在于RADV驅(qū)動(dòng)在FSR 2中處理特定特性的原始對(duì)象剔除(culling)的方式,在渲染前,剔除不必要的原始對(duì)象如三角形和線條可以節(jié)省性能和功耗。 與AMDGPU-Pro驅(qū)動(dòng)相比,RADV在處理W位置為零的原始對(duì)象剔除時(shí)效率較低,導(dǎo)致額外且不必要的計(jì)算,從而降低了FSR 2應(yīng)用的性能。 Samuel Pitoiset通過(guò)調(diào)整AMD NIR代碼,強(qiáng)制在W位置為零時(shí)進(jìn)行剔除,這一改動(dòng)使得RDNA 2 GPU在啟用FSR 2時(shí)RADV驅(qū)動(dòng)的性能提升了228%。 這一改進(jìn)將作為Mesa 24.3-devel的一部分,通過(guò)官方發(fā)布提供給用戶。 |