游客發(fā)表
發(fā)帖時(shí)間:2024-12-29 14:49:59
11月11日消息,只需據(jù)Phoronix報(bào)道,行代英特爾的實(shí)現(xiàn)升Linux內(nèi)核測(cè)試機(jī)器人報(bào)告稱,主線Linux內(nèi)核的內(nèi)能提性能提高了3888.9%。
測(cè)試機(jī)器人稱,核性在Intel Xeon Platinum (Cooper Lake)測(cè)試服務(wù)器上運(yùn)行“will-it-scale.per_process_ops”可擴(kuò)展性測(cè)試用例中,只需性能提升了高達(dá)3888.9%。行代
這一提升主要?dú)w功于一個(gè)關(guān)鍵的實(shí)現(xiàn)升代碼提交,即“mm,內(nèi)能提 mmap: limit THP alignment of anonymous mappings to PMD-aligned sizes”。
該補(bǔ)丁信息顯示,核性自提交efa7df3e3bb5以來,只需沒有特定地址提示且至少為PMD_SIZE的行代匿名內(nèi)存的mmap()將與PMD對(duì)齊,以便從THP backing page中受益。實(shí)現(xiàn)升
然而,內(nèi)能提這種變化也導(dǎo)致了一些工作負(fù)載的核性性能下降,例如,在某些平臺(tái)上cactusBSSN基準(zhǔn)測(cè)試的速度下降了600%。
基準(zhǔn)測(cè)試似乎創(chuàng)建了許多4632kB的映射,這些映射在提交efa7df3e3bb5之前會(huì)合并到一個(gè)大的THP-backed area,現(xiàn)在它們被分割成多個(gè)區(qū)域,每個(gè)區(qū)域都與PMD邊界對(duì)齊,中間有間隙,導(dǎo)致性能下降。
Intel也提出了一個(gè)解決方案:添加一個(gè)條件,即映射的大小必須是PMD大小的倍數(shù),而不是至少是PMD大小。
這將使得那些odd-sized mapping不再對(duì)齊并留有間隙,而是會(huì)自然地再次合并。
相關(guān)內(nèi)容
隨機(jī)閱讀
熱門排行
友情鏈接