亚洲嫩模在线观看,日韩视频特黄色大片,乱色中文视频在线,动漫免费观看

搜索

小紅書將業(yè)界最大數(shù)據(jù)湖遷至阿里云

發(fā)表于 2024-12-29 13:50:51 來源:下愚不移網

記者獲悉,小紅經過一年奮戰(zhàn),書將數(shù)據(jù)小紅書已把業(yè)界體量最大的業(yè)界數(shù)據(jù)湖0故障遷上阿里云。據(jù)統(tǒng)計,最大至該項目共有1500人參與,湖遷遷移數(shù)據(jù)500PB。小紅

作為中國頭部互聯(lián)網公司之一,書將數(shù)據(jù)小紅書月活已過3億,業(yè)界其數(shù)據(jù)湖存儲了過去11年的最大至所有原始數(shù)據(jù),包括結構化、湖遷半結構化和非結構化數(shù)據(jù)。小紅近年來,書將數(shù)據(jù)隨著業(yè)務的業(yè)界高速增長,小紅書在線處理數(shù)據(jù)的最大至需求不斷增加,同時離線處理所積累的湖遷歷史問題,也會在未來的切換中帶來更多成本與風險。

小紅書將業(yè)界最大數(shù)據(jù)湖遷至阿里云

為此,2023年11月,小紅書發(fā)起遷云項目——計劃一年內,把小紅書的數(shù)據(jù)湖搬上阿里云。

遷移至阿里云上后,數(shù)據(jù)湖可通過多個OSS Bucket支持納入統(tǒng)一資源池,實現(xiàn)多個Bucket共享資源池內的OSS吞吐及QPS能力。這樣的流控能力在面向小紅書復雜業(yè)務場景,可靈活調配資源,高效利用吞吐性能,降低不同業(yè)務租戶間的互相影響。阿里云原生HDFS+DLA元數(shù)據(jù)可實現(xiàn)無縫對接Hadoop EMR體系,支持元數(shù)據(jù)線性擴展能力,輕松應對小紅書數(shù)百PB數(shù)據(jù)下的元數(shù)據(jù)線性增長。

較于過往業(yè)界體量最大的案例,小紅書的本次遷移的數(shù)據(jù)體量更大。

*注:任務=數(shù)據(jù)處理過程

(圖片來自小紅書官方公眾號)

據(jù)介紹,小紅書的遷云項目經歷了三個階段。第一步,項目組首先解決標準問題,然后根據(jù)標準進行治理;第二步,完成治理后,項目在2024年5月正式進入雙跑階段。把數(shù)據(jù)拷貝到阿里云上,兩邊同時跑數(shù),驗證正確性與及時性;第三步,2024年8月,項目結束雙跑,進入割接階段。阿里云團隊全程在現(xiàn)場保障,順利完成了割接。

2024年11月,小紅書遷云項目正式宣告結束。在0故障的情況下,遷移數(shù)據(jù)500PB,任務11萬,參與人數(shù)1500人,涉及部門40多個。項目涉及產品之多和數(shù)據(jù)體量之大均創(chuàng)下業(yè)界記錄。

隨機為您推薦
友情鏈接
版權聲明:本站資源均來自互聯(lián)網,如果侵犯了您的權益請與我們聯(lián)系,我們將在24小時內刪除。

Copyright © 2016 Powered by 小紅書將業(yè)界最大數(shù)據(jù)湖遷至阿里云,下愚不移網   sitemap

回頂部