騰訊云存儲(chǔ)創(chuàng)新技術(shù):借助GooseFS助力AIGC等場景下的數(shù)據(jù)訪問加速
原創(chuàng)在數(shù)字化和智能化快速發(fā)展的今天,對(duì)象存儲(chǔ)以其高擴(kuò)展性和低成本優(yōu)勢,成為海量數(shù)據(jù)存儲(chǔ)的首選方案。然而,隨著大數(shù)據(jù)分析、AIGC(人工智能生成內(nèi)容)等涉及海量數(shù)據(jù)計(jì)算的場景快速發(fā)展,對(duì)象存儲(chǔ)面臨著嚴(yán)重的性能挑戰(zhàn)。
為了應(yīng)對(duì)挑戰(zhàn),騰訊云存儲(chǔ)團(tuán)隊(duì)推出了基于對(duì)象存儲(chǔ)搭建的分布式高性能文件系統(tǒng)GooseFS。在NAS2024大會(huì)上,騰訊云存儲(chǔ)團(tuán)隊(duì)提交的《GooseFS:分布式緩存服務(wù)以提高云對(duì)象存儲(chǔ)性能》論文成功入選會(huì)議論文,充分展現(xiàn)了騰訊云在對(duì)象存儲(chǔ)領(lǐng)域的技術(shù)創(chuàng)新實(shí)力。
AIGC等應(yīng)用場景下,對(duì)象存儲(chǔ)面臨諸多挑戰(zhàn)
雖然對(duì)象存儲(chǔ)具備高擴(kuò)展性和低成本等優(yōu)勢,能夠承載TB級(jí)別甚至PB級(jí)別的數(shù)據(jù)量,滿足了海量數(shù)據(jù)存儲(chǔ)的需求,但是隨著大數(shù)據(jù)分析、AIGC等場景的快速發(fā)展,對(duì)象存儲(chǔ)也面臨著嚴(yán)重的性能挑戰(zhàn)。
在騰訊云數(shù)據(jù)湖存儲(chǔ)GooseFS負(fù)責(zé)人程力看來,在AIGC等場景下,對(duì)象存儲(chǔ)主要面臨時(shí)延高、吞吐低、元數(shù)據(jù)操作慢三大主要挑戰(zhàn)。
首先,對(duì)象存儲(chǔ)的數(shù)據(jù)組織和實(shí)現(xiàn)方式導(dǎo)致其時(shí)延較高,無法滿足對(duì)低時(shí)延要求較高的應(yīng)用場景。
其次,對(duì)象存儲(chǔ)的存儲(chǔ)介質(zhì)性能不足,限制了其吞吐能力的提升,難以滿足大數(shù)據(jù)分析和AIGC等場景下的高吞吐需求。
最后,對(duì)象存儲(chǔ)的元數(shù)據(jù)操作性能表現(xiàn)一般,影響了數(shù)據(jù)訪問的效率和準(zhǔn)確性。
騰訊云存儲(chǔ)產(chǎn)品總經(jīng)理陳崢表示,性能問題嚴(yán)重限制了對(duì)象存儲(chǔ)在大數(shù)據(jù)分析和AIGC等場景下的應(yīng)用,亟需一種高效的技術(shù)方案來解決這些問題。為此,騰訊云存儲(chǔ)團(tuán)隊(duì)基于對(duì)象存儲(chǔ)研發(fā)了一套分布式緩存架構(gòu),這個(gè)架構(gòu)支持計(jì)算端的緩存技術(shù)、 Storage-Side存儲(chǔ)端的緩存技術(shù)和元數(shù)據(jù)操作的加速技術(shù),這也就是GooseFS的整體技術(shù)框架。
三個(gè)關(guān)鍵設(shè)計(jì),加速對(duì)象存儲(chǔ)數(shù)據(jù)訪問
在GooseFS中,引入了三個(gè)關(guān)鍵設(shè)計(jì),來實(shí)現(xiàn)在存算分離架構(gòu)下對(duì)對(duì)象存儲(chǔ)的加速訪問。
一是計(jì)算端緩存加速。在計(jì)算端,GooseFS將離計(jì)算資源更近的本地盤作為緩存介質(zhì)存放部分對(duì)象存儲(chǔ)數(shù)據(jù),實(shí)現(xiàn)計(jì)算對(duì)數(shù)據(jù)的就近訪問,降低延遲。同時(shí),通過多級(jí)粒度緩存管理和短路讀機(jī)制,GooseFS降低了隨機(jī)小IO下的數(shù)據(jù)訪問時(shí)延。
程力表示, GooseFS支持多種存儲(chǔ)粒度的緩存管理,如4K、8K、16K、64K等。不同存儲(chǔ)粒度的數(shù)據(jù)在緩存中的表現(xiàn)不同,通過多級(jí)粒度緩存管理,可以更有效地利用緩存空間,提高緩存命中率。此外,GooseFS還支持短路讀機(jī)制,當(dāng)計(jì)算節(jié)點(diǎn)需要讀取數(shù)據(jù)時(shí),GooseFS會(huì)優(yōu)先從本地緩存中讀取。如果本地緩存中沒有所需數(shù)據(jù),再從對(duì)象存儲(chǔ)中拉取。這種機(jī)制減少了網(wǎng)絡(luò)傳輸?shù)拈_銷,提高了數(shù)據(jù)讀取的效率。
二是存儲(chǔ)端緩存加速。在存儲(chǔ)端,GooseFS構(gòu)建了高性能SSD緩存池,為計(jì)算節(jié)點(diǎn)提供存儲(chǔ)端的緩存支持。這解決了對(duì)象存儲(chǔ)介質(zhì)性能不足的問題,提高了面對(duì)順序IO時(shí)的吞吐率。據(jù)介紹,GooseFS利用高性能SSD構(gòu)建緩存池,提供高速的數(shù)據(jù)讀寫能力。當(dāng)計(jì)算節(jié)點(diǎn)需要寫入數(shù)據(jù)時(shí),可以先將數(shù)據(jù)寫入SSD緩存池,再由緩存池異步寫入對(duì)象存儲(chǔ)。這種機(jī)制提高了數(shù)據(jù)寫入的效率,減少了對(duì)象存儲(chǔ)的壓力。
三是元數(shù)據(jù)加速。GooseFS自研了一套高性能元數(shù)據(jù)引擎,通過元數(shù)據(jù)分級(jí)管理、強(qiáng)一致性緩存和平行擴(kuò)展等技術(shù)手段來提升元數(shù)據(jù)讀寫性能。同時(shí),將元數(shù)據(jù)持久化到底層的企業(yè)級(jí)數(shù)據(jù)庫中,以此大幅提升了元數(shù)據(jù)處理的效率。
實(shí)驗(yàn)結(jié)果表明,相比原生對(duì)象存儲(chǔ),GooseFS的吞吐量提升了8~10倍,同時(shí)降低了90%的存儲(chǔ)帶寬消耗,滿足了多種工作負(fù)載對(duì)高性能要求。
據(jù)程力介紹,在AIGC場景中,模型訓(xùn)練需要處理大量的數(shù)據(jù),對(duì)存儲(chǔ)的性能要求較高。GooseFS通過加速數(shù)據(jù)訪問,提高了模型訓(xùn)練的效率和準(zhǔn)確性,降低了訓(xùn)練成本。在大數(shù)據(jù)分析場景中,需要對(duì)海量數(shù)據(jù)進(jìn)行處理和分析。GooseFS通過提高存儲(chǔ)吞吐量和降低時(shí)延,加速了數(shù)據(jù)分析的速度,提升了數(shù)據(jù)處理的效率和質(zhì)量。
除此之外,在智能推薦場景中,需要根據(jù)用戶的行為和興趣進(jìn)行實(shí)時(shí)推薦。GooseFS通過加速數(shù)據(jù)訪問和元數(shù)據(jù)操作,提高了推薦系統(tǒng)的響應(yīng)速度和準(zhǔn)確性,提升了用戶體驗(yàn)。
目前,GooseFS已經(jīng)服務(wù)了蔚來、博世、百川、高途、燃數(shù)、酷狗等一大批客戶,在多個(gè)應(yīng)用場景中展現(xiàn)了其卓越的性能優(yōu)勢。
多項(xiàng)創(chuàng)新技術(shù)加持,攜手業(yè)界共同推動(dòng)對(duì)象存儲(chǔ)發(fā)展
GooseFS的技術(shù)創(chuàng)新不僅體現(xiàn)在其卓越的性能優(yōu)勢上,還體現(xiàn)在其靈活部署、高可用性和強(qiáng)一致性等方面。
1)靈活部署:GooseFS支持靈活部署,可以根據(jù)業(yè)務(wù)需求動(dòng)態(tài)調(diào)整緩存容量和節(jié)點(diǎn)數(shù)量。同時(shí),GooseFS支持多種存儲(chǔ)介質(zhì)和操作系統(tǒng),具有廣泛的適用性和兼容性。
2)高可用性:GooseFS通過利用Raft協(xié)議和企業(yè)級(jí)數(shù)據(jù)庫進(jìn)行元數(shù)據(jù)持久化存儲(chǔ),保證了系統(tǒng)的高可用性。即使在某些節(jié)點(diǎn)出現(xiàn)故障時(shí),也能快速恢復(fù)數(shù)據(jù)訪問能力,保證業(yè)務(wù)的連續(xù)性和穩(wěn)定性。
3)強(qiáng)一致性:GooseFS的讀寫操作都是強(qiáng)一致的,即寫入后的數(shù)據(jù)可以立即被讀取到。這保證了數(shù)據(jù)訪問的準(zhǔn)確性和可靠性,避免了數(shù)據(jù)不一致帶來的潛在風(fēng)險(xiǎn)。
從業(yè)界發(fā)展來看,GooseFS的技術(shù)方案已經(jīng)得到了廣泛的認(rèn)可和關(guān)注。除了騰訊云之外,阿里、火山引擎等廠商也在積極研發(fā)類似的緩存+高性能文件系統(tǒng)方案。同時(shí),一些開源廠商和初創(chuàng)企業(yè)也在該領(lǐng)域進(jìn)行探索和創(chuàng)新。在多方的共同努力下,對(duì)象存儲(chǔ)技術(shù)的發(fā)展也有了巨大的進(jìn)步。
寫在最后:
作為創(chuàng)新技術(shù), GooseFS通過引入計(jì)算端緩存加速、存儲(chǔ)端緩存加速和元數(shù)據(jù)加速等關(guān)鍵設(shè)計(jì),實(shí)現(xiàn)了對(duì)對(duì)象存儲(chǔ)的加速訪問。實(shí)驗(yàn)結(jié)果表明,相比原生對(duì)象存儲(chǔ),GooseFS的吞吐量提升了8~10倍,同時(shí)降低了90%的存儲(chǔ)帶寬消耗。目前, GooseFS已經(jīng)服務(wù)了多家知名企業(yè),在AIGC、大數(shù)據(jù)分析和智能推薦等應(yīng)用場景中展現(xiàn)了其卓越的性能優(yōu)勢。
不難發(fā)現(xiàn),隨著未來數(shù)字化和智能化的不斷深入發(fā)展,對(duì)象存儲(chǔ)將面臨更多的挑戰(zhàn)和機(jī)遇。騰訊云存儲(chǔ)團(tuán)隊(duì)將繼續(xù)致力于技術(shù)創(chuàng)新和產(chǎn)品研發(fā),為用戶提供更加高效、可靠和智能的存儲(chǔ)解決方案。同時(shí),騰訊云存儲(chǔ)也將積極與業(yè)界合作伙伴進(jìn)行交流和合作,共同推動(dòng)對(duì)象存儲(chǔ)技術(shù)的發(fā)展和進(jìn)步。