數(shù)據(jù)多副本保留:AI時代企業(yè)存儲的戰(zhàn)略重點
預計到2028年,AI的應用將促使企業(yè)數(shù)據(jù)存儲需求呈現(xiàn)指數(shù)級增長態(tài)勢。根據(jù)我們于2024年11月開展的一項調(diào)查顯示,在主要依賴云存儲管理AI數(shù)據(jù)的基礎(chǔ)設(shè)施采購決策者中,61%的受訪者預計其存儲需求到2028年將至少實現(xiàn)翻番。驅(qū)動這一需求增長的關(guān)鍵因素包括:
數(shù)據(jù)保留周期的顯著延長(從6個月延長至永久保存);
- 73%的受訪者表示,他們采用了每日或每周一次的大型語言模型(LLM)檢查點機制
- 80%的受訪者認為數(shù)據(jù)多副本對于AI數(shù)據(jù)管理“至關(guān)重要”或“較為重要”。
在已使用或計劃使用AI的存儲采購決策者中,95%的受訪者正采取措施應對不斷增長的存儲需求,其中:
- 61%的受訪者正轉(zhuǎn)向更具擴展性的存儲解決方案,
- 56%的受訪者選擇實施數(shù)據(jù)管理軟件,
- 49%的受訪者采用數(shù)據(jù)壓縮技術(shù),
- 55%的受訪者則決定升級現(xiàn)有存儲基礎(chǔ)設(shè)施。
我們的研究揭示,無論AI技術(shù)應用于哪個領(lǐng)域,企業(yè)都需對現(xiàn)有存儲實踐進行升級,以充分挖掘AI的潛力。
超越傳統(tǒng)存儲模式適應變革
隨著存儲需求的持續(xù)增長,云端與本地存儲(On-premises storage)的使用量預計都將穩(wěn)步增加。根據(jù)1062位受訪者的反饋,云存儲仍將是AI數(shù)據(jù)存儲的主流模式。
2024年,65%的AI數(shù)據(jù)存儲于云端,預計到2028年,這一比例將提升至69%(見圖1)。
圖1:客戶存儲中云存儲占比的現(xiàn)狀與未來趨勢
在主要使用云存儲的受訪者中,**61%**預計未來三年內(nèi)的存儲需求將增長超過一倍。
此外,46%的受訪者認為現(xiàn)有的數(shù)據(jù)存儲方式難以滿足日益增長的需求。因此,企業(yè)正在采用更多新型數(shù)據(jù)存儲解決方案,以應對AI生成的日益龐大的文件數(shù)量和文件大?。ㄒ妶D2)。具體措施涵蓋:
- 61%的受訪者擴大了云存儲解決方案的應用范圍,
- 55%的受訪者選擇升級現(xiàn)有基礎(chǔ)設(shè)施,
- 56%的受訪者采用了更強大的數(shù)據(jù)管理軟件,
- 49%的受訪者則實施了數(shù)據(jù)壓縮技術(shù)。
圖2:企業(yè)為應對AI驅(qū)動的數(shù)據(jù)增長所采取的措施
AI基礎(chǔ)設(shè)施的關(guān)鍵構(gòu)成部分
調(diào)查表明,從AI基礎(chǔ)設(shè)施采購者的角度來看,存儲被視為AI基礎(chǔ)設(shè)施第二重要的組成部分,僅次于安全(見圖3)。
圖3:AI基礎(chǔ)設(shè)施各組成部分的重要性排名
- 25%的受訪者認為安全是最重要的基礎(chǔ)設(shè)施要素,
- 18%的受訪者則選擇了存儲。
- 此外,66%的受訪者將存儲列入其前四大基礎(chǔ)設(shè)施關(guān)注點,
- 68%的受訪者則將安全列入前四大關(guān)注點。
盡管算力和能源消耗在過去幾年一直是AI領(lǐng)域的熱門話題,但從存儲基礎(chǔ)設(shè)施采購決策者的角度來看,存儲和安全的重要性更為突出。
AI模型的數(shù)據(jù)保留推動存儲增長
在已采納AI技術(shù)的受訪者中,90%的受訪者認為延長數(shù)據(jù)存儲周期能夠顯著提升AI的輸出效果(見圖4)。其中,93%的受訪者表示,由于實施AI及提升模型精度(包括檢查點機制),他們的數(shù)據(jù)保留需求發(fā)生了變化。
企業(yè)使用的存儲容量越多,越傾向于認為更長的數(shù)據(jù)保留期能提升AI輸出質(zhì)量(見圖4)。
圖4:不同存儲使用量企業(yè)對更長數(shù)據(jù)保留周期提升AI效果的認知
此外,數(shù)據(jù)多副本在企業(yè)AI數(shù)據(jù)管理戰(zhàn)略中的重要性,也推動了企業(yè)存儲使用量的增加(見圖4)。
在當前已使用AI并擁有超過100PB存儲容量的企業(yè)受訪者中,52%的受訪者認為數(shù)據(jù)多副本對提升AI效果具有至關(guān)重要的作用。
73%的受訪者指出,AI模型訓練推動了數(shù)據(jù)存儲需求的增長,原因在于他們需要每日或每周對先前保存的AI檢查點數(shù)據(jù)進行備份(見圖5)。存儲AI檢查點數(shù)據(jù)不僅直接增加了存儲需求,還促使基礎(chǔ)設(shè)施采購者考慮在大型語言模型訓練過程中,每個檢查點數(shù)據(jù)的具體保存周期。
在每日保存檢查點的受訪企業(yè)中(占總數(shù)的28%):
- 32%的企業(yè)將檢查點數(shù)據(jù)保留12個月以上,
- 29%的企業(yè)保留6到12個月。
對于當前存儲容量已達到100PB以上的企業(yè)而言,他們通常以每日或每周的頻率保存并備份檢查點數(shù)據(jù),其中87%的企業(yè)選擇將這些檢查點數(shù)據(jù)存儲在云端,或同時采用HDD和SSD的混合存儲方案(見圖6)。
圖5:不同存儲使用量企業(yè)AI模型訓練檢查點的保存頻率
圖6:擁有100PB以上存儲的企業(yè)檢查點備份頻率與存儲位置
AI應用的普及將持續(xù)推動未來存儲需求增長
隨著AI應用場景的不斷拓展和普及,Recon Analytics預計企業(yè)的存儲需求將呈現(xiàn)指數(shù)級增長態(tài)勢。當企業(yè)從AI的早期試驗階段逐步過渡到激活狀態(tài)并深入應用AI時,這一趨勢將愈發(fā)明顯。
訓練大型語言模型(LLM)、實施數(shù)據(jù)多副本策略、延長數(shù)據(jù)保留周期均是AI戰(zhàn)略中的關(guān)鍵要素,
而這些要素的成功實施均需企業(yè)加大對存儲基礎(chǔ)設(shè)施的投資力度。
參考資料:Klaassen, M. (2025, January 10). AI adoption will impact corporate storage requirements. Recon Analytics. https://reconanalytics.com/impact-of-ai-on-corporate-storage-requirements/
本文轉(zhuǎn)載自??Andy730??,作者:常華Andy
