云計算領(lǐng)域正經(jīng)歷自云計算誕生以來最重要的變革之一。架構(gòu)討論曾以大規(guī)模遷移為定義,如今已演變?yōu)橐粋€復(fù)雜的生態(tài)系統(tǒng),受多云采納、工作負載回歸、金融運營成本壓力、人工智能工作負載增長以及中立共置作為云戰(zhàn)略延伸的興起所塑造。
隨著組織在權(quán)益需求、性能需求和成本現(xiàn)實之間取得平衡,云戰(zhàn)略已不再是“將工作負載搬到哪里”,而是“如何構(gòu)建智能擴展的全球分布式架構(gòu)”。這一轉(zhuǎn)變——由人工智能、數(shù)據(jù)增長以及新的財務(wù)和運營限制推動——正在重塑全球私有云、公共云和混合云的采用。
本文探討了推動云轉(zhuǎn)型的力量、新架構(gòu)的興起,以及隨著我們進入數(shù)字化轉(zhuǎn)型新時代,云基礎(chǔ)設(shè)施的未來會是什么樣子。
云的采用不再是將工作負載從本地轉(zhuǎn)移到公有云。當今企業(yè)所處的工作量包括:
分布在多個云端
戰(zhàn)略性地分布在區(qū)域主權(quán)區(qū)
由中立的 colo 站點支持以實現(xiàn)互聯(lián)
配合私有云和本地集群
配備GPU驅(qū)動的AI基礎(chǔ)設(shè)施
這一轉(zhuǎn)變反映了更深層的現(xiàn)實:沒有單一環(huán)境能滿足所有用例。
多云已經(jīng)從戰(zhàn)術(shù)對沖演變成戰(zhàn)略需求。
多云技術(shù)激增的原因:
? 成本優(yōu)化
使用多云使組織能夠利用專業(yè)服務(wù),減少供應(yīng)商鎖定價格。
? 性能與延遲
應(yīng)用程序被放置在運行最佳的位置——靠近用戶、數(shù)據(jù)或互聯(lián)點。
? 合規(guī)監(jiān)管
主權(quán)區(qū)域,某些供應(yīng)商獨有,要求多云采用以符合規(guī)定。
? 人工智能和GPU可用性
AI工作負載通常需要訪問擁有合適GPU的云服務(wù)提供商——這導(dǎo)致了多元化。
? 災(zāi)害韌性
多云架構(gòu)降低了恢復(fù)風(fēng)險并增加了冗余。
云行業(yè)覆蓋趨勢:
現(xiàn)在越來越多的企業(yè)同時使用3到5家云服務(wù)提供商。
多云網(wǎng)絡(luò)和編排工具正在蓬勃發(fā)展。
云區(qū)域持續(xù)擴展以支持數(shù)據(jù)主權(quán)。
AI模型訓(xùn)練越來越多地跨越多個云環(huán)境。
回歸曾被視為云戰(zhàn)略的失敗。如今,它被視為一種正常的優(yōu)化周期。
組織為何將工作負載回歸本地:
1. 成本控制(FinOps 壓力)
云預(yù)算常常難以預(yù)測,原因包括:
出口費用
自動縮放成本
計算價格的提升
人工智能工作負載附加費
組織現(xiàn)在將穩(wěn)定工作負載回歸批發(fā)托管或私有云環(huán)境,從而提升成本可預(yù)測性。
2. 性能優(yōu)化
某些工作負載在裸機、私有云或邊緣環(huán)境中表現(xiàn)更好——尤其是:
人工智能推斷
延遲敏感應(yīng)用
高性能計算
高輸入輸出數(shù)據(jù)庫
3. 數(shù)據(jù)引力
隨著數(shù)據(jù)湖的擴展,將計算遷移到數(shù)據(jù)(而非反過來)變得更加高效。
4. 監(jiān)管要求
某些國家要求數(shù)據(jù)必須留在國境內(nèi)。
5. 人工智能依賴
AI訓(xùn)練集群通常需要公共云無法大規(guī)模實現(xiàn)的密度和冷卻能力。
回國不再是趨勢——它是混合生命周期的一部分。
人工智能正在重新定義云的增長、云經(jīng)濟學(xué)以及工作負載的運行環(huán)境。
人工智能訓(xùn)練將基礎(chǔ)設(shè)施推向極限
訓(xùn)練大型語言模型和大型人工智能模型需要:
大型GPU集群
低延遲互連
高密度冷卻
專用電源
成本效益建筑設(shè)計
并非所有云區(qū)域都能支持這些需求。
AI推理工作負載正逐漸接近用戶
推理需要:
低延遲
邊鄰近性
多云分發(fā)
區(qū)域冗余
中立的托管服務(wù)提供商在這里扮演著重要角色——尤其是那些擁有云端上路和AI準備建設(shè)的設(shè)施。
云服務(wù)提供商正在擴展GPU區(qū)域
近期公告顯示,業(yè)務(wù)將迅速擴展至:
新的主權(quán)地區(qū)
邊緣區(qū)域
GPU專用可用區(qū)
專用AI實例
然而,全球?qū)?/span>GPU的需求遠遠超過供應(yīng),促使企業(yè)采用融合云、托管和私有集群的混合策略。
與早期預(yù)測相反,共置并未減少。它作為一種高度靈活、與云端相鄰的策略正在崛起。
為什么 colo 在云轉(zhuǎn)型中至關(guān)重要:
1. 成本節(jié)約
穩(wěn)定的長期工作負載在共置中通常更便宜。
2. 互聯(lián)靈活性
中性共置可實現(xiàn):
直接云端匝道
多云網(wǎng)格連接
低延遲混合架構(gòu)
訪問內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)
直接訪問SaaS提供商
3. 人工智能基礎(chǔ)設(shè)施準備
許多現(xiàn)代共置設(shè)施支持:
GPU機架
高密度冷卻
液冷
專用電源模塊
私人籠舍和套房
4. 區(qū)域存在
企業(yè)可以在云資源有限或無法提供的特定市場部署。
市場洞察:
與以下機構(gòu)共址請求:
云端入口匝道
AI GPU 準備度
高密度(>50千瓦/機架)
量身定制的選項
私人連接
...在過去18個月里,這一數(shù)字大幅上升。
為了支持現(xiàn)代工作負載,云服務(wù)提供商正在迅速擴展新區(qū)域,尤其是在:
歐洲(主權(quán)區(qū))
中東
亞太地區(qū)
拉丁美洲
北美二級市場
引入了許多區(qū)域,專門滿足:
數(shù)據(jù)駐留
人工智能計算需求
低延遲邊緣增長
地方監(jiān)管壓力
主權(quán)云區(qū)
各國正在執(zhí)行嚴格的本地數(shù)據(jù)政策,推動云服務(wù)提供商:
國內(nèi)建造
組建本地合資企業(yè)
遵守歐盟或國家的人工智能政策
支持公共部門和關(guān)鍵基礎(chǔ)設(shè)施工作負載
主權(quán)云正成為架構(gòu)規(guī)劃的核心元素。
企業(yè)現(xiàn)在深度投資于金融運營——旨在優(yōu)化云支出的財務(wù)運營。隨著云計算成本的增加,治理變得至關(guān)重要。
由FinOps驅(qū)動的云變更包括:
減少過度配置
穩(wěn)定工作負載的返還
增加標記和可見度
多云成本套利
保留實例優(yōu)化
更具成本效益的架構(gòu)決策
組織現(xiàn)在選擇平臺更多基于可預(yù)測的支出——而不僅僅是績效。
明天云環(huán)境的樣貌:
1. 多云默認
大多數(shù)大型組織會通過3+云服務(wù)提供商運營。
2. AI集群將生活在混合環(huán)境中
高密度私有或合作部署培訓(xùn),推理分布在云+邊緣。
3. 遣返將繼續(xù)
主要受成本、密度和架構(gòu)靈活性驅(qū)動。
4. 邊節(jié)點擴展
延遲敏感的應(yīng)用需要接近。
5. 中性口號位于中心
一個連接、性能和可擴展性的樞紐。
6. 云區(qū)倍增
主權(quán)、人工智能優(yōu)化、GPU豐富的可用性區(qū)域上線。
7. 市場簡化云和客戶采購
未來的云是動態(tài)的、全球性的、去中心化的——而且比以往任何時候都更加復(fù)雜。
云不再是一個單一平臺——它是一個全球分布式的服務(wù)、區(qū)域、工作負載和互聯(lián)選擇的結(jié)構(gòu)。隨著組織向多云轉(zhuǎn)型,將成本敏感的工作負載回歸本地,擁抱主權(quán)云區(qū),并構(gòu)建AI兼容架構(gòu),云戰(zhàn)略的未來將需要靈活性、清晰性和技術(shù)紀律。云轉(zhuǎn)型的下一階段不再取決于有多少數(shù)據(jù)遷移到云端,而是工作負載在云、共置、邊緣和私有環(huán)境中智能部署的方式。
人工智能加速了這一演進,推動組織重新思考基礎(chǔ)設(shè)施的設(shè)計、供能、連接和治理方式。中立托管樞紐正成為互聯(lián)和成本管理的關(guān)鍵,而云區(qū)域則向外擴展,以支持數(shù)字主權(quán)、低延遲傳輸和GPU驅(qū)動的創(chuàng)新。與此同時,金融運營壓力迫使組織從默認的云決策轉(zhuǎn)向有意識且財務(wù)負責(zé)的架構(gòu)。
隨著云的成熟,其最大優(yōu)勢將是集成能力——將超大規(guī)模平臺規(guī)模、私有基礎(chǔ)設(shè)施性能、多云管理的靈活性以及人工智能驅(qū)動自動化的智能結(jié)合起來。在這一新環(huán)境中茁壯成長的組織,將是那些構(gòu)建混合型、分布式、全球感知型架構(gòu)的組織,這些架構(gòu)能隨著技術(shù)發(fā)展迅速適應(yīng)。云正在變革——那些擁抱其轉(zhuǎn)變的人將塑造下一代數(shù)字創(chuàng)新。
Copyright ? 2013-2020. All Rights Reserved. 恒訊科技 深圳市恒訊科技有限公司 粵ICP備20052954號 IDC證:B1-20230800.移動站


