讓你真正瞭解雲端,為企業制定策略,不再人雲亦雲!!
許多人明白網路、社群是未來的商機,但該如何在其中找到自身的定位,並且真的獲利,是大多數人的難題。企業如果能夠瞭解雲端運算有何內涵、如何演進,就能夠打造出一套策略,不但可以維繫企業未來的生存,而且還能更上層樓。
企業一旦實行結合雲端運算的商業策略,將可以得到四大利益:
大幅降低的成本:雲端運算讓企業以合理價格獲取原本昂貴的新科技。
無往不利的存取:員工在任何時間、任何地點存取都可以利用雲端運算的伺服器,執行他們需要的程式。
前所未有的彈性:企業能夠以更快的速度來改變作業流程、調整基礎設施。
穩定的網路流量:就算是負載尖峰時段,雲端運算也可以克服瓶頸,充分滿足使用者的需求。
作者簡介:
查爾斯.巴布考克(Charles Babcock)
二十年報導電腦科技重大趨勢的經驗,目前是《資訊周刊》(InformationWeek)特約著述編輯,專精企業網路服務應用、虛擬化、雲端運算。曾擔任《電腦世界》(Computerworld)軟體與技術編輯、《數位新聞》(Digital News》總編輯,目前居住於美國加州舊金山。
譯者簡介:
閻紀宇
台灣大學中國文學研究所碩士。現為中國時報國際新聞中心副主任。
譯作有《大家來看賈伯斯》、《人見人愛的華麗社交》、《當知識份子遇到政治》、《遮蔽的伊斯蘭》、《中國即將崩潰》、《魔鬼詩篇》等,譯著頗豐,並同時為《讀者文摘》、《哈佛商業評論》譯者。
章節試閱
緒 論
提到「雲端運算」,許多人都會敬畏三分,彷彿一件大事情正在發生,某個藏身幕後的神祕人士即將揭曉一項驚天動地的計畫,而且這回是真槍實彈。
我認為人們之所以會產生這種印象,原因在於媒體不時報導Google、雅虎(Yahoo!)、微軟(Microsoft)、網路零售業鉅子亞馬遜(Amazon)、客戶關係管理服務供應商Salesforce.com、社群網站臉書(Facebook)爭相興建規模龐大的資料中心(data center)。2009年9月,微軟最新一座資料中心在芝加哥正式啟用,一輛大卡車駛進一樓僅有混凝土地板的大廳,卸下一個貨櫃,裡面是成排成列的伺服器。工程人員沒有將伺服器搬出來,而是直接將整個貨櫃接電連線,2,000多部伺服器立刻開始運作。這座資料中心的一樓啟用至今,已有11個伺服器貨櫃先後進駐,未來還可以再容納44個。同一棟大樓的二樓使用高架地板(raised-floor),另一座比較傳統的資料中心已經開始運作。
微軟的芝加哥資料中心可以容納30萬部伺服器,微軟伺服器與工具部門總裁巴伯.馬格利亞(Bob Muglia)表示,據他所知,芝加哥資料中心的規模傲視全球。
在微軟的啟用儀式之前,Google也讓外界一窺其神秘的資料中心。Google的攝影人員拍下一段影片,我們看到一個其貌不揚、好像才剛高中畢業的技師,踩著滑板車行經偌大的倉庫,來到伺服器部門,從架子上抽出一具故障的伺服器,換上一部新的。Google伺服器的厚度不到10公分,發熱部位包上一層金屬隔板,和溫度較低的部分隔絕。一般企業界的資料中心可不會這樣抽換伺服器。換句話說,資料中心已經改朝換代。
Google與亞馬遜是新概念的開路先鋒,微軟和其他公司則追隨它們的腳步,各顯神通。它們建構的資料中心基本上是利用個人電腦元件,每一個伺服器叢集(cluster)由數千部伺服器組成,藉由大規模平行處理(parallel processing)軟體,系統控制軟體可以避開故障的硬體,讓中心運作不至於中斷。當這些條件一一實現時,就代表新一代「雲端」資料中心正式問世。Google無比卓越的網際網路搜尋引擎,動力來自世界各地至少12座雲端資料中心。而且Google正持續擴張資料中心,使用每度只要2美分的廉價水力發電;相較之下,本書編輯工作仰賴的電腦,用電成本高達每度11美分。能源費用約佔資料中心運作經費的四分之一,因此雲端資料中心會優先考慮能源成本較低的地點。然而企業的資料中心必須鄰近總公司或者生產部門,很難藉由選擇地點來壓低能源成本。
有些人認為,科技熱潮永遠是一波未平、一波又起,雲端運算只是其中一道循環,終將以失望收場。國際研究暨顧問機構顧能公司(Gartner Inc.)聲稱,雲端運算已經來到「技術成熟度模型」(hype cycle)的高峰期,被人們寄予無限希望;然而調查也顯示,雲端運算也是企業界在新年度最有可能採行的創新之一。像這樣兼具兩種特質的例子,其實相當罕見。
之前最典型的技術成熟度模型案例,是一度欣欣向榮的網路企業「達康」(dot-com),以及隨之而來一洩千里的泡沫化。達康泡沫繁榮時期,人們熱切關注網路流量,大手筆投資號稱一星期吸引數百萬人次的網站,期待獲利滾滾而來。不過,雲端運算要比達康熱潮更具體真實。
雲端運算代表電腦運算生產力一連串的大躍進,每一項躍進本身都是標準電腦能力的「乘數」(multiplier);新型態的資料中心匯集這些乘數,結合賦予終端使用者更大自主權的新趨勢。我們即將擺脫既有電腦運算模式的窠臼,踏入一個有如美夢成真的國度。在這個國度裡,資料中心的運算能力是如此強大,服務是如此優異,終端使用者根本無法拒絕。我相信總有一天,這些資料中心將連成一氣,透過網際網路相互支援,真正實現昇陽電腦(Sun Microsystem)那句歷史悠久的口號「網路即電腦」(the network is the computer)。這種能夠自我強化的電腦運算能力格網(grid),將以各種前所未有的方式連結終端使用者,最終達到無所不包、無遠弗屆的境界。
當你走在馬路上時,是否曾被人撞到,原因是對方正全神貫注把玩iPhone或其他電子裝置,完全忽略周圍的人車?告訴各位,這類情況只會愈來愈嚴重。來自雲端運算的數位服務,無論是在廣度還是在深度上,都比現有的服務更引人入勝。展望未來,就連最超然客觀的觀察家也會同意,一場脫胎換骨的變化正在進行,透過數位裝置螢幕呈現的文化將成為主流型態,其他諸如教育、文學、藝術與電影的影響力都將退居次要地位。原本質疑這股趨勢的人儘管難以認同,但仍不得不承認:一場歷史性的革命已經啟動。
人類正邁向數位化程度與日俱增的未來,這場變化無所不在、無法抵擋,企業如何在其中找到自身的定位,將是一大難題。然而企業如果能夠瞭解雲端運算有何內涵、如何演進,就能夠打造出一套策略,在未來求得生存的同時,還能更上層樓。
本書將揭示雲端運算的核心特質:改變終端使用者利用電腦運算的方式。目前雲端運算仍處於起步階段,但是Google資料中心工程師的一份報告指出,原本在用戶端運作的服務──諸如電子郵件、影音資料儲存、辦公室應用程式──都將轉移陣地,從個人電腦登上雲端。我們只需看看MySpace、flickr、YouTube等網站的發展,就知道Google此言不虛。
雲端運算還有較為嚴肅的一面:人們原本在智慧型手機黑莓機(BlackBerry)、小筆電(netbook)、筆電或個人電腦上進行的各種工作,也將一一轉移到雲端。新的運算層級將添加在舊有的層級之上。雖然網際網路業務所需的資料中心愈蓋愈大,終端使用者直接進行電腦運算的裝置卻是愈來愈小,企業必須兼顧這兩個背道而馳的趨勢,才能為自身找到適當的角色,投入雲端運算的革命。
對企業策略分析師而言,雲端運算還有更重大的意義。企業將透過網際網路,利用龐大的雲端伺服器叢集,進行日常例行的營運業務,滿足偶發性的大量運算能力需求,而且成本低於自行建構的資料中心。企業無論大小,只要做出正確的決策,未來都能夠嘗試過去做不到的工作,並以更快捷的速度完成,藉由更具效益的方法接觸客戶。
一個新的平台已經出現,為企業提供接觸客戶的新方式,以及無所不在的存取管道。無論是與潛在客戶接觸,還是與現有客戶打交道,許多新的可能性正逐漸實現。今天根本不可能走進你辦公室的人,明天卻有可能成為你的客戶。
另一方面,企業面對資訊左右逢源的消費者,想打動他們將比以往更為困難;這些消費者在網路上四處漫遊,宛如掌握整個世界。對於傳統企業,雲端運算可能會帶來不少困擾:消費者只要有任何雞毛蒜皮的不滿,立刻上網發表尖酸刻薄的評論,而且讓數百萬人看到。不過雲端運算也提供企業新的機會,與客戶建立良好關係,瞭解他們為什麼會找上你,希望你提供什麼樣的服務或產品。
亞馬遜的彈性運算雲(Elastic Cloud Compute, EC2)是目前最受歡迎的雲端運算服務之一,將外部資源重新整合為難以想像的運算服務,提供規模任君選擇的運算週期(computing cycle)。只要是正當合理的需求,客戶運算工作所需的資源隨時可以擴充,例如當網路流量暴增的時候。雲端運算的龐大資料中心透過網路存取,依使用時間來計算的費率低廉,而且可以信用卡支付。
若要舉出雲端運算最顯著的一項特質,那就是它在程式設計的本質上對外界開放,所謂的「外界」是指需要集中化資料處理工作的終端使用者。雲端運算內建自動化程序,任何人只要支付以小時計算的費用,就可以取得雲端運算的服務。以蘋果公司(Apple)的iTunes服務為例,使用者上傳些許個人資料,然後下載自己想聽的音樂,不必到唱片行尋尋覓覓。雲端運算也提供各種企業應用程式,讓公司透過網路存取,上傳相關資料,取得運算結果。
雲端運算的誕生並不是由單一技術來推動。寬頻通訊、多核心伺服器、將大型電腦叢集當成單一電腦來管理的能力,都是雲端運算的幕後功臣。混合運用這些技術,再配合企業應用程式服務化的趨勢,一場重大變革從此展開,新世代的運算能力將改變企業經營的模式。
目前最為人熟知的雲端運算是以外部資源型態呈現的「公用雲」(public cloud)。企業界人士很快就會發現,公司的資料中心可以依照雲端運算的原則來重新打造。如果一切順利,公司將以「內部雲」(internal cloud)取代舊型態的資料中心,縮小規模並降低開支;原因在於,長期以來,企業界一直過度擴建資料中心,搞得大而無當。內部雲資料中心的規模恰到好處,與「外部雲」(external cloud)連結便捷,就算使用需求突然增加也可輕鬆應付。企業只需為自家準備常態的正規工作需求,突發的工作量尖峰則交給雲端運算。一旦大量非常態運算的需求湧現,無論是季末的財報會計工作,還是年終假期的購物旅遊熱潮,都可以由外部雲吸收。企業只需依照使用時間來付費,比起過去要求資料中心滿足最大工作負載的做法,可以省下相當可觀的經費。
這種由外部公有資源和內部重整資源結合而成的「混合雲」(hybrid cloud),及其對企業營運能力的影響,將是本書探討的中心主題。從無到有、一體成形設計的混合雲還沒有出現,時機尚未成熟,但是它們正從今日的資訊基礎設施逐步演進。事實上,企業未來的資料中心都會是混合雲型態。
雲端運算能夠解決企業過度擴充運算能力的流弊,讓資料中心的預算重點從維持大批電腦持續運作,轉移到解決新出現的問題。不過雲端運算有其複雜的一面,並且對企業管理形成新的挑戰,難度甚至不下於過去企業界面對的重大挑戰。
然而最重要的是,雲端運算將為企業帶來新的運作方式和機會。《雲端運算革命的經營策略》將告訴讀者,雲端運算如何打破過去的窠臼,開展出全新的企業競爭環境。
第 1 章 雲端革命
雲端運算的定義眾說紛紜:
(1)最明確具體的定義將它描述為「軟體即服務」(software as a service, SaaS),也就是讓使用者透過網路使用應用程式,例如Salesforce.com、Google應用程式(Google Apps)或線上辦公室網站Zoho。
(2)雲端運算的另一種型態是「基礎設施即服務」(infrastructure as a service, IaaS),使用者可以到亞馬遜網路服務(Amazon Web Services, AWS)EC2(Elastic Compute Cloud)之類的網站,租用以使用時間計費的伺服器。
(3)「平台即服務」(platform as a service, PaaS)則是提供特定的工具,讓使用者編寫可以在雲端主機(host cloud)運作的軟體。
這些描述在科技界相當通行,美國國家標準與技術研究院(National Institute of Standards and Technology, NIST)也已明確定義。但是我並不會特別重視這些描述,因為雲端運算的領域變化快速,而這些描述只是驚鴻一瞥的快照。
現今的企業行銷主管感受到雲端運算這股熱潮,一窩蜂要把自家的工作送上雲端。不久前我的電腦螢幕上出現一則電子報,標題寫著「雲端運算:腳踏實地還是空喊口號?」
因此今天如果有一位執行長要技術人員解釋何謂雲端運算,資訊部門主任與網站管理人會先描述雲端運算的各個部分,但是對於它的必要條件恐怕就意見分歧,甚至爭論不休。資訊人員看得出雲端運算的端倪,然而就是無法給出一個完整明確的答案。
這位執行長曾聽說雲端運算是「網際網路運算的新階段」,只可惜這種說法的含意在今天比以往更加模糊。他搖搖頭離開,如果部屬對雲端運算連內涵都無法達成共識,恐怕很難要求他們說出他最想知道的重點:雲端運算如何影響他的工作與公司營運。
後來執行長又聽說,雲端運算讓越來越多消費者使用手持式智慧型裝置,下載iTunes之類服務提供的產品。這些消費者讓某些公司大發利市,對其他同類型公司卻視而不見,而且似乎毫無理由可言。如此一來,雲端運算的第二層意義就是商務運算(business computing)的新發展。為了落實這個概念,企業必須把更多業務轉移到網際網路。本書有一大部分將討論這個層面的問題,探究企業運算的發展趨勢與雲端時代的營運型態。
不過,為了更直接地回答執行長的問題,我們還是要嘗試對雲端運算進行一番描述。2009年下半年我到加州聖荷西(San Jose)參加一場會議,Zend Technologies執行長古特曼斯(Andi Gutmans)對500位PHP程式語言開發者發表演講,他說:「今天我不打算告訴各位雲端運算是什麼。每個人都有自己的一套定義。」
古特曼斯是PHP現行版本的共同開發者,PHP則是網際網路最受歡迎的程式語言,隨著5.3版發布,更成為撰寫雲端應用程式的主力。如果連古特曼斯都無法說明雲端運算是什麼,我想其他人也不必多此一舉。儘管如此,我們還是得努力嘗試。
許多人把Travelocity的機票訂位系統與蘋果的iTunes音樂商店,當成雲端運算的範例。雖然這兩者都是相當先進的電子商務系統,憑藉網際網路資料中心來運作,不過我並不認為它們是雲端運算。
以iTunes來說,它所謂的雲端基本上只是管理作為終端使用者的消費者,使用者輸入選擇歌曲資訊和信用卡資料,然後下載歌曲。這個系統只有單一目的,每一位終端使用者雖然可以選擇自己想聽的歌曲,但他們的電子交易型態並無差別。許多iTunes迷相信它就是雲端運算,不過以每一次數位資料傳輸收費99美分的型態來看,我認為iTunes只代表蘋果公司雲端資產的九牛一毛。
就某種程度而言,電子灣與亞馬遜的零售部門也是如此。雖然兩者越來越著重利用終端使用者提供的資訊,在單純的數位媒體內容下載之外,提供更多樣化的服務。對於在新興的雲端國度,電子灣與亞馬遜當然都是重要成員,同時也是開路先鋒。
Google龐大的資料中心在世界各地運作,為無數使用者提供即時回應,更接近雲端運算的真正面貌。加州山景市(Mountain View)的Google總部有一幅大螢幕,呈現這個不斷運轉的世界,高高低低的尖峰圖代表幾個人口中心如東京、香港、新加坡使用搜尋引擎的情況,顯示有無數網友正同時進行搜尋。大螢幕的資料會即時更新,呈現全世界、全人類永無止境、旺盛強烈的好奇心。
Google的運作和雲端運算的特質有許多交集:現代化的資料中心資源、利用低成本元件、整體化管理、終端使用者透過網路啟動、不必深入瞭解對方的系統也可以送出自動化處理的結果。Google的搜尋引擎與Google應用服務引擎(Google App Engine)都是如此,後者讓開發者撰寫可以在Google雲端執行的程式。然而像Google這類被貼上「雲端」標籤的資料中心,和其他沒有貼上「雲端」標籤但也符合上述描述的資料中心,兩者之間到底有何差別?其實,那些描述並無法完全定義雲端運算的所有特質。當Google的搜尋尖峰在洛杉磯逐漸下降,在檀香山、東京與北京開始上升,科技專家對雲端運算定義的辯論仍然將持續進行。
雲端運算資料中心的科技創新不勝枚舉,我們與其爭辯這些創新的重要性,不如採取一種更為超越的觀點。龐大的網際網路資料中心並不是雲端運算最關鍵的要素,而只是它的基礎架構之一。其實雲端運算是幾項重大進展匯流的成果,包括資料中心、鬆散結合系統(loosely coupled systems,兩個系統相互聯結但並不知道對方運作狀況)、網路協定設定、透過標準網路服務遠端啟動虛擬伺服器,這些進展賦予雲端運算迷人的力量。
這種科技匯流很值得探究,不過我們在討論雲端運算時,一定要提到一點:任何人只要支付以小時計算的低廉費率,就可以使用雲端運算。大型資料中心創造出的規模經濟(economies of scale)嘉惠終端使用者,對方可能是一般個人,也可能是企業。亞馬遜的EC2雲端基礎架構伺服器,每小時收費8.5美分。Rackspace Cloud提供雲端基礎架構,包括伺服器、儲存空間、自助式供應(self provisioning)的自動化服務,而且價格更便宜,每小時只收1.5美分,雖然無利可圖,但是有助於擴大市場佔有率。亞馬遜與Rackspace Cloud的費率應該都低於一般企業資料中心的運作成本,因為自動化控制可以讓更少的員工管理更多的伺服器。根據微軟主管對芝加哥媒體發布的新聞稿,當地新啟用的資料中心只僱用了45個人,其中還包括門房和警衛。這座資料中心在設計上可以容納30萬部伺服器,不過目前還沒有達到這個數字。許多企業的資料中心要僱用多名系統管理員,每人負責一種或多種應用程式。但是在雲端運算,執行數百種應用程式的硬體只需要一位系統管理員。
企業領域之外,許多身為消費者的終端使用者,也對新穎的網路服務興致勃勃。他們到MySpace輸入個人資料,到flickr.com張貼照片,上Facebook發表照片與留言,在LinkedIn留下事業關係資料。雲端運算的商業模式讓人們以低廉價格得到各式各樣的服務,包括強大的伺服器功能、資料儲存空間、網路頻寬等等,價格有時低到與免費相差無幾。前述的科技匯流表現為新的運算能力分配模式。因此雲端運算除了科技要素之外,也是一種商業模式,將一種新型態運算的價格壓低到前所未見的地步,讓各方能夠廣泛接納。
對於雲端運算的科技與商業模式,我們還要舉出最後一項關鍵特質:今日人們知道的雲端運算,啟動機制是幾個預設的終端使用者動作,例如你在Facebook可以上傳照片或者張貼留言。更深入來看,當使用者將一份工作送到雲端,並且告訴系統如何執行,這時他就與雲端的資料中心建立了一種新型態的關係,以往的遠端使用者自歎弗如。雲端運算讓使用者得以「程式控制」(programmatic control)資料中心的一部分,對伺服器下達指令,執行使用者選擇與送出的程式。
雲端運算的使用者並不需要專家幫忙他建立連結、啟動功能強大的機器、解說其中運作的軟體。他只需在網站上刷一下信用卡,用滑鼠從清單中點選需要的伺服器,就可以得到「自助式供應」的服務。許多企業主管需要執行規模龐大的工作,但是不想經歷採購新伺服器、等候交貨、要求資訊人員安裝調整的麻煩過程,對他們而言,雲端運算有如天上掉下來的禮物。
儘管雲端運算的定義尚未定於一尊,但是一場根本性的變化確實正在發生。人們如果有機會一窺雲端資料中心的廬山真面目,都不免歎為觀止。而且事實上,目前仍由終端使用者電腦桌面應用程式提供的服務,有許多未來都會轉移到雲端。從外觀來看,雲端資料中心通常有如一座大型倉庫,窗戶少之又少,周邊環繞著鐵絲網圍欄。走進中心,你會看到層層相疊、形狀有如披薩盒的伺服器,或者體積更小一號的「刀鋒」(blade)伺服器,裝設在高度超過2公尺的架子上。風扇呼呼旋轉,水冷式幫浦嗡嗡作響,一排又一排伺服器機架向倉庫遠處延伸。
艾利森和其他批評者只看到龐大的資料中心,認定雲端運算只是在複製他們過去的成就,然而他們忽略了雲端運算的自助式供應特質與終端使用者的程式化控制。底下是一個簡單但真實的例子。
***
亞馬遜除了網路商店的本業之外,也是雲端運算的開路先鋒,它的EC2資料中心是供客戶租用的基礎設施。客戶可以進入EC2,租用伺服器,指示它執行某項工作,再透過網際網路取回成果。人們只要在EC2開設帳號,刷一下信用卡,就可以享受它的服務。
許多公司都在試用亞馬遜的EC2,想瞭解它的運作方式,以及它對公司營運的幫助。不過到目前為止,從企業本身轉移到亞馬遜雲端運算基礎設施的商業運算工作,還是非常有限。
彼得.謝斯-佛斯(Peter Sheth-Voss)是新藥市場接受度調查研究公司Eidetics的藥物研究主任,他在設計一項藥物試驗之前,必須先統計860萬名病患的個人條件。謝斯-佛斯原本以公司的甲骨文資料庫系統來處理,雖然統計病患的性別比例只需一分半鐘,然而他有數百項條件必須統計,每一位病患的資料又很分散,因此需要好幾個工作天才能完成,但是他時間緊迫。
謝斯-佛斯在Eidetics算是新人,這家公司不久前被專業藥物測試公司昆泰Quintiles)收購。昆泰對於員工處理資料訂下嚴格規範,謝斯-佛斯與新東家的資訊人員沒有什麼合作經驗,而且令他大失所望的是:他要再等幾個星期,才會分配到一部專屬的資料庫伺服器。
於是謝斯-佛斯轉向亞馬遜的EC2求救,EC2已經安裝他需要的Vertica資料庫系統,提供的服務以小時計費。謝斯-佛斯先花15分鐘準備好研究計畫與相關資料,傳送到亞馬遜,指定一套伺服器為他效力。工作從晚上9點鐘開始進行,一個小時就大功告成。
雲端運算幫了謝斯-佛斯一個大忙,化解了複雜的兩難處境,讓他得以在重要的期限之前完成工作,所需費用對公司而言是九牛一毛。要是回到過去,這樣的結果根本不可能發生,因為謝斯-佛斯無法對功能強大的外界伺服器進行「程式化控制」。時至今日,對於無法大幅擴充公司資料中心處理能力的人,從顧客購買行為的分析到公司網站造訪者的動向,這些原本昂貴的資料處理工作不再是高不可攀。
雲端運算革命的目標並不是要讓終端使用者與資料中心的伺服器的運算周期同步,而是要建立一種點對點的關係,讓「小」可以指揮「大」,「弱」可以控制「強」;沒有特殊社會地位的使用者憑藉一具小型裝置,可以對造價昂貴的伺服器叢集下指令並得到回應(如果這位使用者嫻熟雲端運算,他的社會地位將也將改變)
第 2 章 千變萬化的雲端
Google在建構雲端資料中心時,並不是向大型供應商採購現成的x86規格伺服器,雖然市面上有許多種產品可以選擇。Google以標準規格x86元件自行組裝伺服器,可能是為了達成特定的本益比(cost-benefit ratio)。Google必須盡可能壓低伺服器設計的成本,而這項設計將反覆運用數千次。一般企業的資料中心會以不同方式來處理這個問題。許多公司都是採購運作最可靠、內建備用元件的伺服器,例如第二具冷卻風扇或電源供應器,以免單一元件故障時拖垮整部伺服器,然而,Google的伺服器沒有備用元件。為比較容易故障的元件準備備用品,雖然可以延長伺服器的運作時間,但是也會提高成本,而Google的資料中心有幾千部伺服器,若累計起來會相當可觀。
Google伺服器的獨特裝置是一具鉛蓄電池,與電源供應器連結,有如伺服器的維生系統,可以在電源供應器故障時提供短時間電力。我推測如此一來,Google的資料中心主管可以在電池耗盡之前接收到警訊,鎖定出問題的伺服器,將工作轉移到其他伺服器,而整個過程有可能已完全自動化。接下來Google的人員會在例行維修時,更換問題伺服器的電源供應器,使其恢復運作。此外,Google也有可能在伺服器運作達一定年限之後整部換掉。
Google談過他們如何針對元件故障風險,來設計自家的資料中心。家用電腦使用者遇上這類故障的機率並不高,然而當數萬部伺服器同時運作,元件故障情形就會此起彼落。硬碟、電源供應器、網路介面卡都有可能出問題,導致整部伺服器停擺。
Google工程部資深副總裁烏爾斯.霍爾佐(Urs Holzle)與傑出工程師路易斯.巴洛索(Luiz Barroso)在一篇報告中指出:「倚賴數千部伺服器運作的應用程式,可能每個小時都會遭遇硬體故障的狀況。」對於雲端運算的興起,霍爾佐與巴洛索提供了一條重要線索:雲端運算能夠達到前所未有的規模經濟,而且持續對多租戶(multitenant)使用者大開門戶;原因在於,雲端運算是以軟體而非人員來管理,追求的目標是軟體而非硬體的容錯(fault tolerance)能力。
以Google為例,它在設計搜尋引擎的運作方式時,已經預先設想叢集之中會有一個或多個節點可能發生差錯。但是Google並沒有試圖打造絕不出錯的硬體,而是將解決問題的職責提升到管理叢集的軟體。這類軟體具備容錯能力,可以處理單一元件出差錯的狀況,重新分配工作,避開出差錯的元件,交由雲端系統中的其他元件執行。
要打造硬體的容錯能力,花費相當可觀。但是Google寧可選用價廉但物美的元件,接受它們偶爾會出差錯的狀況。一般企業的資料中心為了追求穩定性,保護最重要的營運系統免於當機,會在伺服器硬體採購上付出高昂的代價。然而,如果能以軟體來解決問題,將有助於簡化增設伺服器的工作,減少前置準備工作的負擔。就算伺服器使用沒多久就出問題,叢集也可以應付。
雅虎提供了一個更詳盡的案例,說明其雲端資料庫系統Hadoop如何建立容錯能力。Hadoop的一個叢集最多可涵蓋4,000部伺服器,管理的伺服器總數可達25,000部。Hadoop從網際網路上運作中的網站搜集資料,如果沒有它,網路爬蟲(Web Crawl;編按:自動抓取網頁的程式和軟體,亦稱網路蜘蛛﹝Web Spider﹞)所得結果將緩不濟急,根本趕不上新網站出現的速度,導致資料嚴重過時。在Hadoop幫助之下,網路索引(Web Indexing;編按:一套索引機制,就像是書的索引目錄,可以根據關鍵字來查詢網頁資源)可以在73個小時內完成,換言之,雅虎的網路搜尋結果與網路實際狀況,只會有3天的落差。
Google、亞馬遜與雅虎一一建立內部私有雲(private cloud)型態的資料中心,不約而同都依循網際網路本身的設計原則。當初,美國國防先進研究計畫局(Defense Advanced Research Projects Agency, DARPA)期望建造一個核子攻擊後仍能運作的網路,結果催生出今天的網際網路。在網際網路上,路由器(router)一旦偵測到鄰近的路由器故障,就會自動繞過。雲端運算資料中心也有類似的設計,一旦某部伺服器故障,管理軟體也會繞過它,將工作分配到其他地方,直到故障的伺服器修復為止。
利用平價元件來打造具備容錯能力的資料中心,在過去是不可能的事。天騰電腦公司(Tandem Computers)(註2)曾經做出類似的效果,但做法是讓幾部一模一樣的電腦執行同樣的工作,因此就算一部電腦當機,業務也不會受到影響。時至今日,容錯能力是雲端運算保持彈性的祕訣之一。如果增添硬體設備的流程能夠簡化,成本能夠降低,那麼雲端系統就可以隨時因應需求擴充伺服器。伺服器終究會當機,但是系統管理可以避開它們,讓資料中心繼續運作。赫爾茲與巴洛索認為這是雲端運算的核心原則,從他們在威斯康辛大學麥迪遜分校(University of Wisconsin, Madison)共同主持的電腦架構聯合講座(Synthesis Lecture on Computer Architecture)的主題可見一斑:「假如資料中心像一部電腦:倉儲式資料中心設計概論。」
再舉一個例子。前面提過,大型叢集需要一套交互連接(interconnect)架構,連結叢集中的每一部電腦。許多人都想知道Google的倉儲式資料中心如何做到這一點,並且推測Google使用的是市面上速度最快的交互連接設備。然而高速交互連接設備的成本也偏高,違反雲端資料中心元件必須品質可靠但價格合宜的原則。例如無限寬頻(InfiniBand)技術標準的資料傳輸速度高達每秒鐘40GB,高階乙太網路(Ethernet)的速度則是每秒鐘10GB;我原本認為Google比較有可能採用後者。
霍爾佐與巴洛索寫道,無限寬頻每增加一個連接埠就得多花500到1,000美元,每秒鐘10Gb的大型乙太網路「每增加一部伺服器也要多花幾百美元。若要降低交互連接架構的成本,替代方案是市面上現成的乙太網路交換機(Ethernet switch)」。我不知道Google採用哪一種品牌或規格的叢集交換機,不過,1Gb的乙太網路交換機一部只需148美元,而且可靠度相當高。
Google叢集的交互連接架構和伺服器本身一樣,都是利用品質有保證、已大規模生產的元件。叢集的彈性與這種規模經濟有密切關係。雲端業者若要提供「彈性」服務,前提之一就是必須充分掌握建立大型叢集的技術。業者也要切記雲端商業模式的基本要求:價格低廉。要低廉到什麼程度?答案是:和競爭對手一樣低!
利用類似的元件組裝數量龐大、架構單純的電腦,能夠有效減少管理所需人力,以單一的管理介面與系統管理軟體來應付這些電腦,隨時監控哪些電腦正常運作、機件過熱、速度變慢或發生故障。
雲端資料中心的叢集型態和以往的叢集截然不同。能夠為眾多使用者提供費率低廉的資源,正是雲端運算最讓人興奮期待的地方。
另外,雲端運算彈性化的另一項關鍵──虛擬化(virtualization)──會在下一章深入介紹。現在我們只需知道,彈性是雲端資料中心的設計要素之一;彈性讓人們相信,自己能與無窮無盡的資源連結,能夠處理各種最棘手的工作。彈性確實是雲端運算的一大特點。
彈性也是人們對雲端運算興致勃勃的主要原因之一。如果我們擁有執行任何工作的能力,我們會想做什麼?雲端使用者無論是個人還是企業,都會得到不斷開展的新機會。雲端運算融合多種技術,各種型態逐漸演進,規模也愈來愈具有革命性。批評者常說雲端運算其實是新瓶裝舊酒,但當初印刷機問世時,大概也遭遇過類似的批評。
雲端運算彙集成效卓著的技術,用以打造新型態的規模經濟,提供新型態的終端使用者服務。有些雲端資料中心面積相當於8個足球場,的確讓人歎為觀止。然而,雲端運算真正引人入勝的內涵,也許在於終端使用者要如何使用如此龐大的資源。在資料中心的風扇聲與硬碟運作聲中,我不斷聽到個人電腦革命的回音。期待雲端運算無所不能或許只是一廂情願,然而也是一個可長可久的希望。
緒 論
提到「雲端運算」,許多人都會敬畏三分,彷彿一件大事情正在發生,某個藏身幕後的神祕人士即將揭曉一項驚天動地的計畫,而且這回是真槍實彈。
我認為人們之所以會產生這種印象,原因在於媒體不時報導Google、雅虎(Yahoo!)、微軟(Microsoft)、網路零售業鉅子亞馬遜(Amazon)、客戶關係管理服務供應商Salesforce.com、社群網站臉書(Facebook)爭相興建規模龐大的資料中心(data center)。2009年9月,微軟最新一座資料中心在芝加哥正式啟用,一輛大卡車駛進一樓僅有混凝土地板的大廳,卸下一個貨櫃,裡面是成排成列的伺服器。...
目錄
緒 論
第 1 章 雲端革命
第 2 章 千變萬化的雲端
第 3 章 乾坤挪移的虛擬化
第 4 章 地平線上的私有雲
第 5 章 混合雲
第 6 章 克服雲端阻力
第 7 章 資訊部門改造
第 8 章 危機四伏:雲端運算的安全問題
第 9 章 雲端策略:公司型態決定一切
第10章 算計未來
第11章 星雲:NASA的策略雲端計畫
附錄A 美國國家標準與技術研究院雲端運算定義
附錄B 《資訊周刊分析》
附錄C 雲端運算可攜性的罩門:
當資料愈來愈多,轉移費可能導致供應商鎖定
名詞解釋
緒 論
第 1 章 雲端革命
第 2 章 千變萬化的雲端
第 3 章 乾坤挪移的虛擬化
第 4 章 地平線上的私有雲
第 5 章 混合雲
第 6 章 克服雲端阻力
第 7 章 資訊部門改造
第 8 章 危機四伏:雲端運算的安全問題
第 9 章 雲端策略:公司型態決定一切
第10章 算計未來
第11章 星雲:NASA的策略雲端計畫
附錄A 美國國家標準與技術研究院雲端運算定義
附錄B 《資訊周刊分析》
附錄C 雲端運算可攜性的罩門:
當資料愈來愈多,轉移費可能導致供應商鎖定
名詞解釋