Cloudera發(fā)布面向”普通人”的Hadoop云計算服務(wù)
硅谷企業(yè)Cloudera日前發(fā)布了一款免費的,基于Linux軟件環(huán)境下的個人用面向云計算的分布式軟件,該軟件降低了對使用人員的要求,使“普通開發(fā)者”也可用該軟件搭建云計算平臺,處理海量數(shù)據(jù)。
“Hadoop提供了無可匹敵的收集、存儲和分析數(shù)據(jù)的功能,但是直到現(xiàn)在,有一些企業(yè)還是回避它,”Burlingameg公司的創(chuàng)建人之一Jeff Hammerbacher,在與Betanews的一場新聞發(fā)布會上說。
“以前,擁有博士學(xué)位背景的人才能使用Hadoop。但是例如醫(yī)院和銀行這樣的機構(gòu),并沒有這樣的人員。 Hadoop的配置和管理的確很讓人痛苦。但是現(xiàn)在我們提供了更容易的可以讓“普通人”使用的Hadoop,”Hammerbacher說,他曾經(jīng)在 Facebook創(chuàng)建并領(lǐng)導(dǎo)了一個Hadoop數(shù)據(jù)工作組。
Facebook、Google和Yahoo這樣的網(wǎng)站,最初開發(fā)Hadoop的目的是,通過數(shù)以千記的計算機將文本和日志數(shù)據(jù)集中在一起,將數(shù)據(jù)放在他們的網(wǎng)站上,觀察用戶的使用習(xí)慣,Hammer如是說。但是所有處理萬億字節(jié)非結(jié)構(gòu)化的信息的公司,也必將在更多的領(lǐng)域使用Hadoop。
例如,一個早期的顧客,現(xiàn)在使用新版的Hadoop Cloudera Distribution分析基因序列,也用于做簡報用。另一個公司的共同創(chuàng)辦人,Cisciglia曾經(jīng)在Google倡議并與國家科學(xué)基金(NSF)合作開發(fā)Google主辦的Hadoop簇集,用于科研和教育。
根據(jù)Hammerbacher的說法,Cloudera計劃從圍繞軟件的服務(wù)和支持獲利,而不是軟件本身?!凹t帽對Linux所做的,正是我們對Hadoop所做的?!盚ammerbacher如是說。
Cloudera正在分發(fā)軟件的RPM,這對大多數(shù)Linux管理員和開發(fā)人原來說再熟悉不過了,還有在Apache軟件許可下的Amazon EC2許可,Bisciglia介紹說。
該軟件的主要組成部分包括Hadoop 分布式文件系統(tǒng),一個容錯文件系統(tǒng)用于處理商品硬件出現(xiàn)的錯誤;一個數(shù)據(jù)存儲基礎(chǔ)設(shè)施叫做Hive;以及一個MapReduce軟件的執(zhí)行,用于將應(yīng)用程序分解成一些小的工作組,并在大型主機上自動并行執(zhí)行。
為了使Hadoop distribution的安裝和配置更容易,Cloudera建立了一個新的門戶網(wǎng)站,也是免費的,叫做my.cloudera.com,在這個網(wǎng)站上,大家可以使用一個基于網(wǎng)絡(luò)的配置工具生成客戶軟件包,并可優(yōu)化符合他們的特殊需求。用戶也可設(shè)置保存簇集信息的設(shè)置以便自動更新。
Cloudera提供了同樣免費的關(guān)于軟件的基礎(chǔ)培訓(xùn),并提供了可下載的VMware圖像測試軟件在Linux,Windows或Macintosh平臺上的效果。
公司的其他共同創(chuàng)建人包括甲骨文公司的前副總裁mike Olson ,以及Yahoo的前總工程師Amr Awadallah博士。
【編輯推薦】