自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌BigQuery:從iPad或臺(tái)式機(jī)實(shí)現(xiàn)自助式云數(shù)據(jù)分析

譯文
開(kāi)發(fā)
谷歌在今年5月1日發(fā)布了BigQuery服務(wù)。雖然其名稱(chēng)聽(tīng)起來(lái)像“大數(shù)據(jù)”,但谷歌的這項(xiàng)服務(wù)其實(shí)是一款自助式商業(yè)智能(BI)解決方案,托管在谷歌云端。本文將介紹它是如何工作的。

 

BigQuery是谷歌提供的一種基于云的數(shù)據(jù)分析系統(tǒng)。它讓你可以上傳數(shù)據(jù),然后使用SQL(結(jié)構(gòu)化查詢(xún)語(yǔ)言)作為查詢(xún)界面,分析數(shù)據(jù)。BigQuery讓你每個(gè)月可以免費(fèi)查詢(xún)多達(dá)100GB的數(shù)據(jù)。你只要為自己設(shè)立一個(gè)谷歌開(kāi)發(fā)者(Google Developer)帳戶(hù),就可以創(chuàng)建新項(xiàng)目,并在新項(xiàng)目中啟用BigQuery。

 

查詢(xún)后就能收到數(shù)據(jù)

BigQuery提供了一種簡(jiǎn)單的、易于掌握的瀏覽器控制臺(tái),左邊提供了數(shù)據(jù)集瀏覽,右邊提供了SQL查詢(xún)。查詢(xún)結(jié)果返回后,就會(huì)出現(xiàn)一些選項(xiàng),讓你可以用本地CSV文件來(lái)保存結(jié)果,或者創(chuàng)建含有結(jié)果集內(nèi)容的新表格。
這里顯示的是針對(duì)示例github_timeline表格執(zhí)行的簡(jiǎn)單查詢(xún)。來(lái)自查詢(xún)結(jié)果的頭幾行出現(xiàn)在屏幕右下方,另外還有讓你可以按頁(yè)翻閱數(shù)據(jù)的導(dǎo)航控件。請(qǐng)注意“Save as Table”(以表格格式保存)和“Download as CSV”(以CSV格式下載)這兩個(gè)選項(xiàng),它們?cè)贑hrome和火狐運(yùn)行很順暢。遺憾的是,Internet Explorer中沒(méi)有“Save as Table”這個(gè)選項(xiàng)(我們馬上會(huì)看到的文件上傳選項(xiàng)也沒(méi)有)。BigQuery中的一切在iPad上的Safari中也能順暢運(yùn)行,不過(guò)你無(wú)法保存或上傳本地文件。

 

全是表格和列

BigQuery數(shù)據(jù)存儲(chǔ)在表格中,就像存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中。反過(guò)來(lái),表格存儲(chǔ)在數(shù)據(jù)集中。數(shù)據(jù)集充當(dāng)了安全部門(mén),以便與特定用戶(hù)或整個(gè)公眾共享。谷歌提供了publicdata:samples數(shù)據(jù)集,該數(shù)據(jù)集添加到每一個(gè)BigQuery項(xiàng)目中。這讓你可以馬上檢查和查詢(xún)表格。

在屏幕左邊,你可以深入分析數(shù)據(jù)集,查看數(shù)據(jù)集含有的表格。選擇其中一個(gè)表格,表格模式就會(huì)出現(xiàn)在控制臺(tái)的右邊。該圖顯示了github_timeline表格的模式。請(qǐng)注意:屏幕左邊的標(biāo)簽以粗體文本顯示,旁邊附有紅條。“Click to preview table data”(點(diǎn)擊即可預(yù)覽表格數(shù)據(jù))鏈接的用途正如其名,但是你也可以編寫(xiě)自己的SQL查詢(xún)。

 

觀看查詢(xún)運(yùn)行情況

想運(yùn)行查詢(xún),輸入查詢(xún),然后點(diǎn)擊“RUN QUERY”(運(yùn)行查詢(xún))按鈕,或者就在鍵盤(pán)上按Ctrl-Enter組合鍵。查詢(xún)運(yùn)行時(shí),查詢(xún)文本區(qū)被禁用,查詢(xún)計(jì)時(shí)器運(yùn)行,就在“Query running”(查詢(xún)運(yùn)行)標(biāo)簽的旁邊。

BigQuery不允許“SELECT *”式樣的查詢(xún);你而是必須指定所有的列名。雖然你可能會(huì)查詢(xún)龐大數(shù)據(jù)集,但是希望確保結(jié)果集很小。為此,就要充分利用聚合查詢(xún)(使用聚合函數(shù)和GROUP BY)以及/或者查詢(xún)末尾處的LIMIT n語(yǔ)句,如這里所示(即“LIMIT 200”出現(xiàn)在查詢(xún)末尾)。

表格使用datasetname.tablename語(yǔ)法來(lái)加以確認(rèn)。如果你引用來(lái)自示例數(shù)據(jù)集的任何表格,就需要在“samples”數(shù)據(jù)集名稱(chēng)前使用“publicdata:”這個(gè)前綴。

 

#p#

iPad上的BigQuery

BigQuery并非僅僅適用于大型臺(tái)式機(jī)和筆記本電腦。比如說(shuō),它在iPad上也可以很順暢地運(yùn)行,如圖所示。BigQuery對(duì)平板電腦的使用也很熟悉:將你的iPad從橫向模式旋轉(zhuǎn)成縱向模式,頁(yè)面顯示就會(huì)相應(yīng)調(diào)整,為你多顯示幾行數(shù)據(jù)。

 

創(chuàng)建表格

當(dāng)然,你還可以創(chuàng)建自己的表格。只要將鼠標(biāo)移到數(shù)據(jù)集上方,點(diǎn)擊出現(xiàn)在名稱(chēng)數(shù)據(jù)集右邊的“+”符號(hào),就可以調(diào)出“Create Table”(創(chuàng)建表格)表單,如上圖所示。在表單中,你只需要提供表格的編號(hào)(名稱(chēng))、模式(以一系列列名稱(chēng)和數(shù)據(jù)類(lèi)型來(lái)表示),并指向含有數(shù)據(jù)的源文件。然后點(diǎn)擊OK。

如果該文件的大小不超過(guò)10MB,你可以直接從自己電腦的硬盤(pán)中選擇。如果文件超過(guò)了10MB,就要先把它上傳到谷歌云存儲(chǔ)(Google Cloud Storage),然后提供文件的鏈接,在URI(統(tǒng)一資源標(biāo)識(shí)符)的開(kāi)始部分使用“gs://”,如圖所示。

BigQuery假設(shè)要從CSV(逗號(hào)分隔的值)文本文件導(dǎo)入,沒(méi)有初始行含有列名稱(chēng)。要是你的文件使用非逗號(hào)分隔符,或者頭一行含有列名稱(chēng)而不是數(shù)據(jù),你可以告訴BigQuery你的文件使用什么分隔符以及略過(guò)頭一行(或頭幾行)的內(nèi)容。

這個(gè)特定的CSV文件含有美國(guó)六個(gè)州歷史上的嬰兒名稱(chēng)數(shù)據(jù)。該數(shù)據(jù)來(lái)自美國(guó)社會(huì)保障局的namesbystate.zip數(shù)據(jù)集合文件,該文件含有全部五十個(gè)州的數(shù)據(jù),每個(gè)州都使用一個(gè)單獨(dú)的文件。不過(guò)我用僅僅六個(gè)州的數(shù)據(jù)創(chuàng)建而成的一個(gè)文件就有100多萬(wàn)行。

 

監(jiān)控任務(wù)

你在創(chuàng)建表格時(shí),還可以監(jiān)控?cái)?shù)據(jù)裝入任務(wù)的進(jìn)度,只要點(diǎn)擊屏幕左上方的“Job History”(任務(wù)歷史)鏈接。這會(huì)調(diào)出“Recent Jobs”(近期任務(wù))屏幕,如圖所示。盡管鏈接中提到了“歷史”,但是你也可以查看運(yùn)行中任務(wù)。點(diǎn)擊一個(gè)任務(wù),你就能獲得詳細(xì)信息,如圖所示。

本地打開(kāi)數(shù)據(jù)

當(dāng)然,如果你擁有采用CSV格式的數(shù)據(jù),沒(méi)有什么阻止得了你用Excel來(lái)打開(kāi)數(shù)據(jù)。之后,你可以用Excel自己的文件格式來(lái)保存數(shù)據(jù),然后開(kāi)始處理數(shù)字。

 

PowerPivot也能進(jìn)行“大”查詢(xún)

谷歌描述BigQuery是一種列存儲(chǔ)數(shù)據(jù)庫(kù)(column store database),很適合處理OLAP(聯(lián)機(jī)分析處理)查詢(xún)。微軟PowerPivot是Excel 2010的一款免費(fèi)插件,它同樣很符合這個(gè)描述,可以從CSV文件同樣順暢地導(dǎo)入。下面是一旦數(shù)據(jù)進(jìn)入到PowerPivot后呈現(xiàn)出來(lái)的樣子。把龐大數(shù)據(jù)集存儲(chǔ)到PowerPivot可以為你帶來(lái)遠(yuǎn)高于把同樣數(shù)據(jù)直接存儲(chǔ)到電子表格的性能。

PowerPivot一個(gè)功能非常強(qiáng)大的方面在于它使用了數(shù)據(jù)壓縮技術(shù)。含有六個(gè)州嬰兒名稱(chēng)的CSV文件其大小超過(guò)20MB,而含有PowerPiovt模型以及同樣這些數(shù)據(jù)的Excel工作簿其大小卻不到1MB。

 

不僅僅查詢(xún),還直觀顯示

一旦你的數(shù)據(jù)在PowerPivot中,就很容易使用PivotTable(數(shù)據(jù)透視表)、圖表或者兩者同時(shí)使用,在Excel中重新顯示數(shù)據(jù)。我們?cè)诖丝吹降膱D表對(duì)應(yīng)于PowerPivot模型及嬰兒名稱(chēng)數(shù)據(jù),它在圖表的上面和左邊有幾個(gè)“切片器”(slicer)。

切片器讓你可以對(duì)數(shù)據(jù)進(jìn)行過(guò)濾,并自動(dòng)查看圖表更新。我們?cè)诖藢?duì)查詢(xún)進(jìn)行了過(guò)濾,只顯示1995年到2005年在亞利桑那州、加利福尼亞州、科羅拉多州和紐約州的Abigail和Allison這兩個(gè)姓名的數(shù)據(jù)。頂部的切片器只含有女孩的姓名,因?yàn)槲覀冊(cè)谧笊戏降?ldquo;Gender”(性別)切片器中選擇了“F”(女性)。

 

回到云

這里是BigQuery中的同一結(jié)果。沒(méi)有直觀地顯示數(shù)據(jù);不是只需點(diǎn)擊切片器,而是必須認(rèn)真編寫(xiě)查詢(xún)中的WHERE語(yǔ)句,才能獲得同樣的結(jié)果。查詢(xún)次數(shù)與PowerPivot的相當(dāng)。
走PowerPivot這條路帶來(lái)了諸多優(yōu)點(diǎn),可能對(duì)許多用戶(hù)來(lái)說(shuō)更有意義。但是BigQuery基于云,可以從任何聯(lián)網(wǎng)的計(jì)算機(jī)或設(shè)備來(lái)加以訪問(wèn)。

原文鏈接:

http://www.zdnet.com/photos/google-bigquery-self-service-cloud-data-analysis-from-your-ipad-or-desktop/6367065?tag=photo-frame;get-photo-roto
 

責(zé)任編輯:林師授 來(lái)源: 51CTO.com
相關(guān)推薦

2011-07-14 22:05:02

惠普臺(tái)式機(jī)

2010-10-09 20:51:00

身份管理安全風(fēng)險(xiǎn)IAM

2012-07-10 09:29:44

BigQuery

2010-03-05 10:01:54

戴爾臺(tái)式機(jī)解決方案

2010-03-05 10:01:54

戴爾臺(tái)式機(jī)解決方案

2012-05-08 10:37:11

谷歌BigQuery

2009-07-28 16:51:27

臺(tái)式機(jī)數(shù)據(jù)中心能效

2013-09-17 18:27:27

SAP

2022-05-25 09:35:26

機(jī)器學(xué)習(xí)自助式數(shù)據(jù)庫(kù)

2009-07-28 18:48:35

臺(tái)式機(jī)數(shù)據(jù)中心刀片

2011-09-29 15:26:46

Gateway臺(tái)式機(jī)

2012-09-07 11:17:33

2022-08-02 13:28:24

商業(yè)智能功能自助服務(wù)

2013-05-06 09:14:26

BigQuery大數(shù)據(jù)分析大數(shù)據(jù)分析入門(mén)

2011-12-23 14:36:03

戴爾臺(tái)式機(jī)

2011-08-24 23:48:20

Acer臺(tái)式機(jī)

2011-09-11 18:04:48

臺(tái)式機(jī)行情

2011-04-22 14:23:44

華碩玩家臺(tái)式電腦CG835家用臺(tái)式電腦晶品CM6

2015-10-30 15:28:44

天翼云云計(jì)算

2010-02-03 09:55:33

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)