自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

NoSQL移形換位 看Cassandra如何遷移到MongoDB

數(shù)據(jù)庫 其他數(shù)據(jù)庫 MongoDB
Flowdock團隊日前完成了從Cassandra到MongoDB的“移形換位”大發(fā),主要的目的也是想獲得更好的性能體驗。下面我們就來具體看看是如何遷移的。

Flowdock是一個基于Web的團隊通訊工具.所有的軟件開發(fā)人員都應(yīng)該使用它進行溝通,而不是使用Campfires、Skype Chats或IRC等工具.因為它可以更好的的支持他們的真實工作流.

上周,我們對Flowdock的數(shù)據(jù)庫服務(wù)做了一次切換,聰從Cassandra遷移到了另一種NoSQL工具-MongoDB.由于我們的技術(shù)選擇已經(jīng)引起了大家的部分興趣,我將在此向公眾說明下我們的決策理由.

我們的部分客戶一定對下面這個圖片記憶猶新:

從一定程度上講,我們遭遇到了Cassandra的穩(wěn)定性問題.所有的節(jié)點都陷入無線無限循環(huán)(infinite loop),運行垃圾回收工作(GC, Garbage Collection)并嘗試壓縮數(shù)據(jù)文件-并偶爾導(dǎo)致集群癱瘓.除了對集群進行重啟并經(jīng)常性的手工對節(jié)點做壓縮工作以讓其穩(wěn)定一會外,我們無計可施.其他人也報告過類似的問題.在前面幾周的時間里,我們的Cassandra節(jié)點總是會吃掉給他分配的所有資源,而導(dǎo)致Flowdock運行緩慢.

由于我們刀口嗜血式的數(shù)據(jù)庫選擇(James注: 這是我不認同的地方,可能對于一些Startup的公司來講,這是一種不得已的選擇.),這已經(jīng)不是我們第一次遇到此類問題了.從Cassandra 0.4升級到0.5的時候,我們被迫關(guān)閉了整個集群,僅僅是為了將所有的數(shù)據(jù)刷新到磁盤上(雖然,我們已經(jīng)按照文檔進行了手工刷新的操作).這個操作導(dǎo)致我們丟失了幾分鐘的討論內(nèi)容,以及我們手工創(chuàng)建的索引出現(xiàn)嚴重的不一致,以致于需要做完全的重建.我想,我們最后離開辦公室的時間已經(jīng)是凌晨4點了.

從我們最初選擇Cassandra到現(xiàn)在,NoSQL社區(qū)已經(jīng)出現(xiàn)了很大的變化.MongoDB已經(jīng)發(fā)生了很大的改變,最近新增的自動分片(auto-sharding)與副本集(replica set)使得它可以作為Cassandra的有力的替代品.因此,我們決定試試MongoDB.

寫從Cassandra往MongoDB的數(shù)據(jù)遷移的腳本耗費我一天的時間.在一周左右的時間內(nèi),我們已經(jīng)可以完全在MongoDB上運行Flowdock了.在生產(chǎn)環(huán)境部署MongoDB之前,內(nèi)部測試持續(xù)進行了好幾個星期.

目前,我們已經(jīng)完成這個調(diào)整,

1. 智能(多鍵)索引. 手工維護的索引令人生厭,MongoDB可以自動幫我們維護所需的索引.例如,我們的消息包含標簽(tag),例如下面這個格式的document:

  1. { content: "Write a blog post about #mongodb.",   
  2.  workspace: 'myflow',   
  3. tags: ["mongodb", "todo", "@Otto"] }   
  4. 這樣,如果僅檢索自己的任務(wù),Flowdock的后臺只需要做下面這個查詢:   
  5. db.messages.find({   
  6.  workspace: 'myflow',   
  7.  tags: { $all: ["todo", "@Otto"] }   
  8.  })   
  9.  

2. 查詢.無論數(shù)據(jù)模型多么簡單,每當需要執(zhí)行一個查詢的時候,你都不需要提前規(guī)劃此事.在MongoDB中,你可以直接在控制臺定制復(fù)雜的查詢,這一點非常類似于SQL數(shù)據(jù)庫.它會據(jù)此執(zhí)行一次順序掃描,這比在客戶端手工處理上百萬的記錄要更快捷也更便利.

3. Map-Reduce. 這是分析人員的利器啊.MongoDB的Map-Reduce功能支持雖然不是非常完美,但它起碼很易用.

4. GridFS讓我們的文件存儲操作變得非常容易.它的存儲能力可以隨著我們的MongoDB集群的擴展一起增長.

我們也遭遇到部分輕微的限制:

1. 我們發(fā)現(xiàn)了一個JSON解析的bug,不過我們在10分鐘內(nèi)就解決了此bug.

2. BSON的Document鍵中不支持點(dot).通常,這或許不是個問題,但是我們必須在數(shù)據(jù)遷移中解決此問題.

3. Document有4MB的大小限制.這對于我們的數(shù)據(jù)模型來講不是問題,由于MongoDB對在位的原子更新(atomic in-place updates)有非常好的支持,所以,你需要關(guān)注,Document不要超過4MB的限制.

4. 增加新的節(jié)點沒有在Cassandra中那么容易.然而,Cassandra在新增節(jié)點的負載均衡上有它自己的問題.

到目前為止,它的運行還非常平穩(wěn).開發(fā)人員與數(shù)據(jù)庫管理員的工作也因此減輕了很多.

原文鏈接:http://www.dbthink.com/?p=599&utm_source=feedburner&utm_medium=feed&utm_campaign=Feed:+dbthink+(a+db+thinker's+home

【編輯推薦】

  1. MongoDB CEO談NoSQL的大數(shù)據(jù)量處理能力
  2. 拋棄關(guān)系數(shù)據(jù)庫 PHP程序員應(yīng)了解MongoDB的五件事
  3. MongoDB,無模式文檔型數(shù)據(jù)庫簡介
  4. 關(guān)系數(shù)據(jù)庫的末日是否已經(jīng)來臨
  5. 扔掉沉沒成本 嘗試關(guān)系數(shù)據(jù)庫替代品OODBMS
責任編輯:彭凡 來源: db think
相關(guān)推薦

2021-01-28 09:00:00

SQL數(shù)據(jù)庫NoSQL

2011-08-02 16:08:52

NoSQLMongoDBCassandra

2017-10-20 08:45:15

數(shù)據(jù)庫MongoDBMySQL

2011-03-04 09:32:31

NoSQL就業(yè)形勢Cassandra

2020-04-20 08:08:23

MongoDBElasticsear數(shù)據(jù)庫

2021-07-09 18:26:41

PythonMySQL MongoDB

2021-10-08 11:07:54

云計算數(shù)據(jù)中心IT

2010-07-20 09:48:33

2016-10-26 16:44:44

WatchfinderAWS云計算

2013-11-29 10:45:03

MySQLNoSQLHBase

2024-07-03 08:19:56

2019-01-02 16:40:13

MongoDBPostgres數(shù)據(jù)庫

2020-11-18 10:10:10

云平臺云遷移云計算

2020-03-17 22:36:54

HPC托管數(shù)據(jù)中心

2011-06-24 10:10:35

SVN

2009-08-06 09:20:30

2015-09-14 14:49:39

MySQLMariaDBLinux

2009-04-16 17:23:37

OracleBasicFileSecureFile

2022-03-19 16:47:47

WordPress網(wǎng)站遷移服務(wù)器

2020-01-06 12:50:50

Windows 7遷移Windows 10
點贊
收藏

51CTO技術(shù)棧公眾號