何謂 data-intensive applications¶

所謂的 data-intensive applications 如同名稱所示，專注在如何有效率地處理、儲存密集資料。通常一個這樣的系統的後端要用多種方式處理資料，而不是只用一個資料庫就結束了。（雖然對 end users 來說可能看起來像這樣）

舉個簡單例子，一個電子商務網頁的後端除了做為 OLTP 的 NoSQL 資料庫 (e.g., MongoDB) 以外，可能還有：

光是要把以上所列的資料庫 / 分散式系統 / 資料流以有系統的方式組合起來就需要大量經驗，更遑論還要達到以下三個要求了：

Image Credit : 如何了解各個 data system 的優缺點並予以組合

儘管我們不可能熟悉所有資料庫以及分散式系統的細節，了解他們背後設計的核心理念、演算法以及大致上的運作方式能讓我們了解每個 data system 的特性以及優缺點，依照不同的使用案例選擇最適合的 data system 並予以組合。

何謂資料密集¶

書中所指的「密集」資料有以下所列的特徵（一個以上）：

針對「資料有複雜結構」以及「資料變動很快」這點，最為人所知的 solution 就是 NoSQL 等允許彈性 schema 的資料庫的崛起；而針對「資料量很大」這點，則端看使用案例有各式各樣的資料庫、分散式系統。舉幾個例子：

如同前述，以上提到的系統依照它們想要解決的問題的特性，背後都會有一些假設以及 trade-off 。了解這些背後的原理可以讓我們了解哪些工具在什麼時候最 powerful 。

這本書主要分成三部分來闡述，抓到大方向會比較容易閱讀：

在資料密集的時代，我們的最終目標在於如何將各式各樣的 data systems 以有系統的方式「組合」起來，以建立一個可靠、具規模性以及維護性的系統。