2012年11月8日 星期四

海量資料時代 the big data

就在幾天前,2012年11月6日,巴拉克‧歐巴馬在2012年的美國總統選舉中擊敗了共和黨的候選人羅姆尼,成功連任。和以往任何一件歷史事件一樣,事後會有許多分析家提出歐巴馬勝選的因素。不同於以往的是,在2012年的現在,是一個海量資料的時代。所謂的海量資料,就是資料像海水一樣多,甚至更多。這些資料包括蒐集氣候資訊的感應器,社群網站的貼文,部落格的文章,圖片與影像,線上商店的採購紀錄,搜尋引擎的關鍵字搜尋等等。我常常說,任何一件事情,不會憑空發生,背後一定有一股力量,一股趨勢。等到這股力量和趨勢達到了臨界點,事情就發生了。從這個觀點來看,歐巴馬的當選,其實早就預示在海量資料當中,只是我們現在還沒有找到一種數據分析的方法,可以從海水一樣大量的資料當中找出歐巴馬當選的線索。不,也許過個幾天,就有另一位天才發明了一種演算法,可以從這些資料當中提煉出黃金。如果真有那麼一天,現代的煉金術,不就在眼前嗎?你可以經由海量資料的分析得知黃金或房地產的投資價值。你也可以經由海量資料的分析知道地球何時會毀滅。我是不希望有這麼一天的,在這之前,我只是希望,如果我開了一家早餐店,我可以經由海量資料的分析,知道顧客喜歡幾度C的奶茶,哪一個產地的雞蛋比較營養而已。