對于可視化有以下幾點(diǎn)建議
大數(shù)據(jù)是大容量、高速度并且數(shù)據(jù)之間差異很大的數(shù)據(jù)集,因此需要新的處理方法來優(yōu)化決策的流程。大數(shù)據(jù)的挑戰(zhàn)在于數(shù)據(jù)采集、存儲、分析、共享、搜索和可視化
1、“所有數(shù)據(jù)都必須可視化”:不要過分依賴可視化,一些數(shù)據(jù)不需要可視化方法來表達(dá)它的消息。
2、“只有好的數(shù)據(jù)才應(yīng)該做可視化”:簡便的可視化可以便于找到錯(cuò)誤就像數(shù)據(jù)有助于發(fā)現(xiàn)有趣的趨勢一樣。
3、“可視化總是能做出正確的決定”:可視化并不能代替批判性思維。
4、“可視化將意味著準(zhǔn)確性”:數(shù)據(jù)可視化并不著重于顯示一個(gè)準(zhǔn)確的圖像,而是它可以表達(dá)出不同的效果。
可視化方法可通過創(chuàng)建表格、圖標(biāo)、圖像等直觀地表示數(shù)據(jù)。大數(shù)據(jù)可視化并不是傳統(tǒng)的小數(shù)據(jù)集。一些傳統(tǒng)的大數(shù)據(jù)可視化工具的延伸雖然已經(jīng)被開發(fā)出來,但這些遠(yuǎn)遠(yuǎn)不夠。在大規(guī)模數(shù)據(jù)可視化中,許多研究人員用特征提取和幾何建模在實(shí)際數(shù)據(jù)呈現(xiàn)之前大大減少數(shù)據(jù)大小。當(dāng)我們在進(jìn)行可視化大數(shù)據(jù)時(shí),選擇合適的數(shù)據(jù)也是非常重要的。
本文的目的是通過介紹傳統(tǒng)可視化方法及其在處理大數(shù)據(jù)時(shí)的擴(kuò)展方法,來展現(xiàn)大數(shù)據(jù)可視化的前沿技術(shù)。同時(shí)討論大數(shù)據(jù)可視化的挑戰(zhàn),并其取得的進(jìn)步。
在研究過程中,筆者首先尋找了近幾年通過大學(xué)圖書館系統(tǒng)發(fā)表的數(shù)據(jù)可視化相關(guān)論文。此階段筆者主要總結(jié)了傳統(tǒng)的數(shù)據(jù)可視化方法和該領(lǐng)域的新進(jìn)展。隨后筆者搜索了相關(guān)大數(shù)據(jù)可視化的論文,因?yàn)榇髷?shù)據(jù)是一個(gè)較新的領(lǐng)域,所以大多數(shù)的論文是在過去三年里發(fā)表的。同時(shí)筆者發(fā)現(xiàn)大多數(shù)傳統(tǒng)的數(shù)據(jù)可視化方法并不適用于大數(shù)據(jù),用一些從傳統(tǒng)的可視化中發(fā)展而來的方法來處理大數(shù)據(jù)也是遠(yuǎn)遠(yuǎn)不夠的。筆者著重關(guān)注大數(shù)據(jù)可視化的新方法、技術(shù)的進(jìn)步和大數(shù)據(jù)可視化的工具開發(fā)以及隨之而來的挑戰(zhàn)。