楊玉華的學習履歷(❁´◡`❁) - 111-1 大數據分析 - 5. 資料分析工具這麼多,應該用哪個來做分析? |
|
|
5. 資料分析工具這麼多,應該用哪個來做分析?這是很多人在做資料分析的時候,經常會碰到一個問題。尤其是新人剛入門的時候,看到下面的資料分析工具,例如 Excel、SQL、SPSS、Python、Tableau、PowerBI、FineReport、R、Hadoop、Spark…… 可能頭都大了,如果全都要學那可不是短期內能學完的。 在資料分析工具的選擇上,我的建議是對症下藥,因地制宜。我會從幾個角度對各種工具進行分析,希望能給剛入門資料分析的朋友一點幫助。 根據資料應用的不同環節來看其實看上圖就已經非常清晰了。每個資料分析工具都有其側重的功能點,在不同的資料應用場景下,選擇合適的工具,能實現效率最大化。 比如在資料獲取時,你可以通過SQL從資料庫中提取資料,也可以通過python爬取資料,但你最起碼要能熟練掌握SQL; 資料處理時,如果資料量不大,其實Excel是最方便快捷的資料處理工具,在大資料量的情況下,SQL和python的使用更為常見;在大量不可變資料的批處理作業中,hive則最為合適; 分析建模方面,簡單的分析,Excel、BI工具已經足夠,涉及到建模時,R、SPSS這類專業的統計分析軟體,就更能發揮出優勢,畢竟建模的思維和統計學是強相關的,當然,python也是一個不錯的選擇; 在做視覺化時,還是建議各位用專業的視覺化工具去做,視覺化工具的細分上也有很多,像普通的業務資料分析師和業務人員可以使用常見的BI工具Tableau、PowerBI、FineBI等去做,報表工程師更適合選擇專業的報表工具例如FineReport,開發人員還可以選擇一些開源的視覺化工具例如Echart 三大常用工具分析1、Excel在很多人眼裡,Excel只是一個辦公軟體,但實際上,大部分人對Excel的認知還不到50%。Excel可以稱得上是最全能的資料分析工具之一,包括表格製作、資料透視表、VBA等等功能,保證人們能夠按照需求進行分析。 當然也有人認為自己非常精通程式語言,不屑使用Excel這種工具,因為Excel不能應對大量資料。但換個思維想想,我們在日常中用到的資料是否超過了大資料這個極限呢?而且我們國家中小微型企業佔了大部分,Excel足夠處理絕大多數的資料分析需求。 總結一下,百萬級以下的資料處理、分析,Excel是個不錯的選擇,新人要是想學資料分析,Excel絕對是首選,而且是必選! 2、Python不可否認的是,python在資料分析領域,確實稱得上是一個強大的語言工具。你可以隨心所欲地寫程式碼執行你想要的東西。儘管入門的學習難度要高於Excel和BI,但是作為資料科學家的必備工具,從職業高度上講,它肯定是高於Excel、BI工具的。 尤其是在統計分析和預測分析等方面,Python等程式語言更有著其他工具無可比擬的優勢。 新人在初入門時可以先不學Python,很多初級崗位甚至用不上Python,但如果想在這條路上長遠發展,它一定是個逃不開的工具。 3、BI工具BI也就是商業智慧,這類工具就是為資料分析而生的。你會發現BI工具的產品設計,幾乎是按照資料分析的流程來設計的。先是資料處理、整理清洗,再到資料建模,最後資料視覺化,全程圍繞資料指導運營決策的思想。由於功能聚焦,產品操作起來也非常簡潔,依靠拖拉拽就能完成大部分的需求,沒有程式設計基礎的業務人員也能很快上手。 以FineBI為例 可以通過匯入資料集或者連線資料庫,獲取資料 如果需要進行資料處理,點選建立自助資料集,在自助資料集中可以根據業務邏輯進行過濾、分組彙總、新增資料列、多表合併等資料加工操作,從而實現資料處理、分析、建模聚類等功能,用滑鼠就可以完成資料加工操作,不用死記硬背函式公式。 資料處理完畢之後,點選儲存,進入儀表板建立元件,即可進行資料視覺化分析,視覺化作為BI工具的重點功能,裡面內建了幾十種視覺化圖表模型,非常全面方便。 最後,可以輸出下圖類似的視覺化儀表板,用作分析結果分享、報告都很適合。 以上的對比說明了幾個軟體的差別,我想總結的是,存在即合理。 總結Excel/BI/程式語言,這些工具在應用上有交叉重疊的地方,也有互補的地方。對於重疊的地方,無論是哪種工具,只要你能利用它解決你遇到的問題,它就是最棒的。
|
|
中華科技大學數位化學習歷程 - 意見反應 |