1 認識大數據分析大數據分析是分析大型複雜數據源以發現趨勢、模式、客戶行為和市場偏好,從而為更好的業務決策提供信息的過程。分析大數據的複雜性需要各種方法,包括預測分析、機器學習、流分析以及數據庫內和集群內分析等技術。
大數據分析是指數據輸入變得過於龐大,以至於需要更強大的計算能力來處理來自多個來源的所有數據。大數據通常具有四個 V 的特徵:體積(Volume):大量數據多樣性(Variety):許多不同形式的數據,非結構化和結構化數據速度(Velocity):傳入數據的頻率真實性(Veracity):數據的可信度
除了龐大的數據量之外,所收集數據的複雜性對數據架構、數據管理、集成和分析的安排提出了挑戰。但是,將社交媒體內容、視頻或運營日誌等非結構化數據源與交易等現有結構化數據結合在一起的機構能夠添加上下文並生成新的、通常更豐富的洞察力,以獲得更好的業務成果。此外,大數據的另一個組成部分是從傳感器、移動設備、網絡點擊流和交易等激增來源生成傳入數據(生成速度仍在加快),從而導致需要實時分析。能夠利用當前發生的事情來防止設備故障、推薦購買物品、識別信用卡欺詐等的機構正在迅速成為其潛在行業卓越運營的新標準。最後,大數據是指數據的準確度、精確度和可信度。這並不是說所有數據都必須經過高度整理和清潔,因為對非結構化數據源的分析可以帶來新的見解。但重要的是,數據管理員和決策者都了解用於洞察生成和決策制定的數據的質量、準確性和可信度。
參考資料來源:https://www.tibco.com/zh-hant/reference-center/what-is-big-data-analytics
|
|