183.17.231.* 2020-11-10 13:51:01 |
大數(shù)據(jù)旨在尋求研究方法,并在結(jié)構(gòu)上從更大或更復(fù)雜的數(shù)據(jù)集中獲取信息,或快速處理由傳統(tǒng)數(shù)據(jù)處理程序和軟件處理的數(shù)據(jù)集。大數(shù)據(jù)涉及的數(shù)據(jù)量通常超過了傳統(tǒng)軟件在可接受的時(shí)間和成本范圍內(nèi)處理的能力。
大數(shù)據(jù)本身的特點(diǎn)通常集中在五個(gè)方面,即大體量,高速度,多樣性,準(zhǔn)確度和精確性與信噪比對(duì)這五個(gè)維度的理解和認(rèn)識(shí)是理解大數(shù)據(jù)概念的關(guān)鍵。當(dāng)然,隨著大數(shù)據(jù)技術(shù)的發(fā)展及其在行業(yè)中的應(yīng)用,數(shù)據(jù)本身的規(guī)模也在一定程度上得到了擴(kuò)展,而這些擴(kuò)展本身也是對(duì)大數(shù)據(jù)概念的一種豐富和改進(jìn)。而大數(shù)據(jù)分析的特點(diǎn)和以上五個(gè)方面也是密不可分的。
一:數(shù)據(jù)分析量大
數(shù)據(jù)量本身就是聚合的概念。不是數(shù)據(jù)量大的數(shù)據(jù)被稱為大數(shù)據(jù),傳統(tǒng)信息系統(tǒng)生成的“小數(shù)據(jù)”也是大數(shù)據(jù)分析的重要組成部分,這點(diǎn)必須清楚。當(dāng)前,從大數(shù)據(jù)的數(shù)據(jù)源的角度來看,它主要集中在互聯(lián)網(wǎng),物聯(lián)網(wǎng)和傳統(tǒng)信息系統(tǒng)三個(gè)渠道。當(dāng)前物聯(lián)網(wǎng)數(shù)據(jù)的比例相對(duì)較大。相信在5G時(shí)代,物聯(lián)網(wǎng)仍將是大數(shù)據(jù)的主要數(shù)據(jù)源。
二:數(shù)據(jù)分析結(jié)構(gòu)多樣性
與創(chuàng)新信息系統(tǒng)(ERP)中的數(shù)據(jù)不同,大數(shù)據(jù)的數(shù)據(jù)類型非常復(fù)雜,包括結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這對(duì)傳統(tǒng)數(shù)據(jù)分析技術(shù)提出了巨大挑戰(zhàn),這也是大數(shù)據(jù)技術(shù)興起的重要原因。在工業(yè)互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)的多樣性將得到進(jìn)一步體現(xiàn),這也給數(shù)據(jù)價(jià)值過程帶來了新的挑戰(zhàn)。
三:數(shù)據(jù)價(jià)值密度
與傳統(tǒng)信息系統(tǒng)相比,大數(shù)據(jù)中的數(shù)據(jù)價(jià)值密度相對(duì)較低,這就需要更快,更方便的方式來完成數(shù)據(jù)值提取過程,這也是當(dāng)前大數(shù)據(jù)平臺(tái)所關(guān)注的核心競爭力之一。實(shí)際上,早期Hadoop和Spark平臺(tái)之所以能夠脫穎而出的重要原因是它們的數(shù)據(jù)處理(排序)速度相對(duì)較快。
四:數(shù)據(jù)增長速度快
通常傳統(tǒng)信息系統(tǒng)的數(shù)據(jù)增量是可以預(yù)測的,或者增長率是可控的,但是在大數(shù)據(jù)時(shí)代,數(shù)據(jù)增長率已經(jīng)大大超過了傳統(tǒng)數(shù)據(jù),處理能力已經(jīng)超過自身的極限。數(shù)據(jù)增長是一個(gè)相對(duì)的概念。與消費(fèi)互聯(lián)網(wǎng)相比,工業(yè)互聯(lián)網(wǎng)帶來的數(shù)據(jù)增長可能更加客觀,因此工業(yè)互聯(lián)網(wǎng)時(shí)代將進(jìn)一步打開大數(shù)據(jù)的價(jià)值空間。
五:數(shù)據(jù)的可靠性
大數(shù)據(jù)時(shí)代帶來的一個(gè)重要副作用是,很難區(qū)分真假數(shù)據(jù),這也是當(dāng)前大數(shù)據(jù)技術(shù)必須重點(diǎn)解決的問題之一。從當(dāng)前大型Internet平臺(tái)采用的方法來看,它通常是技術(shù)和管理的結(jié)合。例如,通過對(duì)用戶進(jìn)行身份驗(yàn)證,可以解決某些數(shù)據(jù)的真實(shí)性(專業(yè)性)問題。
數(shù)據(jù)價(jià)值密度通常是衡量數(shù)據(jù)價(jià)值的重要基礎(chǔ)。大數(shù)據(jù)中的數(shù)據(jù)值密度較低,需要更快,更方便。完成數(shù)據(jù)的價(jià)值提取過程,這也是當(dāng)前大數(shù)據(jù)平臺(tái)的核心功能之一。
大數(shù)據(jù)分析具備哪些特點(diǎn).中琛魔方大數(shù)據(jù)平臺(tái)(www.zcmorefun.com)表示大數(shù)據(jù)是人們?cè)诖笠?guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完成的。大數(shù)據(jù)是人們獲得新的認(rèn)知,創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場、組織機(jī)構(gòu),以及“政府”與公民關(guān)系的方法。 |