日韩一级二级一区二区_超级国产人人偷人人干_日本日本乱码伦视频在线_亚洲性视频日韩性视频

 中國簡單快捷的免費(fèi)行業(yè)信息發(fā)布平臺
·手機(jī)版 ·注冊 ·登錄 ·會員中心 ·忘了密碼 ·導(dǎo)航 ·幫助
名站在線LOGO
·設(shè) 為 首 頁
·收 藏 本 站
·新 站 登 錄
網(wǎng)站首頁
|
行業(yè)供求
|
行業(yè)產(chǎn)品
|
行業(yè)公司
|
站內(nèi)檢索
|
行業(yè)資訊
|
網(wǎng)站導(dǎo)航
|
鏈接交換
|
流量交換
|
網(wǎng)友收藏
您當(dāng)前的位置: 首頁 > 行業(yè)貼吧 > 話題


行業(yè)貼吧

(注意:網(wǎng)友的發(fā)布表不代表本站立場。)
回復(fù)話題
發(fā)新話題
返回列表
話題: 數(shù)據(jù)中臺的作用有哪些
183.17.228.*
2020-03-25 13:53:30
  數(shù)據(jù)平臺是通過系統(tǒng)的方式實(shí)現(xiàn)企業(yè)大數(shù)據(jù)的統(tǒng)一、規(guī)范、安全、共享的數(shù)據(jù)組織方式,以服務(wù)方式實(shí)現(xiàn)前臺數(shù)據(jù)的應(yīng)用,提高數(shù)據(jù)的使用效率,那么數(shù)據(jù)中通究竟解決了什么問題。歸總起來,主要有三點(diǎn):效率、質(zhì)量和成本。



  一、效率



  效率問題可以分為數(shù)據(jù)研發(fā)的效率、數(shù)據(jù)發(fā)現(xiàn)的效率和數(shù)據(jù)分析的效率。



  首先是數(shù)據(jù)研發(fā)的效率,在很多項(xiàng)目中,在項(xiàng)目初期由于業(yè)務(wù)模式還不固定,變化比較快,往往缺少良好的主題域和分層的設(shè)計,煙囪式的開發(fā)模式占據(jù)了主導(dǎo),隨著業(yè)務(wù)復(fù)雜度和規(guī)模的上升,大量重復(fù)性的數(shù)據(jù)開發(fā),制約了數(shù)據(jù)需求交付效率。一個需求往往需要一個星期甚至更長的時間才能上線,需求響應(yīng)速度經(jīng)常被業(yè)務(wù)部門詬病。



  其次是數(shù)據(jù)發(fā)現(xiàn)的效率,由于開發(fā)數(shù)據(jù)的和使用數(shù)據(jù)的往往是不同的人,面對動輒數(shù)萬張表,每張表有數(shù)十個甚至上百個字段,準(zhǔn)確理解每張表的含義是一件非常困難的事。如果沒有一個好用的系統(tǒng),往往需要大量的溝通成本,對于數(shù)據(jù)開發(fā),經(jīng)常抱怨工作被打斷,每天都在回答重復(fù)性的問題;對于分析師而言,想要知道有哪些數(shù)據(jù)可以用,找到自己想要的數(shù)據(jù),需要花費(fèi)大量的時間。在網(wǎng)易,建設(shè)數(shù)據(jù)中臺之前,很多業(yè)務(wù)都在用很原始的方法,每個分析師都自己維護(hù)了一個Excel,相當(dāng)于自己的知識庫,記錄著一些常用的表。一個新的分析師想要了解數(shù)據(jù),需要花費(fèi)大量的時間。



  **是數(shù)據(jù)分析的效率,我們希望越來越多的人能夠基于數(shù)據(jù)進(jìn)行分析決策,但是數(shù)據(jù)分析本身確實(shí)存在門檻,取數(shù)對于大多數(shù)非技術(shù)專業(yè)的運(yùn)營和分析師就是一個大問題,經(jīng)?吹揭粋分析師的SQL把整個集群資源跑滿還跑不出來,經(jīng)常看到分析師遇到一個SQL異常不知所措。另外,傳統(tǒng)的數(shù)據(jù)分析依賴的是分析師的經(jīng)驗(yàn),一個指標(biāo)異常波動,需要從哪些維度去分析,完全靠分析師的個人技能,如何將經(jīng)驗(yàn)變成一種知識,甚至是一種規(guī)范,沉淀到產(chǎn)品中,通過系統(tǒng)自動地進(jìn)行全維度的鉆取分析,降低數(shù)據(jù)分析的門檻,這其實(shí)也是業(yè)務(wù)面臨的難題。



  二、質(zhì)量



  質(zhì)量是數(shù)據(jù)中臺需要解決的第二個問題,質(zhì)量包括數(shù)倉設(shè)計的質(zhì)量、指標(biāo)的一致性、1.數(shù)據(jù)研發(fā)的質(zhì)量。



  數(shù)倉設(shè)計得***,主要體現(xiàn)在三個方面,完善度、復(fù)用性和規(guī)范性。數(shù)倉設(shè)計一般采用的是面向主題域的分層設(shè)計,對于ODS層保存的是業(yè)務(wù)原始數(shù)據(jù),DWD保存的是經(jīng)過清洗的明細(xì)數(shù)據(jù),DWS是經(jīng)過輕度聚合的匯總數(shù)據(jù),ADS或者DM是應(yīng)用層、集市層數(shù)據(jù),這是一個常見的4層模型劃分。完善度的意思就是對于使用者而言,“要啥有啥”,對于不同分層,完善度的衡量方式也是有區(qū)別的,對于明細(xì)層,如果數(shù)倉中存在匯總層(DWS)數(shù)據(jù)直接引用ODS原始數(shù)據(jù)的情況,我們稱之為跨層引用,這就說明細(xì)層數(shù)據(jù)建設(shè)是有缺失的,如果其他匯總層也要使用相同的數(shù)據(jù),都從ODS層去引用,就存在重復(fù)清洗的問題。對于匯總層數(shù)據(jù)而言,如果Query覆蓋率比較低,說明大量的查詢都是直接查詢明細(xì)數(shù)據(jù),甚至是原始數(shù)據(jù),這就說明匯總層數(shù)據(jù)建設(shè)完善度不夠,對于使用數(shù)據(jù)的人而言,查詢明細(xì)數(shù)據(jù),不僅慢,而且查詢成本高,經(jīng)常出現(xiàn)一個查詢hang住整個集群的情況。復(fù)用性主要強(qiáng)調(diào)的是一個表被多個表使用的情況,復(fù)用性越高,說明數(shù)倉的設(shè)計越合理,更多的數(shù)據(jù)在數(shù)倉被復(fù)用。規(guī)范性主要是指數(shù)倉中的表、字段的命名規(guī)范統(tǒng)一,相同指標(biāo)、維度、度量的標(biāo)識是一致的。



  2.指標(biāo)是數(shù)據(jù)加工的結(jié)果(也可能是中間結(jié)果),指標(biāo)管理的核心在于確保指標(biāo)的業(yè)務(wù)口徑、計算邏輯和數(shù)據(jù)來源的一致,**指標(biāo)的二義性。數(shù)據(jù)開發(fā)經(jīng)常遇到的一個情況是,兩個數(shù)據(jù)產(chǎn)品,看到相同的一個指標(biāo),結(jié)果不一致,這可能是口徑不一致導(dǎo)致的,當(dāng)然也有可能是數(shù)據(jù)來源不一致導(dǎo)致的。



  3.質(zhì)量還包括數(shù)據(jù)的質(zhì)量,這里面包括數(shù)據(jù)的一致性、準(zhǔn)確性、及時性以及完整性。數(shù)據(jù)的一致性,具體表現(xiàn)在集市層相同的指標(biāo)數(shù)據(jù)是否一致,維度是否一致,相關(guān)指標(biāo)的趨勢是否一致,不同數(shù)據(jù)源對同一個實(shí)體的值是否一致。準(zhǔn)確性體現(xiàn)在數(shù)值計算的邏輯是否符合預(yù)期,數(shù)據(jù)格式是否正確。曾經(jīng)我們有過一個深刻的教訓(xùn),在電商業(yè)務(wù)中,由于業(yè)務(wù)側(cè)更新上線后部分IP格式有問題,導(dǎo)致流量域、交易域部分指標(biāo)出現(xiàn)異常波動。由于沒有對數(shù)據(jù)進(jìn)行質(zhì)量稽查,問題的排查和定位花費(fèi)了大量的時間。及時性主要體現(xiàn)在數(shù)據(jù)產(chǎn)出時延,我們一般通過數(shù)倉數(shù)據(jù)在指定時間(比如5點(diǎn)之前)產(chǎn)出完成率來衡量。另外對于實(shí)時數(shù)據(jù),對時效性要求比較高,我們會拿數(shù)據(jù)計算延遲來衡量。完整性主要是表記錄是否完整,包括記錄數(shù)是否完整,字段是否完成。



  三、成本



  成本是數(shù)據(jù)中臺需要解決的第三個問題,成本包括計算資源成本、存儲資源的成本以及人力研發(fā)成本。



  數(shù)據(jù)就像手機(jī)里面的文件,如果不定時清理,手機(jī)存儲空間永遠(yuǎn)不夠用。我們經(jīng)常發(fā)現(xiàn),大數(shù)據(jù)成本比業(yè)務(wù)增長還要快,這一方面是由于煙囪式的開發(fā)導(dǎo)致的數(shù)據(jù)重復(fù)加工,浪費(fèi)計算和存儲資源,另一方面也是由于沒有定時清理,及時將無用的數(shù)據(jù)和任務(wù)下線,導(dǎo)致已經(jīng)沒人看的報表,每天還從幾十億行的原始數(shù)據(jù)進(jìn)行計算加工,浪費(fèi)大量的資源。人力的成本其實(shí)跟效率有關(guān)系,如果效率得到提升,研發(fā)成本也會得到控制。



  效率、質(zhì)量、成本,這三個方面相互聯(lián)系,我認(rèn)為這是數(shù)據(jù)中臺要解決的最重要的三個問題。



  數(shù)據(jù)中臺的作用有哪些.中琛魔方大數(shù)據(jù)(www.zcmorefun.com)表示數(shù)據(jù)中臺的的意義和作用,就是把數(shù)據(jù)這種生產(chǎn)資料轉(zhuǎn)變?yōu)閿?shù)據(jù)生產(chǎn)力。在全球數(shù)據(jù)化的時代,企業(yè)只有做到了解用戶,在數(shù)據(jù)支持的情況下不斷創(chuàng)新,打破數(shù)據(jù)孤島,才能在日漸激烈的競爭中長久的保持優(yōu)勢。
共0個回復(fù)
回復(fù)話題
發(fā)新話題
返回列表



新站登錄--網(wǎng)站簡介--流量交換--名站收藏夾--廣告服務(wù)--友情鏈接--免責(zé)聲明--聯(lián)系我們--意見建議--違法舉報--侵權(quán)舉報
Copyright 2005-2025 名站在線[fwol.cn]版權(quán)所有 經(jīng)營許可證:粵ICP備17047754號