數(shù)據(jù)中臺是什么意思?數(shù)據(jù)中臺包含哪些內(nèi)容?
數(shù)據(jù)中臺是什么意思?
數(shù)據(jù)中臺是對既有/新建信息化系統(tǒng)業(yè)務(wù)與數(shù)據(jù)的沉淀,是實現(xiàn)數(shù)據(jù)賦能新業(yè)務(wù)、新應(yīng)用的中間、支撐性平臺。
數(shù)據(jù)中臺是指通過數(shù)據(jù)技術(shù),對海量數(shù)據(jù)進行采集、計算、存儲、加工,同時統(tǒng)一標準和口徑。數(shù)據(jù)中臺把數(shù)據(jù)統(tǒng)一之后,會形成標準數(shù)據(jù),再進行存儲,形成大數(shù)據(jù)資產(chǎn)層,進而為客戶提供高效服務(wù)。
數(shù)據(jù)中臺是在政企數(shù)字化轉(zhuǎn)型過程中,對各業(yè)務(wù)單元業(yè)務(wù)與數(shù)據(jù)的沉淀,構(gòu)建包括數(shù)據(jù)技術(shù)、數(shù)據(jù)治理、數(shù)據(jù)運營等數(shù)據(jù)建設(shè)、管理、使用體系,實現(xiàn)數(shù)據(jù)賦能。數(shù)據(jù)中臺,是新型信息化應(yīng)用框架體系中的核心。
數(shù)據(jù)中臺包含什么內(nèi)容?
1.數(shù)據(jù)采集
為數(shù)據(jù)中臺提供匯集數(shù)據(jù)的能力,應(yīng)提供統(tǒng)一的數(shù)據(jù)獲取接入方式,數(shù)據(jù)來源包括內(nèi)部數(shù)據(jù)和外部數(shù)據(jù),數(shù)據(jù)類型應(yīng)支持結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)采集。傳統(tǒng)的ETL工具仍然可以復(fù)用,實現(xiàn)數(shù)據(jù)采集、轉(zhuǎn)換、加載等關(guān)鍵處理過程。
2.數(shù)據(jù)計算
為數(shù)據(jù)中臺提供統(tǒng)一的大數(shù)據(jù)計算能力,針對不同大數(shù)據(jù)處理場景,所需提供的數(shù)據(jù)計算能力也不同,一般主要包括批量離線計算、內(nèi)存計算、在線流式計算等,可用到的技術(shù)有數(shù)據(jù)挖掘,大數(shù)據(jù)分析,云計算等。
3.數(shù)據(jù)存儲
數(shù)據(jù)中臺中全域數(shù)據(jù)的存儲中心,按照不同的數(shù)據(jù)類型,可以采用圖中一種或多種數(shù)據(jù)存儲系統(tǒng)的“混搭”架構(gòu)。傳統(tǒng)數(shù)據(jù)倉庫(如DB2/ORACLE)是最為穩(wěn)定的數(shù)據(jù)存儲方式,承載著及時性、準確性要求高的企業(yè)核心應(yīng)用。分布式關(guān)系數(shù)據(jù)庫,也常簡稱為MPP數(shù)據(jù)庫,相較于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,具有高性能處理能力、高數(shù)據(jù)吞吐能力的優(yōu)勢。
NoSQL分布式數(shù)據(jù)庫屬于非關(guān)系型數(shù)據(jù)庫管理系統(tǒng),在大數(shù)據(jù)簡單存取上具備關(guān)系型數(shù)據(jù)庫無法比擬的性能優(yōu)勢。分布式文件系統(tǒng)(HDFS)是當前最常見的大數(shù)據(jù)存儲方式,它具極高的性價比,擴展性強。數(shù)據(jù)湖作為一種新的存儲大量復(fù)雜格式數(shù)據(jù),避免企業(yè)數(shù)據(jù)孤島化的數(shù)據(jù)架構(gòu)方案,可用來將不同結(jié)構(gòu)的數(shù)據(jù)統(tǒng)一聚合和存儲。
4.數(shù)據(jù)治理
指的是為了實現(xiàn)對企業(yè)中數(shù)據(jù)資產(chǎn)價值的獲取、管控、交付等目的,基于制定的數(shù)據(jù)規(guī)范,對數(shù)據(jù)資產(chǎn)所做的一系列管理活動。數(shù)據(jù)標準管理指對數(shù)據(jù)口徑、公共術(shù)語、參考數(shù)據(jù)、數(shù)據(jù)編碼等制定和實施標準化的管理活動。數(shù)據(jù)模型管理負責對系統(tǒng)中核心的邏輯模型、物理模型、數(shù)據(jù)庫表、字段、視圖等進行統(tǒng)一管控、促進其規(guī)范化。
5.數(shù)據(jù)服務(wù)
包括了與業(yè)務(wù)相關(guān)的、可復(fù)用的一些公共技術(shù)組件或產(chǎn)品,如數(shù)據(jù)目錄、數(shù)據(jù)標簽、數(shù)據(jù)分析、數(shù)據(jù)開放接口、機器學習算法模型等,它們可以使用SAAS方式直接對外提供服務(wù),也可以以更小粒度如API、消息接口、文件接口、服務(wù)接口、SDK軟件包等方式只提供組件能力或數(shù)據(jù)服務(wù),內(nèi)部或外部第三方應(yīng)用不必關(guān)心底層數(shù)據(jù)準備情況,直接調(diào)用數(shù)據(jù)服務(wù)模塊對外提供的服務(wù)接口,就可以方便進行二次開發(fā),借以增強自身的能力。
-
Infocode藍暢 評論
?數(shù)據(jù)中臺的起源
“中臺”某種意義上是一個正宗的中國概念,早在2015年,馬老師訪問過北歐的Supercell游戲公司之后,便提出了這個概念。隨之而來的,是阿里帶動的“大中臺、小前臺”運動。這個概念聽起來還是非常不錯的,因為整合技術(shù)力量,既能夠有效降低研發(fā)成本,也能夠帶來業(yè)務(wù)上更多的試錯機會。但當大家投入進去之后才發(fā)現(xiàn),中臺的建設(shè)成本如此之大,乃至于一般小公司無法負擔起基礎(chǔ)的成本。大公司倒是搞好了,但依然無法實現(xiàn)“小前臺”的理念,業(yè)務(wù)依舊需要定制開發(fā)。其實這就是今天大家對中臺有意見的原因,因為技術(shù)上能夠整合,但業(yè)務(wù)上卻難以體現(xiàn)其價值。
3年前