
ETL大數(shù)據(jù)培訓(xùn)機(jī)構(gòu)有哪些內(nèi)容
ETL,英文Extract-Transform-Load的縮寫,用于描述從源端抽取數(shù)據(jù)(extract)、轉(zhuǎn)換(transform)、裝載(load)到目的地的過(guò)程。ETL一詞通常用于數(shù)據(jù)倉(cāng)庫(kù),但是它的對(duì)象不僅限于數(shù)據(jù)倉(cāng)庫(kù)。
ETL是將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)抽取、清洗轉(zhuǎn)換后,裝入數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程,旨在把部門內(nèi)零散、零散、標(biāo)準(zhǔn)不統(tǒng)一的數(shù)據(jù)整合起來(lái),以供辦案決策時(shí)參考。ETL是BI項(xiàng)目中的關(guān)鍵環(huán)節(jié)。一般來(lái)說(shuō),在BI項(xiàng)目中ETL花費(fèi)了整個(gè)項(xiàng)目至少1/3的時(shí)間,ETL設(shè)計(jì)的優(yōu)劣直接關(guān)系到與BI項(xiàng)目的成敗。
ETL系統(tǒng)設(shè)計(jì)分為三個(gè)部分:數(shù)據(jù)提取、數(shù)據(jù)清理轉(zhuǎn)換、數(shù)據(jù)裝載。我們?cè)O(shè)計(jì)ETL時(shí)也是從這三個(gè)方面開始的。提取數(shù)據(jù)是從各種不同的數(shù)據(jù)源提取到ODS(OperationalDataStore,運(yùn)作型數(shù)據(jù)存儲(chǔ)),這一過(guò)程還可以進(jìn)行一些數(shù)據(jù)的清理和轉(zhuǎn)換),在提取過(guò)程中需要選擇不同的提取方法,盡可能地提高ETL的運(yùn)行效率。在ETL三個(gè)部分中,花費(fèi)時(shí)間最長(zhǎng)的部分是"T"(Transform,清洗,轉(zhuǎn)換),這個(gè)部分通常只占整個(gè)ETL的2/3。通常,在完成數(shù)據(jù)清理后,數(shù)據(jù)的裝載直接寫入DW(DataWarehousing,數(shù)據(jù)倉(cāng)庫(kù))。
以上是關(guān)于小編的一些分析,希望對(duì)大家有所幫助,詳細(xì)了解可詢問(wèn)線上客服,或者客服處留言哦,我們會(huì)盡快回復(fù)您,詳細(xì)為您解答……