商業(yè)智能的三個(gè)層次
經(jīng)過(guò)幾年的積累,大部分中大型的企事業(yè)單位已經(jīng)建立了比較完善的CRM、ERP和OA等基礎(chǔ)信息化系統(tǒng)。這些系統(tǒng)的統(tǒng)一特點(diǎn)是:業(yè)務(wù)人員或者用戶(hù)對(duì)數(shù)據(jù)庫(kù)進(jìn)行大量的增加、修改和刪除等操作,即聯(lián)機(jī)事務(wù)處理(Online Transaction Process,OLTP)。系統(tǒng)運(yùn)行了一段時(shí)間以后,必然幫助企事業(yè)單位收集大量的歷史數(shù)據(jù)。但是。在數(shù)據(jù)庫(kù)中分散、獨(dú)立存在的大量數(shù)據(jù)對(duì)于業(yè)務(wù)人員來(lái)說(shuō),只是一些無(wú)法看懶的天書(shū)。此時(shí),如何把數(shù)據(jù)轉(zhuǎn)化為業(yè)務(wù)人員(包括管理者)能夠看懂的有用信息,充分掌握、利用這些信息,并且輔助決策,就是商業(yè)智能要解決的主要問(wèn)題。
商業(yè)智能的實(shí)現(xiàn)有三個(gè)層次:數(shù)據(jù)報(bào)表、多維數(shù)據(jù)分析和數(shù)據(jù)挖掘。
1)數(shù)據(jù)報(bào)表
如何把數(shù)據(jù)庫(kù)中存在的數(shù)據(jù)轉(zhuǎn)變?yōu)闃I(yè)務(wù)人員需要的信息?大部分的答案是報(bào)表系統(tǒng)。簡(jiǎn)單說(shuō),報(bào)表系統(tǒng)是BI的低端實(shí)現(xiàn)。傳統(tǒng)的報(bào)表系統(tǒng)技術(shù)上已經(jīng)相當(dāng)成熟,大家熟悉的Excel、水晶報(bào)表和Reporting Service等都已經(jīng)被廣泛使用。但是,隨著數(shù)據(jù)的增多,需求的提高,傳統(tǒng)報(bào)表系統(tǒng)面臨的挑戰(zhàn)也越來(lái)越多。
(1)數(shù)據(jù)太多,信息太少。密密麻麻的表格堆砌了大量數(shù)據(jù).到底有多少業(yè)務(wù)人員仔細(xì)看過(guò)每一個(gè)數(shù)據(jù)?到底這些數(shù)據(jù)代表了什么信息、什么趨勢(shì)?級(jí)別越高的領(lǐng)導(dǎo),越需要簡(jiǎn)明的信息。
(2)難以交互分析、了解各種組合。定制好的報(bào)表過(guò)于死板。例如,我們可以在一張表中列出不同地區(qū)、不同產(chǎn)品的銷(xiāo)量,另一張表中列出不同地區(qū)、不同年齡段顧客的銷(xiāo)量。但是,這兩張表無(wú)法回答諸如“華北地區(qū)中青年顧客購(gòu)買(mǎi)數(shù)碼相機(jī)類(lèi)型產(chǎn)品的情況”等問(wèn)題。業(yè)務(wù)問(wèn)題經(jīng)常需要多個(gè)角度的交互分析。
(3)難以挖掘出潛在的規(guī)則。報(bào)表系統(tǒng)列出的往往是表面上的數(shù)據(jù)信息,但是海量數(shù)據(jù)深處含有哪些潛在規(guī)則呢?什么客戶(hù)對(duì)我們價(jià)值最大?產(chǎn)品之間相互關(guān)聯(lián)的程度如何'越是深層的規(guī)則,對(duì)于決策支持的價(jià)值越大,但是,也越難挖掘出來(lái)。
(4)難以追溯歷史,形成數(shù)據(jù)孤島。長(zhǎng)期運(yùn)行中產(chǎn)生的數(shù)據(jù)往往存在于不同地方,太舊的數(shù)據(jù)(例如一年前的數(shù)據(jù))可能已被業(yè)務(wù)系統(tǒng)備份出去,導(dǎo)致宏觀分析、長(zhǎng)期歷史分析難度很大。
顯然,隨著時(shí)代的發(fā)展,傳統(tǒng)報(bào)表系統(tǒng)已經(jīng)不能滿(mǎn)足日益增長(zhǎng)的業(yè)務(wù)需求了,企業(yè)期待著新的技術(shù)。數(shù)據(jù)分析和數(shù)據(jù)挖掘的時(shí)代正在來(lái)臨。值得注意的是,數(shù)據(jù)分析和數(shù)據(jù)挖掘系統(tǒng)的目的是帶給我們更多的決策支持價(jià)值,并不是取代數(shù)據(jù)報(bào)表。報(bào)表系統(tǒng)依然有其不呵取代的優(yōu)勢(shì),并且將會(huì)長(zhǎng)期與數(shù)據(jù)分析、挖掘系統(tǒng)一起并存下去。
2)多維數(shù)據(jù)分析
如果說(shuō)在線事務(wù)處理(OLTP)側(cè)重于對(duì)數(shù)據(jù)庫(kù)進(jìn)行增加、修改和刪除等日常事務(wù)操作,在線分析處理則側(cè)重于針對(duì)宏觀問(wèn)題全面分析數(shù)據(jù),獲得有價(jià)值的信息。為了達(dá)到OLAP的目的,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)已經(jīng)不夠了,需要一種新的技術(shù)叫做多維數(shù)據(jù)庫(kù)。
多維數(shù)據(jù)庫(kù)的概念并不復(fù)雜。舉一個(gè)例子,我們想描述2003年4月份可樂(lè)在北部地區(qū)銷(xiāo)售額10萬(wàn)元時(shí),涉及到幾個(gè)角度:時(shí)間、產(chǎn)品和地區(qū)。這些叫做維度。至于銷(xiāo)售額,叫做度量值。當(dāng)然,還有成本、利潤(rùn)等。
除了時(shí)間、產(chǎn)品和地區(qū),我們還可以有很多維度,例如客戶(hù)的性別、職業(yè)、銷(xiāo)售部門(mén)和促銷(xiāo)方式等。實(shí)際上,使用中的多維數(shù)據(jù)庫(kù)可能是一個(gè)8維或者15維的立方體。雖然結(jié)構(gòu)上15維的立方體很復(fù)雜,但是概念上非常簡(jiǎn)單。
數(shù)據(jù)分析系統(tǒng)的總體架構(gòu)分為4個(gè)部分:源系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、多維數(shù)據(jù)庫(kù)和客戶(hù)端。
①源系統(tǒng):包括現(xiàn)有的所有OLTP系統(tǒng),搭建BI系統(tǒng)并不需要更改現(xiàn)有系統(tǒng)。
②數(shù)據(jù)倉(cāng)庫(kù):數(shù)據(jù)大集中,通過(guò)數(shù)據(jù)抽取,把數(shù)據(jù)從源系統(tǒng)源源不斷地抽取出來(lái),可能每天一次,或者每3個(gè)小時(shí)一次,當(dāng)然是自動(dòng)的。數(shù)據(jù)倉(cāng)庫(kù)依然建立在關(guān)系型數(shù)據(jù)庫(kù)上,往往符合“星型結(jié)構(gòu)”模型。
③多維數(shù)據(jù)庫(kù):數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)經(jīng)過(guò)多維建模,形成了立方體結(jié)構(gòu)。每一個(gè)立方體描述了一個(gè)業(yè)務(wù)主題,例如銷(xiāo)售、庫(kù)存或者財(cái)務(wù)。
④客戶(hù)端:好的客戶(hù)端軟件可以把多維立方體中的信息豐富多彩地展現(xiàn)給用戶(hù)。
3)數(shù)據(jù)挖掘
廣義上說(shuō),任何從數(shù)據(jù)庫(kù)中挖掘信息的過(guò)程都州做數(shù)據(jù)挖掘。從這點(diǎn)看來(lái),數(shù)據(jù)挖掘就是BI。但從技術(shù)術(shù)語(yǔ)上說(shuō),數(shù)據(jù)挖掘(Data Mining)指的是:源數(shù)據(jù)經(jīng)過(guò)清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集。數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識(shí)的提煉,最后以合適的知識(shí)模式用于進(jìn)一步分析決策工作。從這種狹義的觀點(diǎn)上,我們可以定義:數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識(shí)的過(guò)程。數(shù)據(jù)挖掘往往針對(duì)特定的數(shù)據(jù)、特定的問(wèn)題,選擇一種或者多種挖掘算法,找到數(shù)據(jù)下面隱藏的規(guī)律,這些規(guī)律往往被用來(lái)預(yù)測(cè)、支持決策?,F(xiàn)舉一個(gè)關(guān)聯(lián)銷(xiāo)售的案例。美國(guó)的超市有這樣的系統(tǒng):當(dāng)你采購(gòu)了一車(chē)商品結(jié)賬時(shí),售貨員小姐掃描完了你的產(chǎn)品后,計(jì)算機(jī)上會(huì)顯示出一些信息,然后售貨員會(huì)友好地問(wèn)你:我們有一種一次性紙杯正在促銷(xiāo),位于F6貨架上,您要購(gòu)買(mǎi)嗎?這句話絕不是一般的促銷(xiāo)。因?yàn)橛?jì)算機(jī)系統(tǒng)早就算好了,如果你的購(gòu)物車(chē)中有餐巾紙、大瓶可樂(lè)和沙拉,則86%的可能性你要買(mǎi)一次性紙杯。結(jié)果是你說(shuō):“啊,謝謝你,我剛才一直沒(méi)找到紙杯。”
這不是什么神奇的科學(xué)算命,而是利用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)的系統(tǒng)。每天,新的銷(xiāo)售數(shù)據(jù)會(huì)進(jìn)入挖掘模型,與過(guò)去N天的歷史數(shù)據(jù)一起被挖掘模型處理,得到當(dāng)前最有價(jià)值的關(guān)騏規(guī)則。同樣的算法,分析網(wǎng)上書(shū)店的銷(xiāo)售業(yè)績(jī),計(jì)算機(jī)可以發(fā)現(xiàn)產(chǎn)品之間的關(guān)聯(lián)以及關(guān)聯(lián)的強(qiáng)弱。
溫馨提示:因考試政策、內(nèi)容不斷變化與調(diào)整,信管網(wǎng)網(wǎng)站提供的以上信息僅供參考,如有異議,請(qǐng)以權(quán)威部門(mén)公布的內(nèi)容為準(zhǔn)!
信管網(wǎng)致力于為廣大信管從業(yè)人員、愛(ài)好者、大學(xué)生提供專(zhuān)業(yè)、高質(zhì)量的課程和服務(wù),解決其考試證書(shū)、技能提升和就業(yè)的需求。
信管網(wǎng)軟考課程由信管網(wǎng)依托10年專(zhuān)業(yè)軟考教研傾力打造,官方教材參編作者和資深講師坐鎮(zhèn),通過(guò)深研歷年考試出題規(guī)律與考試大綱,深挖核心知識(shí)與高頻考點(diǎn),為學(xué)員考試保駕護(hù)航。面授、直播&錄播,多種班型靈活學(xué)習(xí),滿(mǎn)足不同學(xué)員考證需求,降低課程學(xué)習(xí)難度,使學(xué)習(xí)效果事半功倍。
發(fā)表評(píng)論 查看完整評(píng)論 | |