商業智慧 (BI) 第3章 練習題繳交 (乙班作業)
問答題 1. 請說明何謂維度模型 (Dimensional Model)? 2. 在建置 BI 系統時經常會使用到維度模型 (Dimensional Model) 建構需求, 請說明為何維度模型是一個可行的資料模型? 3. 何謂匯流排架構 (Bus Architecture) 機制?在建構 BI 系統其存在的目的為 何?請說明。 4. 何謂一致的維度 (Conformed dimensions) 資料?何謂一致的事實 (Conformed facts) 資料?此二類資料與匯流排架構 (Bus Architecture) 機制 的關係為何? 5. 請描述代理鍵 (Surrogate key, SK) 與自然鍵 (Natural keys, NK) 的意義與功 用,並說明此二者的差別。 6. 請描述退化維度 (Degenerate Dimensions, DD) 的意義,並舉一例子說明。 7. 在建置 BI 系統時哪一種維度資料表一定會出現在維度模型中而且是必須 存在的,請說明。 8. 請說明變動緩慢的維度資料表有哪幾種處理的方法? 9. 請說明將不同顆粒度的事實欄位放在同一張事實資料表會產生什麼樣的 錯誤? 10. 在維度模型中,儲存在事實資料表中的可衡量事件可區分成三種基本型 態,分別為交易明細 (Transactional Detail) 事實資料、週期快照 (Periodic Snapshots) 事實資料以及累積快照 (Accumulating Snapshots) 事實資料,請 描述這三種類型事實資料表的意義,並說明比較這三者之間的差異。 選擇題 1.( )目前BI系統設計以用簡易的視覺化拖曳(Drag & Drop)方式來進行資料選取,下列有關BI系統的描述何者正確 (A)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值相同者進行加總(Sum)的計算 (B)從事實資料表中挑選出來的數值性內容的欄位,都會依據同一群組的資料值進行群組(Group By)的動作 (C)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值不相同者進行加總(Sum)的動作 (D)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值相同者進行群組(Group By)的動作 2.( )下列哪一選項是維度模型(Dimensional Model)的別稱 (A)星狀綱要(Star Schema) (B)實體關係體模型(Entity Relationship Model, ERM) (C)物件導向資料模型(Object-Oriented Data Model) (D)關聯式資料模型(Relational Data Model) 3.( )下列有關實體關係體模型(Entity Relationship Model, ERM)不適合BI系統設計的描述何者錯誤 (A)ERM內資料需正規化(Normalization)技術分析過 (B)ERM太過細碎因此不適合非IT人員閱讀 (C)ERM查詢時候需作很多速度慢的合併(Join) 運算 (D)以上皆錯 4.( )在1997年Kimball提出的全新的資料模型架構稱為維度模型(Dimensional Model),下列有關維度模型的描述何者錯誤 (A)此模型又稱為星狀綱要(Star Schema) (B)此模型不建議以實體關係體圖(Entity Relationship Diagrams, ERD)來呈現 (C)一個維度模型只會有一個核心即一張維度資料表 (D)模型中間核心的資料表稱為事實資料表(Fact Table) 5.( )下列有關星狀綱要(Star Schema)的描述何者正確 (A)整個模型在正中央核心部分會以一張資料表來表示,稱為維度資料表(Dimension Table) (B)星狀綱要如同一顆星星形狀,而星星會從中央核心射出許多閃爍的光芒,每一道光芒都以一張資料表來表示,稱為事實資料表(Fact Table) (C)因為每一道光芒即代表一個維度方向或一個看資料角度的概念,所以此模型也稱為維度模型 (D)不可新增維度資料表到已定義好的模型中 6.( )下列有關維度模型(Dimensional Model)的描述何者錯誤 (A)正中間的事實資料表主要用來表達企業組織在經營管理上可以清楚地被衡量(Measurement)且可以被拿來使用的績效(Performance)指標 (B)模型中環繞核心維度資料表的為事實資料表 (C)事實資料表內所儲存的都是記錄著企業組織在日常營運上每一件事情實際所產生的資料,所以稱為事實資料表 (D)存在事實資料表格內的資料都稱為事實(Facts) 7.( )下列哪些描述選項是維度模型化的優點 (1) 容易瞭解(Understandability) (2) 查詢運算快(Query Performance) (3) 模型中每一個維度資料表的重要性都相同 (4) 可以容納非預期中的新資料(Accommodate Unexpected New Data) (5) 只需要進行到第三正規型關聯表 (6)不需要反正規化技術 (A)1345 (B)1234 (C)1236 (D)1246 8.( )維度模型工作必須辨別且擷取出可衡量(Measurements)的數值資料部份以及情境化(Context)的文字敘述資料部分,下列描述何者正確 (A)可衡量(Measurements)的數值資料部份就是指事實資料 (B)情境化(Context)的文字敘述資料部分就是指事實資料 (C)可衡量(Measurements)的數值資料部份就是指主鍵資料 (D)情境化(Context)的文字敘述資料部分就是指外來鍵資料 9.( )維度模型中事實資料表的基本結構包含下列哪三個部份 (1) 擁有一組對應聯結到維度模型中各個維度資料表的外來鍵(Foreign Keys, FK) (2) 會有一個或者多個數值型態的欄位用來儲存事實資料 (3) 可能包含一個或者多個退化維度(Degenerate Dimensions, DD)的欄位 (4) 具有唯一性的超級鍵(Super Keys) (5) 具有一種RSA特性的加密欄位來確保資訊安全 (A)234 (B)145 (C)345 (D)123 10.( )有關下列維度模型中事實資料表的顆粒度(Fact Table Granularity)描述何者錯誤 (1) 顆粒度是描述事實資料表中衡量欄位的精細度 (2) 同一張事實資料表中所有衡量欄位可以有不相同的精細度 (3) 如果顆粒度是指一天的營業額,則銷售量與銷售金額就是一整天訂單中的銷售量與銷售金額的加總 (4) 如果顆粒度是訂單,則銷售金額與銷售量就是加總一整張訂單上的列項目所得的銷售量與銷售金額 (5) 同一張事實資料表中所有衡量欄位都要有相同的精細度 (6) 如果顆粒度是訂單中列項目(Line Item), 則銷售數量與銷售金額都是指某個品項在某張訂單中的銷售數字 (7) 儲存顆粒的大小的設定工作通常會是使用BI系統的決策者在訪談與討論前負責設定 (A)14 (B)35 (C)27 (D)56 | 全部共 25則留言 |
| 03-02 16:23: | 10114D082簡石維 2.維度模型的特點有下列幾點:
(1). 容易瞭解 (Understandability)
因為維度模型化過程中將企業營運的資訊依照相關性分類到同一個維度
資料表中,如此做法讓主管很容易就可以瞭解到執行某一業務的企業流程會
跟哪些資訊 (即模型中的維度資料) 有直接相關,並且同時也可以透過事實資
料表中的事實資料掌握到企業流程執行的績效程度,以較為簡單的方式 (並
非簡化) 呈現資訊讓企業主管容易操作。
(2). 查詢快 (Query performance)
相對應於傳統 ERM,維度模型可減少大量的 Join 運作,因此可以節省
查詢時間。
(3). 均衡的維度資料表 (Symmetric dimension tables)
模型中每一個維度資料表的重要性都相同,如此的架構可以很方便的組
合出查詢報表 (Ad-hoc queries)。
(4). 可以容納非預期中的新資料 (Accommodate unexpected new data)
維度模型可以很方便地容納新的資料加入。模型可允許加入新的欄位到
維度資料表中;如果是加入新的維度資料表,只要此表不影響到資料顆粒度
(顆粒度隨後會有詳細說明),也可加到模型中;而新的事實欄位也可在不影
響顆粒度前提下加到模型中。加入這些新資料並不會使查詢結果錯誤,同時
也不會改到已存在舊報表的查詢結果。
選擇題第二題:(A)星狀綱要(Star Schema) |
| 03-02 16:25: | 10114D084 高健智
4.何謂一致的維度 (Conformed dimensions) 資料?何謂一致的事實
(Conformed facts) 資料?此二類資料與匯流排架構 (Bus Architecture) 機制
的關係為何?
(1)兩張維度資料表如果是一致的,表示整張維度資料的所有欄位定義是一樣的,而且資料也都相同
(2)一致的事實資料有兩層含意,第一就是欄位相同,第二就是資料也都相同
(3)匯流排 (Bus) 這個字是傳統
發電廠運作的專用術語,而現在廣泛使用在電腦產業中,匯流排是指一個通
用的硬體介面,很多設備可與之相連接並分享所需要資料。BI 系統的匯流排
架構亦扮演相同角色,如圖 3-21 所示,所有可用的維度資料表與事實欄位都
在匯流排中占有一條渠道,而各部門所需的維度模型就在排線上根據所需擷
取資料。圖 3-21 上有三個維度模型在匯流排架構上,以採購訂單維度模型為
例,它的接角插在採購量、日期、產品、倉儲、採購商與訂貨商上,因此它
會與零售店庫存維度模型分享日期與產品兩個維度資料表。經由使用同一匯
流排,就可使各部門分享相同的資料欄位與資料表而避免同名異義。而匯流
排上所有事實資料與維度資料表的設計如都透過一個單位掌控,就可進一步
避免異名同義的問題。其實細心的讀者應可發現,採用此法各維度模型中的
同名維度資料表有一致 (Conformed) 的關係。
在模型設計過程,除了維度資料表要一致外,事實欄位也要一致,而運
用資料倉儲匯流排架構可達到此目標。
4.( C )在1997年Kimball提出的全新的資料模型架構稱為維度模型(Dimensional Model),下列有關維度模型的描述何者錯誤
(A)此模型又稱為星狀綱要(Star Schema)
(B)此模型不建議以實體關係體圖(Entity Relationship Diagrams, ERD)來呈現
(C)一個維度模型只會有一個核心即一張維度資料表
(D)模型中間核心的資料表稱為事實資料表(Fact Table) |
| 03-02 20:29: |
10114D076吳宸鋒
6. 請描述退化維度 (Degenerate Dimensions, DD) 的意義,並舉一例子說明。
(1)在企業營運活動中交易控制文件的資料是
來源系統或 ERP 系統主要處理的對象,例如訂單、發票、提
貨單 等。這些控制文件相當於一筆交易,而交易內容可能包含單一品項或者多個列項目,因此以交易控制文件資料為
主的 BI 系統建置在實務上是經常可見的。
(2)如圖 3-25 所示,這一類的文件都
有一個特色就是文件結構是屬於父子 (Parent-child) 結構,更精確地說就是文
件上只有一筆交易文件表頭記錄 (Transaction header record),但是文件的主體
(Transaction body) 可以填入許多筆交易品項記錄,可參考圖 3-9 中的範例。
除此之外,模型化過程很容易就將文件中的各項資料分類好並且歸納到適當
的維度資料表中。除了一個相當尷尬的訂單維度資料表,這表中除了訂單編
號欄位之外別無其他欄位。這樣的維度資料表並沒有邏輯上的錯誤,只是資
料有點少。如果想改變此狀況,可將訂單編號直接納入事實資料表中,原來
的訂單維度資料表則不再需要,訂單維度資料表因為被收到事實資料表中因
此稱為退化維度 (Degenerate Dimensions, DD),如圖 3-26 所示。雖然此欄位
無可加總性,但可用以篩檢同一筆訂單的交易資料。
6.(B)下列有關維度模型(Dimensional Model)的描述何者錯誤:
(B)模型中環繞核心維度資料表的為事實資料表
|
| 03-02 22:58: | 10114D088 陳彥谷8. 請說明變動緩慢的維度資料表有哪幾種處理的方法?三種不同處理方法(1). 直接改寫維度屬性資料 (Type I)(2). 新增加一筆維度資料 (Type II)(3). 新增加一個維度屬性 (Type III)8.(A)維度模型工作必須辨別且擷取出可衡量(Measurements)的數值資料部份以及情境化(Context)的文字敘述資料部分,下列描述何者正確(A)可衡量(Measurements)的數值資料部份就是指事實資料
|
| 03-02 23:04: | 10114D070楊星翰 1.請說明何謂維度模型 (Dimensional Model)? 在 1997 年 Kimball 提出的全新的資料模型架構稱為維度模型(Dimensional Model),模型輪廓如圖 3-3 所示,因為模型整體的外觀上類似人類在地球上仰望夜空中所見星星 (Star) 一般,故又稱星狀綱要 (Starschema)。整個模型在正中央核心部分會以一張資料表來表示,星星會從中央核心射出許多閃爍的光芒,每一道光芒都以一張資料表來表示,中間核心的資料表稱為事實資料表 (Fact table),每一道光芒所對應到的資料表稱為維度資料表 (Dimension table),而一個維度模型只會有一個核心即一張事實資料表,至於維度資料表的數量則要依照個案情境而定。此外,因為每一道光芒即代表一個維度,所以此模型也稱為維度模型。1.( D )目前BI系統設計以用簡易的視覺化拖曳(Drag & Drop)方式來進行資料選取,下列有關BI系統的描述何者正確?(A)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值相同者進行加總(Sum)的計算 (B)從事實資料表中挑選出來的數值性內容的欄位,都會依據同一群組的資料值進行群組(Group By)的動作(C)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值不相同者進行加總(Sum)的動作(D)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值相同者進行群組(Group By)的動作
|
| 03-03 00:04: | 10114D070楊星翰 10. 在維度模型中,儲存在事實資料表中的可衡量事件可區分成三種基本型態,分別為交易明細 (Transactional Detail) 事實資料、週期快照 (PeriodicSnapshots) 事實資料以及累積快照 (Accumulating Snapshots) 事實資料,請描述這三種類型事實資料表的意義,並說明比較這三者之間的差異。
ANS:
儲存在事實資料表中的可衡量事件可區分成三種基本型態,分別為交易明細 (Transactional detail) 事實資料、週期快照 (Periodic snapshots) 事實資料以及累積快照 (Accumulating snapshots) 事實資料。
(1). 交易事實資料表 (Transaction fact tables)
最常見的事實資料表,交易事實資料表內容記錄著交易 (或事務) 活動發
生時候,活動內容中可以衡量的數值性的資料
(2). 週期快照事實資料表 (Periodic Snapshot fact tables)
有些企業流程中的活動內容所產生的可以衡量的數值性資料並不適合記錄詳細的交易內容,例如銀行的帳戶餘額 (Account balance)、財會部門的財務報表 (Financial reports)、倉儲單位的存貨水準 (Inventory levels),這些事實資料都屬於半可加性 (Semi-additive) 的可衡量的數值性資料,在維度模型中記錄詳細的半可加性事實資料的增加或減少的變動對企業主而言是比較沒有實際上幫助。最佳的方式是以每隔一段固定時間取值,猶如用照相機擷取影像的方式來記錄事實資料,換言之就是把週期的期末狀況顯示出來一樣,就好像每一個月月底所收到的各式各樣的帳單 (Bills) 內的數字一樣,此稱為週期快照 (Periodic snapshots)。實務上倉儲的庫存盤點報告內容即為週期快照事實資料的一種。
(3). 累積快照事實資料表 (Accumulating snapshot fact tables)
企業流程是由許多串連活動的執行而組成,公司的專案經理人 (Project manager, PM) 需要有一種可以記錄整個企業流程步驟的事實資料表,以便時時可以注意到跨步驟或跨活動資訊來掌握全面性資訊,這樣的事實資料表稱為累積快照事實資料表 (Accumulating snapshot fact tables)。累積 (Accumulating) 一詞的意思就是指這些事情 (活動、步驟、事件) 不會在同一時間完成,因此必須透過許多記錄時間的欄位在事情完成後記錄完成時間與相關的衡量數值。如圖 3-11 所示。
如前所述三種基本型態的事實資料表為交易事實資料表、週期快照事實資料表以及累積快照事實資料表,通常都是採用其中兩種方式相輔助使用就可以勾勒出企業所需的 BI 系統。
10.( C )有關下列維度模型中事實資料表的顆粒度(Fact Table Granularity)描述何者錯誤 (1) 顆粒度是描述事實資料表中衡量欄位的精細度 (2) 同一張事實資料表中所有衡量欄位可以有不相同的精細度 (3) 如果顆粒度是指一天的營業額,則銷售量與銷售金額就是一整天訂單中的銷售量與銷售金額的加總 (4) 如果顆粒度是訂單,則銷售金額與銷售量就是加總一整張訂單上的列項目所得的銷售量與銷售金額 (5) 同一張事實資料表中所有衡量欄位都要有相同的精細度 (6) 如果顆粒度是訂單中列項目(Line Item), 則銷售數量與銷售金額都是指某個品項在某張訂單中的銷售數字 (7) 儲存顆粒的大小的設定工作通常會是使用BI系統的決策者在訪談與討論前負責設定
(A)14(B)35(C)27(D)56 |
| 03-03 21:36: | 10114D074 4.(1)何謂一致的維度 (Conformed dimensions) 資料? 兩張維度資料表如果是一致的,表示整張維度資料的所有欄位定義是一樣的,而且資料也都相同(2)何謂一致的事實(Conformed facts) 資料? 一致的事實資料有兩層含意,第一就是欄位相同,第二就是資料也都相同(3)此二類資料與匯流排架構 (Bus Architecture) 機制的關係為何?匯流排 (Bus) 這個字是傳統發電廠運作的專用術語,而現在廣泛使用在電腦產業中,匯流排是指一個通用的硬體介面,很多設備可與之相連接並分享所需要資料。BI 系統的匯流排架構亦扮演相同角色,所有可用的維度資料表與事實欄位都在匯流排中占有一條渠道,而各部門所需的維度模型就在排線上根據所需擷取資料。有三個維度模型在匯流排架構上,以採購訂單維度模型為例,它的接角插在採購量、日期、產品、倉儲、採購商與訂貨商上,因此它會與零售店庫存維度模型分享日期與產品兩個維度資料表。經由使用同一匯流排,就可使各部門分享相同的資料欄位與資料表而避免同名異義。而匯流排上所有事實資料與維度資料表的設計如都透過一個單位掌控,就可進一步避免異名同義的問題。其實細心的讀者應可發現,採用此法各維度模型中的同名維度資料表有一致 (Conformed) 的關係。在模型設計過程,除了維度資料表要一致外,事實欄位也要一致,而運用資料倉儲匯流排架構可達到此目標。4.( C )在1997年Kimball提出的全新的資料模型架構稱為維度模型(Dimensional Model),下列有關維度模型的描述何者錯誤(A)此模型又稱為星狀綱要(Star Schema)(B)此模型不建議以實體關係體圖(Entity Relationship Diagrams, ERD)來呈現(C)一個維度模型只會有一個核心即一張維度資料表(D)模型中間核心的資料表稱為事實資料表(Fact Table) |
| 03-04 08:08: | (1). 容易瞭解 (Understandability)
因為維度模型化過程中將企業營運的資訊依照相關性分類到同一個維度
資料表中,如此做法讓主管很容易就可以瞭解到執行某一業務的企業流程會
跟哪些資訊 (即模型中的維度資料) 有直接相關,並且同時也可以透過事實資
料表中的事實資料掌握到企業流程執行的績效程度,以較為簡單的方式 (並
非簡化) 呈現資訊讓企業主管容易操作。
(2). 查詢快 (Query performance)
相對應於傳統 ERM,維度模型可減少大量的 Join 運作,因此可以節省
查詢時間。
(3). 均衡的維度資料表 (Symmetric dimension tables)
模型中每一個維度資料表的重要性都相同,如此的架構可以很方便的組
合出查詢報表 (Ad-hoc queries)。
(4). 可以容納非預期中的新資料 (Accommodate unexpected new data)
維度模型可以很方便地容納新的資料加入。模型可允許加入新的欄位到
維度資料表中;如果是加入新的維度資料表,只要此表不影響到資料顆粒度
(顆粒度隨後會有詳細說明),也可加到模型中;而新的事實欄位也可在不影
響顆粒度前提下加到模型中。加入這些新資料並不會使查詢結果錯誤,同時
也不會改到已存在舊報表的查詢結果。
(A)星狀綱要(Star Schema)
|
| 03-04 08:09: | 10114D072廖得辰
在建置 BI 系統時經常會使用到維度模型 (Dimensional Model) 建構需求,
請說明為何維度模型是一個可行的資料模型?
ANS:
維度模型的特點有下列幾點:
(1). 容易瞭解 (Understandability)
因為維度模型化過程中將企業營運的資訊依照相關性分類到同一個維度
資料表中,如此做法讓主管很容易就可以瞭解到執行某一業務的企業流程會
跟哪些資訊 (即模型中的維度資料) 有直接相關,並且同時也可以透過事實資
料表中的事實資料掌握到企業流程執行的績效程度,以較為簡單的方式 (並
非簡化) 呈現資訊讓企業主管容易操作。
(2). 查詢快 (Query performance)
相對應於傳統 ERM,維度模型可減少大量的 Join 運作,因此可以節省
查詢時間。
(3). 均衡的維度資料表 (Symmetric dimension tables)
模型中每一個維度資料表的重要性都相同,如此的架構可以很方便的組
合出查詢報表 (Ad-hoc queries)。
(4). 可以容納非預期中的新資料 (Accommodate unexpected new data)
維度模型可以很方便地容納新的資料加入。模型可允許加入新的欄位到
維度資料表中;如果是加入新的維度資料表,只要此表不影響到資料顆粒度
(顆粒度隨後會有詳細說明),也可加到模型中;而新的事實欄位也可在不影
響顆粒度前提下加到模型中。加入這些新資料並不會使查詢結果錯誤,同時
也不會改到已存在舊報表的查詢結果。
(A)星狀綱要(Star Schema)
|
| 03-04 12:11: | 10114D086 李承峰6. 請描述退化維度 (Degenerate Dimensions, DD) 的意義,並舉一例子說明。
ANS:在企業營運活動中交易控制文件 (Transaction control document) 的資料是
來源系統或 ERP 系統主要處理的對象,例如訂單 (Order)、發票 (Invoice)、提
貨單 (Bill of lading)、機票 (Airline ticket) 等。這些控制文件相當於一筆交易,
而交易內容可能包含單一品項或者多個列項目,因此以交易控制文件資料為
主的 BI 系統建置在實務上是經常可見的,如圖 3-25 所示,這一類的文件都
有一個特色就是文件結構是屬於父子 (Parent-child) 結構,更精確地說就是文
件上只有一筆交易文件表頭記錄 (Transaction header record),但是文件的主體
(Transaction body) 可以填入許多筆交易品項記錄,可參考圖 3-9 中的範例。
除此之外,模型化過程很容易就將文件中的各項資料分類好並且歸納到適當
的維度資料表中。除了一個相當尷尬的訂單維度資料表,這表中除了訂單編
號欄位之外別無其他欄位。這樣的維度資料表並沒有邏輯上的錯誤,只是資
料有點少。如果想改變此狀況,可將訂單編號直接納入事實資料表中,原來
的訂單維度資料表則不再需要,訂單維度資料表因為被收到事實資料表中因
此稱為退化維度 (Degenerate Dimensions, DD),如圖 3-26 所示。雖然此欄位
無可加總性,但可用以篩檢同一筆訂單的交易資料。
下列有關維度模型(Dimensional Model)的描述何者錯誤(B)
(B)模型中環繞核心維度資料表的為事實資料表
|
| 03-05 17:02: | 10114D091張宇成1. 請說明何謂維度模型 (Dimensional Model)?ANS:在 1997 年 Kimball 提出的全新的資料模型架構稱為維度模型(Dimensional Model),因為模型整體的外觀上類似人類在地球上仰望夜空中所見星星 (Star) 一般,故又稱星狀綱要 (Starschema)。整個模型在正中央核心部分會以一張資料表來表示,星星會從中央核心射出許多閃爍的光芒,每一道光芒都以一張資料表來表示,中間核心的資料表稱為事實資料表 (Fact table),每一道光芒所對應到的資料表稱為維度資料表 (Dimension table),而一個維度模型只會有一個核心即一張事實資料表,至於維度資料表的數量則要依照個案情境而定。此外,因為每一道光芒即代表一個維度,所以此模型也稱為維度模型。選擇題1.(D)目前BI系統設計以用簡易的視覺化拖曳(Drag & Drop)方式來進行資料選取,下列有關BI系統的描述何者正確?(D)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值相同者進行群組(Group By)的動作 |
| 03-05 18:44: | 10114D123 彭俞富 3. 何謂匯流排架構 (Bus Architecture) 機制?在建構 BI 系統其存在的目的為何?請說明。(1)企業內所有維度模型使用一致的維度資料表與事實欄位。這些維度資料表與事實欄位由企業中某一單位集中掌控。而經由中央掌控單位分享一致的維度資料表與事實資料表就稱為匯流排架構機制。
(2)資料倉儲匯流排架構主要目的用以解決欄位的同名異義與異名同義的問題。 |
| 03-05 18:46: | 10114D123 彭俞富 (D)下列有關實體關係體模型(Entity Relationship Model, ERM)不適合BI系統設計的描述何者錯誤?(D)以上皆錯 |
| 03-05 19:37: | 10114D078 陳政傑
問答題:
8. 請說明變動緩慢的維度資料表有哪幾種處理的方法?
有三種不同處理方法
(1)直接改寫維度屬性資料
(2)新增加一筆維度資料
(3)新增加一個維度屬性
選擇題:
8.維度模型工作必須辨別且擷取出可衡量(Measurements)的數值資料部份以及情境化(Context)的文字敘述資料部分,下列描述何者正確
(A)可衡量(Measurements)的數值資料部份就是指事實資料
|
| 03-09 12:45: | 10114D146 陳思漢 請描述退化維度 (Degenerate Dimensions, DD) 的意義,並舉一例子說明 在企業營運活動中交易控制文件 (Transaction control document) 的資料是來源系統或 ERP 系統主要處理的對象,例如訂單 (Order)、發票 (Invoice)、提貨單 (Bill of lading)、機票 (Airline ticket) 等。這些控制文件相當於一筆交易,而交易內容可能包含單一品項或者多個列項目,因此以交易控制文件資料為主的 BI 系統建置在實務上是經常可見的,如圖 3-25 所示,這一類的文件都有一個特色就是文件結構是屬於父子 (Parent-child) 結構,更精確地說就是文件上只有一筆交易文件表頭記錄 (Transaction header record),但是文件的主體(Transaction body) 可以填入許多筆交易品項記錄,可參考圖 3-9 中的範例。除此之外,模型化過程很容易就將文件中的各項資料分類好並且歸納到適當的維度資料表中。除了一個相當尷尬的訂單維度資料表,這表中除了訂單編號欄位之外別無其他欄位。這樣的維度資料表並沒有邏輯上的錯誤,只是資料有點少。如果想改變此狀況,可將訂單編號直接納入事實資料表中,原來
的訂單維度資料表則不再需要,訂單維度資料表因為被收到事實資料表中因此稱為退化維度 (Degenerate Dimensions, DD)。(6)下列有關維度模型(Dimensional Model)的描述何者錯誤(B) (B)模型中環繞核心維度資料表的為事實資料表 |
| 03-09 12:51: | 10. 在維度模型中,儲存在事實資料表中的可衡量事件可區分成三種基本型
態,分別為交易明細 (Transactional Detail) 事實資料、週期快照 (Periodic
Snapshots) 事實資料以及累積快照 (Accumulating Snapshots) 事實資料,請
描述這三種類型事實資料表的意義,並說明比較這三者之間的差異。
儲存在事實資料表中的可衡量事件可區分成三種基本型態,分別為交易明細 (Transactional detail) 事實資料、週期快照 (Periodic snapshots) 事實資料以及累積快照 (Accumulating snapshots) 事實資料。
(1). 交易事實資料表 (Transaction fact tables)
最常見的事實資料表,交易事實資料表內容記錄著交易 (或事務) 活動發
生時候,活動內容中可以衡量的數值性的資料,如圖 3-6 所示。
(2). 週期快照事實資料表 (Periodic Snapshot fact tables)
有些企業流程中的活動內容所產生的可以衡量的數值性資料並不適合記錄詳細的交易內容,例如銀行的帳戶餘額 (Account balance)、財會部門的財務報表 (Financial reports)、倉儲單位的存貨水準 (Inventory levels),這些事實資料都屬於半可加性 (Semi-additive) 的可衡量的數值性資料,在維度模型中記錄詳細的半可加性事實資料的增加或減少的變動對企業主而言是比較沒有實際上幫助。最佳的方式是以每隔一段固定時間取值,猶如用照相機擷取影像的方式來記錄事實資料,換言之就是把週期的期末狀況顯示出來一樣,就好像每一個月月底所收到的各式各樣的帳單 (Bills) 內的數字一樣,此稱為週期快照 (Periodic snapshots)。實務上倉儲的庫存盤點報告內容即為週期快照事實資料的一種。
(3). 累積快照事實資料表 (Accumulating snapshot fact tables)
企業流程是由許多串連活動的執行而組成,公司的專案經理人 (Project manager, PM) 需要有一種可以記錄整個企業流程步驟的事實資料表,以便時時可以注意到跨步驟或跨活動資訊來掌握全面性資訊,這樣的事實資料表稱為累積快照事實資料表 (Accumulating snapshot fact tables)。累積 (Accumulating) 一詞的意思就是指這些事情 (活動、步驟、事件) 不會在同一時間完成,因此必須透過許多記錄時間的欄位在事情完成後記錄完成時間與相關的衡量數值。如圖 3-11 所示。
如前所述三種基本型態的事實資料表為交易事實資料表、週期快照事實資料表以及累積快照事實資料表,通常都是採用其中兩種方式相輔助使用就可以勾勒出企業所需的 BI 系統。
10.(C)有關下列維度模型中事實資料表的顆粒度(Fact Table Granularity)描述何者錯誤 (1) 顆粒度是描述事實資料表中衡量欄位的精細度 (2) 同一張事實資料表中所有衡量欄位可以有不相同的精細度 (3) 如果顆粒度是指一天的營業額,則銷售量與銷售金額就是一整天訂單中的銷售量與銷售金額的加總 (4) 如果顆粒度是訂單,則銷售金額與銷售量就是加總一整張訂單上的列項目所得的銷售量與銷售金額 (5) 同一張事實資料表中所有衡量欄位都要有相同的精細度 (6) 如果顆粒度是訂單中列項目(Line Item), 則銷售數量與銷售金額都是指某個品項在某張訂單中的銷售數字 (7) 儲存顆粒的大小的設定工作通常會是使用BI系統的決策者在訪談與討論前負責設定
(A)14
(B)35
(C)27
(D)56
|
| 03-09 12:52: | 10114D140 10. 在維度模型中,儲存在事實資料表中的可衡量事件可區分成三種基本型
態,分別為交易明細 (Transactional Detail) 事實資料、週期快照 (Periodic
Snapshots) 事實資料以及累積快照 (Accumulating Snapshots) 事實資料,請
描述這三種類型事實資料表的意義,並說明比較這三者之間的差異。
儲存在事實資料表中的可衡量事件可區分成三種基本型態,分別為交易明細 (Transactional detail) 事實資料、週期快照 (Periodic snapshots) 事實資料以及累積快照 (Accumulating snapshots) 事實資料。
(1). 交易事實資料表 (Transaction fact tables)
最常見的事實資料表,交易事實資料表內容記錄著交易 (或事務) 活動發
生時候,活動內容中可以衡量的數值性的資料,如圖 3-6 所示。
(2). 週期快照事實資料表 (Periodic Snapshot fact tables)
有些企業流程中的活動內容所產生的可以衡量的數值性資料並不適合記錄詳細的交易內容,例如銀行的帳戶餘額 (Account balance)、財會部門的財務報表 (Financial reports)、倉儲單位的存貨水準 (Inventory levels),這些事實資料都屬於半可加性 (Semi-additive) 的可衡量的數值性資料,在維度模型中記錄詳細的半可加性事實資料的增加或減少的變動對企業主而言是比較沒有實際上幫助。最佳的方式是以每隔一段固定時間取值,猶如用照相機擷取影像的方式來記錄事實資料,換言之就是把週期的期末狀況顯示出來一樣,就好像每一個月月底所收到的各式各樣的帳單 (Bills) 內的數字一樣,此稱為週期快照 (Periodic snapshots)。實務上倉儲的庫存盤點報告內容即為週期快照事實資料的一種。
(3). 累積快照事實資料表 (Accumulating snapshot fact tables)
企業流程是由許多串連活動的執行而組成,公司的專案經理人 (Project manager, PM) 需要有一種可以記錄整個企業流程步驟的事實資料表,以便時時可以注意到跨步驟或跨活動資訊來掌握全面性資訊,這樣的事實資料表稱為累積快照事實資料表 (Accumulating snapshot fact tables)。累積 (Accumulating) 一詞的意思就是指這些事情 (活動、步驟、事件) 不會在同一時間完成,因此必須透過許多記錄時間的欄位在事情完成後記錄完成時間與相關的衡量數值。如圖 3-11 所示。
如前所述三種基本型態的事實資料表為交易事實資料表、週期快照事實資料表以及累積快照事實資料表,通常都是採用其中兩種方式相輔助使用就可以勾勒出企業所需的 BI 系統。
10.(C)有關下列維度模型中事實資料表的顆粒度(Fact Table Granularity)描述何者錯誤 (1) 顆粒度是描述事實資料表中衡量欄位的精細度 (2) 同一張事實資料表中所有衡量欄位可以有不相同的精細度 (3) 如果顆粒度是指一天的營業額,則銷售量與銷售金額就是一整天訂單中的銷售量與銷售金額的加總 (4) 如果顆粒度是訂單,則銷售金額與銷售量就是加總一整張訂單上的列項目所得的銷售量與銷售金額 (5) 同一張事實資料表中所有衡量欄位都要有相同的精細度 (6) 如果顆粒度是訂單中列項目(Line Item), 則銷售數量與銷售金額都是指某個品項在某張訂單中的銷售數字 (7) 儲存顆粒的大小的設定工作通常會是使用BI系統的決策者在訪談與討論前負責設定
(A)14
(B)35
(C)27
(D)56
|
| 03-09 12:54: | 10114D132王建翔 2.在建置 BI 系統時經常會使用到維度模型 (DimensionalModel) 建構需求,請說明為何維度模型是一個可行的資料模型?
維度模型的特點有下列幾點:
(1). 容易瞭解 (Understandability)
因為維度模型化過程中將企業營運的資訊依照相關性分類到同一個維度資料表中,如此做法讓主管很容易就可以瞭解到執行某一業務的企業流程會跟哪些資訊 (即模型中的維度資料) 有直接相關,並且同時也可以透過事實資料表中的事實資料掌握到企業流程執行的績效程度,以較為簡單的方式 (並非簡化) 呈現資訊讓企業主管容易操作。
(2). 查詢快 (Query performance)
相對應於傳統 ERM,維度模型可減少大量的 Join 運作,因此可以節省查詢時間。
(3). 均衡的維度資料表 (Symmetric dimension tables)
模型中每一個維度資料表的重要性都相同,如此的架構可以很方便的組合出查詢報表 (Ad-hoc queries)。
(4). 可以容納非預期中的新資料 (Accommodate unexpected new data)
維度模型可以很方便地容納新的資料加入。模型可允許加入新的欄位到維度資料表中;如果是加入新的維度資料表,只要此表不影響到資料顆粒度(顆粒度隨後會有詳細說明),也可加到模型中;而新的事實欄位也可在不影響顆粒度前提下加到模型中。加入這些新資料並不會使查詢結果錯誤,同時也不會改到已存在舊報表的查詢結果。
2.(A)下列哪一選項是維度模型(Dimensional Model)的別稱(A)星狀綱要(Star Schema) |
| 03-14 11:48: | 10114D057 2.在建置 BI 系統時經常會使用到維度模型 (DimensionalModel) 建構需求,請說明為何維度模型是一個可行的資料模型?維度模型的特點有下列幾點: (1). 容易瞭解 (Understandability) 因為維度模型化過程中將企業營運的資訊依照相關性分類到同一個維度資料表中,如此做法讓主管很容易就可以瞭解到執行某一業務的企業流程會跟哪些資訊 (即模型中的維度資料) 有直接相關,並且同時也可以透過事實資料表中的事實資料掌握到企業流程執行的績效程度,以較為簡單的方式 (並非簡化) 呈現資訊讓企業主管容易操作
|
| 03-14 11:48: | 10114D057 2.在建置 BI 系統時經常會使用到維度模型 (DimensionalModel) 建構需求,請說明為何維度模型是一個可行的資料模型?維度模型的特點有下列幾點: (1). 容易瞭解 (Understandability) 因為維度模型化過程中將企業營運的資訊依照相關性分類到同一個維度資料表中,如此做法讓主管很容易就可以瞭解到執行某一業務的企業流程會跟哪些資訊 (即模型中的維度資料) 有直接相關,並且同時也可以透過事實資料表中的事實資料掌握到企業流程執行的績效程度,以較為簡單的方式 (並非簡化) 呈現資訊讓企業主管容易操作
|
| 03-14 11:48: | 10114D057 2.在建置 BI 系統時經常會使用到維度模型 (DimensionalModel) 建構需求,請說明為何維度模型是一個可行的資料模型?維度模型的特點有下列幾點: (1). 容易瞭解 (Understandability) 因為維度模型化過程中將企業營運的資訊依照相關性分類到同一個維度資料表中,如此做法讓主管很容易就可以瞭解到執行某一業務的企業流程會跟哪些資訊 (即模型中的維度資料) 有直接相關,並且同時也可以透過事實資料表中的事實資料掌握到企業流程執行的績效程度,以較為簡單的方式 (並非簡化) 呈現資訊讓企業主管容易操作
|
| 03-15 15:20: | 10114D134 4.何謂一致的維度 (Conformed dimensions) 資料?何謂一致的事實 (Conformed facts) 資料?此二類資料與匯流排架構 (Bus Architecture) 機制 的關係為何? (1)兩張維度資料表如果是一致的,表示整張維度資料的所有欄位定義是一樣的,而且資料也都相同 (2)一致的事實資料有兩層含意,第一就是欄位相同,第二就是資料也都相同 (3)匯流排 (Bus) 這個字是傳統 發電廠運作的專用術語,而現在廣泛使用在電腦產業中,匯流排是指一個通 用的硬體介面,很多設備可與之相連接並分享所需要資料。BI 系統的匯流排 架構亦扮演相同角色,如圖 3-21 所示,所有可用的維度資料表與事實欄位都 在匯流排中占有一條渠道,而各部門所需的維度模型就在排線上根據所需擷 取資料。圖 3-21 上有三個維度模型在匯流排架構上,以採購訂單維度模型為 例,它的接角插在採購量、日期、產品、倉儲、採購商與訂貨商上,因此它 會與零售店庫存維度模型分享日期與產品兩個維度資料表。經由使用同一匯 流排,就可使各部門分享相同的資料欄位與資料表而避免同名異義。而匯流 排上所有事實資料與維度資料表的設計如都透過一個單位掌控,就可進一步 避免異名同義的問題。其實細心的讀者應可發現,採用此法各維度模型中的 同名維度資料表有一致 (Conformed) 的關係。 在模型設計過程,除了維度資料表要一致外,事實欄位也要一致,而運 用資料倉儲匯流排架構可達到此目標。 4.( C )在1997年Kimball提出的全新的資料模型架構稱為維度模型(Dimensional Model),下列有關維度模型的描述何者錯誤 (A)此模型又稱為星狀綱要(Star Schema) (B)此模型不建議以實體關係體圖(Entity Relationship Diagrams, ERD)來呈現 (C)一個維度模型只會有一個核心即一張維度資料表 (D)模型中間核心的資料表稱為事實資料表(Fact Table) |
| 03-17 10:26: | 10114D158 廖建傑
1.在 1997 年 Kimball 提出的全新的資料模型架構稱為維度模型(Dimensional Model),
2. 1)容易瞭解 (Understandability) 2)查詢快 (Query performance) 3)均衡的維度資料表 (Symmetric dimension tables)
4. 1)兩張維度資料表如果是一致的,表示整張維度資料的所有欄位定義是一樣的,而且資料也都相同 2)一致的事實資料有兩層含意,第一就是欄位相同,第二就是資料也都相同 3)匯流排 (Bus) 這個字是傳統
3. 1)企業內所有維度模型使用一致的維度資料表與事實欄位。 2)資料倉儲匯流排架構主要目的用以解決欄位的同名異義與異名同義的問題。
5.1)查詢效率 (Performance) 2)整合不同來源系統的自然鍵 3)提供穩定的鍵值 4)可以追蹤維度屬性值的變動 (Track changes in dimension attribute values)
6.在企業營運活動中交易控制文件 (Transaction control document) 的資料是來源系統或 ERP 系統主要處理的對象,例如訂單 (Order)、發票 (Invoice)、提貨單 (Bill of lading)、機票 (Airline ticket) 等。
7.每一個維度模型中,日期維度資料表是維度模型中一定會有的一個資料表,因為事實資料表中的每一筆資料都必須記錄下可衡量資料所發生的日期。
8.1)直接改寫維度屬性資料 (Type I) 2)新增加一筆維度資料 (Type II) 3新增加一個維度屬性 (Type III)
9.加總結果錯誤。如課文圖3-8中的訂單金額與銷售數量的加總會不一致。
10. 1)交易事實資料表 (Transaction fact tables) 2)週期快照事實資料表 (Periodic Snapshot fact tables) 3)累積快照事實資料表 (Accumulating snapshot fact tables)
1.D
2.A
3.D
4.C
5.C
6.B
7.B
8.A
9.D
10.C
|
| 04-02 20:41: | 10114D101李庭緯1. 請說明何謂維度模型 (Dimensional Model)?ANS:在 1997 年 Kimball 提出的全新的資料模型架構稱為維度模型(Dimensional Model),因為模型整體的外觀上類似人類在地球上仰望夜空中所見星星 (Star) 一般,故又稱星狀綱要 (Starschema)。整個模型在正中央核心部分會以一張資料表來表示,星星會從中央核心射出許多閃爍的光芒,每一道光芒都以一張資料表來表示,中間核心的資料表稱為事實資料表 (Fact table),每一道光芒所對應到的資料表稱為維度資料表 (Dimension table),而一個維度模型只會有一個核心即一張事實資料表,至於維度資料表的數量則要依照個案情境而定。此外,因為每一道光芒即代表一個維度,所以此模型也稱為維度模型。選擇題1.(D)目前BI系統設計以用簡易的視覺化拖曳(Drag & Drop)方式來進行資料選取,下列有關BI系統的描述何者正確?(D)從維度資料表內挑選出來的欄位,BI系統都會事先針對這些欄位內容值相同者進行群組(Group By)的動作 |
| 04-17 21:40: | 10114D118 翁萬翔 A 8. 請說明變動緩慢的維度資料表有哪幾種處理的方法?
ANS:
三種不同處理方法
(1). 直接改寫維度屬性資料 (Type I)
(2). 新增加一筆維度資料 (Type II)
(3). 新增加一個維度屬性 (Type III)
|
| |
| | | 登入帳號密碼代表遵守學術網路規範 |
|