基于知識相依性的復合材料決策知識獲取算法
摘要:為了能夠準確有效地實現復合材料成型工藝決策知識的自動獲取,通過對樹脂基復合材料成型工藝決策數據的分析,建立了基于粗糙集理論的復合材料成型工藝決策知識挖掘模型,提出了一種基于知識相依性的復合材料成型工藝決策規則挖掘方法。該方法利用知識相依性進行工藝數據預處理和約簡的同時,建立成型工藝決策知識樹,大大提高了決策樹構造的效率。后通過實例分析驗證了該方法的可行性,實現了復合材料成型工藝決策知識的自動獲取。
決策知識獲取是建立和管理復合材料成型工藝知識庫的“瓶頸”問題。隨著CAPP技術在復合材料成型領域的廣泛應用,結構化、數字化的工藝數據積累很快,這些積累起來的大量工藝數據中就包含了豐富的工藝知識,能夠有效準確地獲取知識是成功構建基于知識的計算機輔助復合材料成型工藝系統的關鍵技術之一。工藝決策知識是在實踐中積累的認識和經驗的總和,目前復合材料成型工藝決策知識獲取的主要方式是由知識工程師在復合材料工藝領域專家的指導下,通過對有關文獻、資料、手冊以及工藝規范、工藝標準、技術文檔的分析,結合專家的經驗,獲取工藝設計相關的工藝知識,這需要花費大量的時間并需要與復合材料領域專家密切配合。
在復合材料領域知識研究方面,主要有美國設計工程學院Stevens技術學院研究了復合材料注射工藝方面的知識,建立了復合材料構件設計知識庫,利用模糊理論對復合材料構件模具材料進行選擇,采用模糊推理的方法確定復合材料成型工藝。這些研究多集中在設計知識和成型工藝知識表達和管理應用上,而對復合材料成型工藝決策知識的自動獲取方面很少有文獻報道。
本文在已開發的CAACMPP系統基礎上研究了知識相依性在復合材料成型工藝決策知識自動獲取中的應用。通過對復合材料成型過程的工藝數據的分析與處理,形成工藝知識的描述,利用粗糙集理論中知識相依性對工藝數據進行約簡,同時建立決策樹,產生新的工藝知識,促進企業工藝的標準化與規范化,從而解決企業的復合材料成型工藝決策知識獲取的“瓶頸”問題。
1 成型工藝決策知識挖掘模型
在復合材料成型工藝設計中,決策類知識在成型工藝知識中所占比例很大。如材料選擇規則、成型工藝方法選擇規則、層合板鋪層規則、樹脂注射參數選擇規則、固化參數規則等。圖1給出了基于粗糙集理論的復合材料成型工藝決策知識獲取模型。其獲取的步驟包括:[-page-]

步驟1:成型工藝數據獲取。從已有的復合材料數據庫、復合材料資源庫、遺產數據庫及專家等進行工藝數據收集,形成工藝數據倉庫。
步驟2:數據預處理。為降低粗糙集決策類知識獲取的難度和復雜性,提高該方法發現知識的質量和效果,必須先進行數據的預處理,該步驟為數據挖掘提供前期準備工作。模型中的數據預處理指對待研究復合材料成型工藝數據進行必要的繼承、清洗、轉換、規約等一系列的處理工作,使數據轉化為決策表表達的形式,進而幫助提高決策規則獲取的準確性和有效性。
步驟3:基于知識相依性的決策樹生成。
步驟4:規則生成。
步驟5:規則的使用。[-page-]
其中,基于知識相依性的決策樹生成是該模型建立的核心,下面將詳細討論。
2 基于知識相依性的決策樹算法
決策樹(decision tree)是從復合材料成型工藝數據庫中挖掘成型工藝決策規則的一種有效方法。構造復合材料成型工藝決策樹的過程就是根據訓練實例集來預測如何根據屬性對整個實例空間進行劃分,但在學習的開始時,只有一棵空的決策樹,并不知道如何根據屬性將復合材料工藝決策數據樣本進行分類,利用粗糙集中知識相依性可以度量條件屬性對于分類的重要性。
2.1 知識相依性理論
設信息系統S={U,A},U為待挖掘復合材料決策知識的樣本,A=CUD為屬性集合,其中C為條件屬性子集,D為決策屬性子集。
若R為U上的一個等價關系,定義U/R表示R的所有等價類構成的集合,[x]R表示包含元素x∈U的R等價類。
若P
A,且P≠φ,則∩P是一個等價關系,稱為P上的不可區分關系,記為ind(P),且有:

這樣,U/ind(P)表示與等價關系族P相關的知識。
在信息系統S={U,A}中,定義兩個子集:
[-page-]
其中,稱POSR(X)= RX稱為X的R正域。
對信息系統S={U,A},P,Q()A,有如下定義:
定義1:知識Q依賴于知識P,當且僅當ind(P)
ind(Q)。
定義2;知識P與知識Q等價,當且僅當ind(P)
ind(Q)且ind(P)
ind(P)
定義3:知識P與知識Q獨立,當且僅當ind(P)
ind(Q)且ind(Q)
ind(P)均不成立。
定理1:下列條件是等價的:
(1)ind(P)
ind(Q)
(2)ind(PUQ)=ind(P)
(3)POSp(Q)=U
定理1表明,在樣本訓練集中,如果屬性Q依賴于屬性P,則在信息系統中,屬性Q是多余的。那么,在構造決策樹時,屬性Q應該被約簡掉。有時候,知識的相依性可能是部分的,這表示知識Q僅有部分是由知識P導出的,部分的相依性可由知識的正域來定義。
定義4:信息系統S={U,A},P,Q()A,有:
k=Yp(Q)=|Posp(Q)|/|U| (4)
稱為知識Q為k(O≤k≤1)度依賴于知識P的。
知識的相依性在決策樹構造中可轉化為屬性間的相關性,而依據條件屬性和決策屬性的依賴度可同時進行決策表的屬性約簡和決策樹構建。屬性約簡從本質上講是對決策樹進行預修剪,限制了決策樹的總節點數。
利用粗糙集進行屬性約簡,就是找到條件屬性C的小子集R,使得Yc(D)=YR(D),其中R稱為C的D一個約簡,記為REDD(C)。一個信息系統的約簡一般不止一個,所有約簡的交集稱為條屬性的C的D核。由此可以看出,屬性的核是條件屬性集中對分類為重要的那些屬性。那么,找到屬性的核對屬性的約簡十分重要,簡單的想法當然是求取所有可能的屬性約簡,再求交集,但這是一個指數時間復雜度問題。實際上,因為每一個約簡均包含屬性的核,所以完全可以直接去尋找一個佳約簡或較好的約簡,本文利用貪婪法(greedyalgorithm)的思想,對復合材料成型工藝決策數據表進行屬性約簡,同時構建復合材料成型工藝知識決策樹。
2.2 基于知識相依性的復合材料成型工藝決策知識獲取算法
根據上述理論,算法描述如下:[-page-]
輸入:工藝決策數據
輸出:工藝決策樹
步驟1:收集復合材料成型工藝決策數據,構建成型工藝決策數據表;
步驟2:確定成型工藝決策數據表中的條件屬性集C和決策屬性集D;
步驟3:令工藝決策樹T的初始狀態為空,同時令約簡集
(C)=Ф;
步驟4:計算條件屬性集C中屬性Ci與決策屬性D的相關性Yci(D),取使Yci(D)大的屬性ci1,
(C)=
(C)U{ci1},并使屬性ci1作為決策樹的根節點;
步驟5:IFCi1,某一屬性中的所有決策屬性都相同,則產生一個葉節點,Else遞歸在每個屬性尋找使相關性Yci2 (D)大的屬性Ci2,
=
(C)U{Ci2},并使屬性Ci2,作為決策樹的根節點重復建立步驟5,直到某個
(C),使得
(D)=Yc(D)為止。
3 實例驗證
表1所示為樹脂基復合材料成型工藝方法選擇的決策數據。其中制件形狀、制件厚度、樹脂、拉伸強度為條件屬性,成型方法為決策屬性。
[-page-]
根據上述給出的算法可知:
U={1,2,3,4,5,6,7}
U/D={{1,2},{3,7},{4,5,6}}
U/制件形狀={{1},{2,6},{3},{4,5,7}}
U/制件厚度={{1,3,5,7},{2,4},{6}}
U/樹脂={{1,2,4,5,6,7},{3}}
U/拉伸強度={{1,3,5},{2,4,6,7}}
計算每個屬性分類的相關性為:
Y制件形狀=2/7,Y制件厚度=1/7,Y樹脂= 1/7,Y拉伸強度=0。
所以選擇制件形狀作為決策樹的根節點,在制件形狀的每個分支上使用向樣的方法,后建立的成型方法決策樹如圖2所示。從生成的決策樹可以看出屬性樹脂被約簡掉。
[-page-]
決策樹確定后即可以采用帶置信度的IF-THEN形式,從決策樹的根到樹葉的每條路徑創建復合材料成型方法決策分類規則。其中,給定路徑上的每個屬性值形成規則前提的一個合取項,葉節點包含成型方法。下面給出由上述決策樹確定的部分決策規則。
RULES:<樹脂基復合材料成型方法決策規則>
IF等于(制件形狀,工字形,0.6)AND
等于(制件厚度,3,0.3)AND
等于(拉伸強度,100,0.1)
THEN選用(成型方法,RTM成型,1)END
以上結果表明,①利用知識相依性可以進行復合材料成型工藝決策知識的自動獲??;②由圖2生成的決策樹可知,利用知識相依性在建立復合材料成型工藝決策樹的同時可以對屬性進行約簡,實例中樹脂屬性被約簡掉,不用在建立決策樹后二次對決策樹進行修剪,提高決策規則的獲取效率。
4 結 語
針對復合材料成型工藝屬性復雜多樣和決策知識多是人機交互獲取的特點,本文在分析影響復合材料成型工藝決策數據的基礎上,利用知識相依性和決策樹算法對成型工藝決策知識進行自動獲取,規則提取算法簡單。實例表明,在利用知識相依性建立決策樹同時可以對決策樹的屬性進行約簡,提高復合材料成型工藝決策知識獲取的效率。
決策知識獲取是建立和管理復合材料成型工藝知識庫的“瓶頸”問題。隨著CAPP技術在復合材料成型領域的廣泛應用,結構化、數字化的工藝數據積累很快,這些積累起來的大量工藝數據中就包含了豐富的工藝知識,能夠有效準確地獲取知識是成功構建基于知識的計算機輔助復合材料成型工藝系統的關鍵技術之一。工藝決策知識是在實踐中積累的認識和經驗的總和,目前復合材料成型工藝決策知識獲取的主要方式是由知識工程師在復合材料工藝領域專家的指導下,通過對有關文獻、資料、手冊以及工藝規范、工藝標準、技術文檔的分析,結合專家的經驗,獲取工藝設計相關的工藝知識,這需要花費大量的時間并需要與復合材料領域專家密切配合。
在復合材料領域知識研究方面,主要有美國設計工程學院Stevens技術學院研究了復合材料注射工藝方面的知識,建立了復合材料構件設計知識庫,利用模糊理論對復合材料構件模具材料進行選擇,采用模糊推理的方法確定復合材料成型工藝。這些研究多集中在設計知識和成型工藝知識表達和管理應用上,而對復合材料成型工藝決策知識的自動獲取方面很少有文獻報道。
本文在已開發的CAACMPP系統基礎上研究了知識相依性在復合材料成型工藝決策知識自動獲取中的應用。通過對復合材料成型過程的工藝數據的分析與處理,形成工藝知識的描述,利用粗糙集理論中知識相依性對工藝數據進行約簡,同時建立決策樹,產生新的工藝知識,促進企業工藝的標準化與規范化,從而解決企業的復合材料成型工藝決策知識獲取的“瓶頸”問題。
1 成型工藝決策知識挖掘模型
在復合材料成型工藝設計中,決策類知識在成型工藝知識中所占比例很大。如材料選擇規則、成型工藝方法選擇規則、層合板鋪層規則、樹脂注射參數選擇規則、固化參數規則等。圖1給出了基于粗糙集理論的復合材料成型工藝決策知識獲取模型。其獲取的步驟包括:[-page-]

步驟1:成型工藝數據獲取。從已有的復合材料數據庫、復合材料資源庫、遺產數據庫及專家等進行工藝數據收集,形成工藝數據倉庫。
步驟2:數據預處理。為降低粗糙集決策類知識獲取的難度和復雜性,提高該方法發現知識的質量和效果,必須先進行數據的預處理,該步驟為數據挖掘提供前期準備工作。模型中的數據預處理指對待研究復合材料成型工藝數據進行必要的繼承、清洗、轉換、規約等一系列的處理工作,使數據轉化為決策表表達的形式,進而幫助提高決策規則獲取的準確性和有效性。
步驟3:基于知識相依性的決策樹生成。
步驟4:規則生成。
步驟5:規則的使用。[-page-]
其中,基于知識相依性的決策樹生成是該模型建立的核心,下面將詳細討論。
2 基于知識相依性的決策樹算法
決策樹(decision tree)是從復合材料成型工藝數據庫中挖掘成型工藝決策規則的一種有效方法。構造復合材料成型工藝決策樹的過程就是根據訓練實例集來預測如何根據屬性對整個實例空間進行劃分,但在學習的開始時,只有一棵空的決策樹,并不知道如何根據屬性將復合材料工藝決策數據樣本進行分類,利用粗糙集中知識相依性可以度量條件屬性對于分類的重要性。
2.1 知識相依性理論
設信息系統S={U,A},U為待挖掘復合材料決策知識的樣本,A=CUD為屬性集合,其中C為條件屬性子集,D為決策屬性子集。
若R為U上的一個等價關系,定義U/R表示R的所有等價類構成的集合,[x]R表示包含元素x∈U的R等價類。
若P
A,且P≠φ,則∩P是一個等價關系,稱為P上的不可區分關系,記為ind(P),且有:
這樣,U/ind(P)表示與等價關系族P相關的知識。
在信息系統S={U,A}中,定義兩個子集:
[-page-] 其中,稱POSR(X)= RX稱為X的R正域。
對信息系統S={U,A},P,Q()A,有如下定義:
定義1:知識Q依賴于知識P,當且僅當ind(P)
ind(Q)。定義2;知識P與知識Q等價,當且僅當ind(P)
ind(Q)且ind(P)
ind(P)定義3:知識P與知識Q獨立,當且僅當ind(P)
ind(Q)且ind(Q)
ind(P)均不成立。定理1:下列條件是等價的:
(1)ind(P)
ind(Q)(2)ind(PUQ)=ind(P)
(3)POSp(Q)=U
定理1表明,在樣本訓練集中,如果屬性Q依賴于屬性P,則在信息系統中,屬性Q是多余的。那么,在構造決策樹時,屬性Q應該被約簡掉。有時候,知識的相依性可能是部分的,這表示知識Q僅有部分是由知識P導出的,部分的相依性可由知識的正域來定義。
定義4:信息系統S={U,A},P,Q()A,有:
k=Yp(Q)=|Posp(Q)|/|U| (4)
稱為知識Q為k(O≤k≤1)度依賴于知識P的。
知識的相依性在決策樹構造中可轉化為屬性間的相關性,而依據條件屬性和決策屬性的依賴度可同時進行決策表的屬性約簡和決策樹構建。屬性約簡從本質上講是對決策樹進行預修剪,限制了決策樹的總節點數。
利用粗糙集進行屬性約簡,就是找到條件屬性C的小子集R,使得Yc(D)=YR(D),其中R稱為C的D一個約簡,記為REDD(C)。一個信息系統的約簡一般不止一個,所有約簡的交集稱為條屬性的C的D核。由此可以看出,屬性的核是條件屬性集中對分類為重要的那些屬性。那么,找到屬性的核對屬性的約簡十分重要,簡單的想法當然是求取所有可能的屬性約簡,再求交集,但這是一個指數時間復雜度問題。實際上,因為每一個約簡均包含屬性的核,所以完全可以直接去尋找一個佳約簡或較好的約簡,本文利用貪婪法(greedyalgorithm)的思想,對復合材料成型工藝決策數據表進行屬性約簡,同時構建復合材料成型工藝知識決策樹。
2.2 基于知識相依性的復合材料成型工藝決策知識獲取算法
根據上述理論,算法描述如下:[-page-]
輸入:工藝決策數據
輸出:工藝決策樹
步驟1:收集復合材料成型工藝決策數據,構建成型工藝決策數據表;
步驟2:確定成型工藝決策數據表中的條件屬性集C和決策屬性集D;
步驟3:令工藝決策樹T的初始狀態為空,同時令約簡集
(C)=Ф;步驟4:計算條件屬性集C中屬性Ci與決策屬性D的相關性Yci(D),取使Yci(D)大的屬性ci1,
(C)=
(C)U{ci1},并使屬性ci1作為決策樹的根節點;步驟5:IFCi1,某一屬性中的所有決策屬性都相同,則產生一個葉節點,Else遞歸在每個屬性尋找使相關性Yci2 (D)大的屬性Ci2,
=
(C)U{Ci2},并使屬性Ci2,作為決策樹的根節點重復建立步驟5,直到某個
(C),使得
(D)=Yc(D)為止。3 實例驗證
表1所示為樹脂基復合材料成型工藝方法選擇的決策數據。其中制件形狀、制件厚度、樹脂、拉伸強度為條件屬性,成型方法為決策屬性。
[-page-] 根據上述給出的算法可知:
U={1,2,3,4,5,6,7}
U/D={{1,2},{3,7},{4,5,6}}
U/制件形狀={{1},{2,6},{3},{4,5,7}}
U/制件厚度={{1,3,5,7},{2,4},{6}}
U/樹脂={{1,2,4,5,6,7},{3}}
U/拉伸強度={{1,3,5},{2,4,6,7}}
計算每個屬性分類的相關性為:
Y制件形狀=2/7,Y制件厚度=1/7,Y樹脂= 1/7,Y拉伸強度=0。
所以選擇制件形狀作為決策樹的根節點,在制件形狀的每個分支上使用向樣的方法,后建立的成型方法決策樹如圖2所示。從生成的決策樹可以看出屬性樹脂被約簡掉。
[-page-] 決策樹確定后即可以采用帶置信度的IF-THEN形式,從決策樹的根到樹葉的每條路徑創建復合材料成型方法決策分類規則。其中,給定路徑上的每個屬性值形成規則前提的一個合取項,葉節點包含成型方法。下面給出由上述決策樹確定的部分決策規則。
RULES:<樹脂基復合材料成型方法決策規則>
IF等于(制件形狀,工字形,0.6)AND
等于(制件厚度,3,0.3)AND
等于(拉伸強度,100,0.1)
THEN選用(成型方法,RTM成型,1)END
以上結果表明,①利用知識相依性可以進行復合材料成型工藝決策知識的自動獲??;②由圖2生成的決策樹可知,利用知識相依性在建立復合材料成型工藝決策樹的同時可以對屬性進行約簡,實例中樹脂屬性被約簡掉,不用在建立決策樹后二次對決策樹進行修剪,提高決策規則的獲取效率。
4 結 語
針對復合材料成型工藝屬性復雜多樣和決策知識多是人機交互獲取的特點,本文在分析影響復合材料成型工藝決策數據的基礎上,利用知識相依性和決策樹算法對成型工藝決策知識進行自動獲取,規則提取算法簡單。實例表明,在利用知識相依性建立決策樹同時可以對決策樹的屬性進行約簡,提高復合材料成型工藝決策知識獲取的效率。










































