正交試驗(研究多因素多水平的設計方法)

正交試驗設計(Orthogonal experimental design)是研究多因素多水平的又一種設計方法,它是根據正交性從全面試驗中挑選出部分有代表性的點進行試驗,這些有代表性的點具備了“均勻分散,齊整可比”的特點,正交試驗設計是分式析因設計的主要方法。是一種高效率、快速、經濟的實驗設計方法。日本著名的統計學家田口玄一將正交試驗選擇的水平組合列成表格,稱為正交表。

簡介內容

當分析因設計要求的實驗次數太多時,一個非常自然的想法就是從析因設計的水平組合中,選擇一部分有代表性水平組合進行試驗。因此就出現了分式析因設計(fractional factorial designs),但是對於試驗設計知識較少的實際工作者來說,選擇適當的分式析因設計還是比較困難的。例如作一個三因素三水平的實驗,按全面實驗要求,須進行3^3=27種組合的實驗,且尚未考慮每一組合的重複數。若按L9(3^3)正交表安排實驗,只需作9次,按L18(3^7)正交表進行18次實驗,顯然大大減少了工作量。因而正交實驗設計在很多領域的研究中已經得到廣泛應用。

應用範圍

正交表

正交表是一整套規則的設計表格,用。L為正交表的代號,n為試驗的次數,t為水平數,c為列數,也就是可能安排最多的因素個數。例如L9(340,它表示需作9次實驗,最多可觀察4個因素,每個因素均為3水平。一個正交表中也可以各列的水平數不相等,我們稱它為混合型正交表,如L8(4×24),此表的5列中,有1列為4水平,4列為2水平。根據正交表的數據結構看出,正交表是一個t行c列的表,其中第j列由數碼1,2,… Sj 組成,這些數碼均各出現N/S 次,例如表11中,第二列的數碼個數為3,S=3 ,即由1、2、3組成,各數碼均出現1次。

兩項性質

(1)每一列中,不同的數字出現的次數相等。例如在兩水平正交表中,任何一列都有數碼“1”與“2”,且任何一列中它們出現的次數是相等的;如在三水平正交表中,任何一列都有“1”、“2”、“3”,且在任一列的出現數均相等。

(2)任意兩列中數字的排列方式齊全而且均衡。例如在兩水平正交表中,任何兩列(同一橫行內)有序對子共有4種:(1,1)、(1,2)、(2,1)、(2,2)。每種對數出現次數相等。在三水平情況下,任何兩列(同一橫行內)有序對共有9種,1.1、1.2、1.3、2.1、2.2、2.3、3.1、3.2、3.3,且每對出現數也均相等。

以上兩點充分的體現了正交表的兩大優越性,即“均勻分散性,整齊可比”。通俗的說,每個因素的每個水平與另一個因素各水平各碰一次,這就是正交性。

交互作用表

每一張正交表后都附有相應的交互作用表,它是專門用來安排交互作用試驗。表14就是L8(27)表的交互作用表。

安排交互作用的試驗時,是將兩個因素的交互作用當作一個新的因素,佔用一列,為交互作用列,從表14中可查出L8(27)正交表中的任何兩列的交互作用列。表中帶( )的為主因素的列號,它與另一主因素的交互列為第一個列號從左向右,第二個列號順次由下向上,二者相交的號為二者的交互作用列。例如將A因素排為第(1)列,B因素排為第(2)列,兩數字相交為3,則第3列為A×B交互作用列。又如可以看到第4列與第6列的交互列是第2列,等等。

3.正交實驗的表頭設計 表頭設計是正交設計的關鍵,它承擔著將各因素及交互作用合理安排到正交表的各列中的重要任務,因此一個表頭設計就是一個設計方案。

主要步驟

表頭設計的主要步驟如下:

(1)確定列數 根據試驗目的,選擇處理因素與不可忽略的交互作用,明確其共有多少個數,如果對研究中的某些問題尚不太了解,列可多一些,但一般不宜過多。當每個試驗號無重複,只有1個試驗數據時,可設2個或多個空白列,作為計算誤差項之用。

(2)確定各因素的水平數 根據研究目的,一般二水平(有、無)可作因素篩選用;也可適用於試驗次數少、分批進行的研究。三水平可觀察變化趨勢,選擇最佳搭配;多水平能以一次滿足試驗要求。

(3)選定正交表 根據確定的列數©與水平數(t)選擇相應的正交表。例如觀察5個因素8個一級交互作用,留兩個空白列,且每個因素取2水平,則適宜選L16(215)表。由於同水平的正交表有多個,如L8(27)、L12(211)、L16(215),一般只要表中列數比考慮需要觀察的個數稍多一點即可,這樣省工省時。

(4)表頭安排 應優先考慮交互作用不可忽略的處理因素,按照不可混雜的原則,將它們及交互作用首先在表頭排妥,而後再將剩餘各因素任意安排在各列上。例如某項目考察4個因素A、B、C、D及A×B交互作用,各因素均為2水平,現選取L8(27)表,由於AB兩因素需要觀察其交互作用,故將二者優先安排在第1、2列,根據交互作用表查得A×B應排在第3列,於是C排在第4列,由於A×C交互在第5列,B×C交互作用在第6列,雖然未考查A×C與B×C,為避免混雜之嫌,D就排在第7列。

(5)組織實施方案 根據選定正交表中各因素佔有列的水平數列,構成實施方案表,按實驗號依次進行,共作n次實驗,每次實驗按表中橫行的各水平組合進行。例如L9(34)表,若安排四個因素,第一次實驗A、B、C、D四因素均取1水平,第二次實驗A因素1水平,B、C、D取2水平,……第九次實驗A、B因素取3水平,C因素取2水平,D因素取1水平。實驗結果數據記錄在該行的末尾。因此整個設計過程我們可用一句話歸納為:“因素順序上列、水平對號入座,實驗橫着作”。

4.二水平有交互作用的正交實驗設計與方差分析

例8 某研究室研究影響某試劑回收率的三個因素,包括溫度、反應時間、原料配比,每個因素都為二水平,各因素及其水平見表16。選用L8(27)正交表進行實驗,實驗結果見表17。

首先計算Ij 與IIj ,Ij為第j列第1水平各試驗結果取值之和,IIj為第j列第2水平各試驗結果取值之和。然後進行方差分析。過程為:

求:總離差平方和

各列離差平方和 SSj=

本例各列離均差平方和見表10最底部一行。即各空列SSj之和。即誤差平方和

自由度v為各列水平數減1,交互作用項的自由度為相交因素自由度的乘積。

分析結果見表18。

從表18看出,在α=0.05水準上,只有C因素與A×B交互作用有統計學意義,其餘各因素均無統計學意義,A因素影響最小,考慮到交互作用A×B的影響較大,且它們的二水平為優。在C2的情況下,有B1A2和B1,A1兩種組合狀況下的回收率最高。考慮到B因素影響較A因素影響大些,而B中選B1為好,故選A2B1。這樣最後決定最佳配方為A2B1C2,即80℃,反應時間2.5h,原料配比為1.2:1。

如果使用計算機進行統計分析,在數據是只需要輸入試驗因素和實驗結果的內容,交互作用界的內容不用輸入,然後按照表頭定義要分析的模型進行方差分析。