首頁 / 鴨寨文章 / 長受精持續性北京鴨 (L201) 第 11 世代選育之資料編輯
取消列印
列印本頁
長受精持續性北京鴨 (L201) 第 11 世代選育之資料編輯
發文日:107/02/28

撰稿人 陳志毅、魏良原、張惠斌、張怡穎、劉秀洲

東區分所北京鴨 L201 品系已繁殖至第28世代,本品系自第18代 (2006年) 起開始進行長受精持續性之選育工作,至2017年止已進行11代之選育,其目標是希望以育種方式以公白色番鴨配種母北京鴨時,將母鴨受精天數由3至4天延伸至6天,如此可大幅降低產業土番鴨生產之人力成本並提升生產效率。受精持續性性狀的評估項目包括入孵蛋數 (Ie)、受精蛋數 (The number of fertile eggs at candling, F)、最長受精蛋數 (The maximum duration of frtilility from 2nd day after AI up to the day of the last fertilr egg, Dm)、有效受精蛋數 (The number of dure fertile eggs ,Dr)、早期胚胎死亡 (Me)、晚期胚胎死亡 (Ml) 等,但目前在進行各種遺傳評估表單製作或運算時,仍以受精(蛋)天數最常做為持續性選育之指標性狀,因此本文資料編輯重點上,主要在說明如何將相關收集資訊進行資料編輯,包括系譜性能檔建立 (Established of pedigree and performance files)或資料標準化作業 (Data standardization) 等資料處理工作,以提供後續遺傳評估作業之資料來源。

系譜性能檔建立(Established of pedigree and performance files) L201 品系資料收集主要為系譜紀錄與性能檢定資料,通常以 Windows Microsoft Excel 試算表作為資料建立的基礎架構檔案,基本的系譜資料包括品系、 代數、籠號、蹼號、排區、鴨種、出生日期、性別、批次、父籠號、父蹼號、母 籠號、母蹼號、家族、週齡等 15 項欄位;檢定性狀的項目則包含體重(8 週齡)、 體重(16 週齡種)、入孵蛋數(29、32、35 週齡)、受精蛋數(29、32、35 週齡)、最 長受精日(29、32、35 週齡)、有效受精日數數(29、32、35 週齡)、早期死胚數(29、 32、35 週齡)、後期死胚數(29、32、35 週齡)、中止數(29、32、35 週齡)、孵化 數(29、32、35 週齡)、毛色級數(29、32、35 週齡)等 29 項欄位。 兩種收集項目資料,有時因應資料分析的需求,可以分開或合併建立均可, 但如果分開建立時,最好兩個檔案間要有共同的索引欄位鍵作為關聯性,例如「品 系-代數-腳號」所形成的複合鍵值欄,以便未來資料轉入資料庫成為關聯資料表 單時,可以連結合併使用。在進入後續遺傳評估作業如變方共變方成分分析之前, 通常會選用前述兩種檔案的部分欄位包括蹼號、父蹼號、母蹼號、出生日期、性 別、品系、批次、籠號,另包括入孵蛋數、受精蛋數、最長受精日、有效受精日 數數、早期死胚數、後期死胚數等 29、32、35 週齡的性狀表現值 (圖 1),嵌入 已編輯之 SAS 程式已產生變方成分分析之前置檔案。

資料標準化作業 (Data standardization) 理論上歷年所收集的受精持續性資料料建立,應該以資料庫直行建立方式,由上 往下累績建立的方式為宜,在進行資料編輯如區間擷取時,可採用功能鍵 F5 (到) 的執行命令,在視窗下方的參照位址,輸入我們所要擷取右下方區間的位址例如 F5000,然後同時按下 Shift+Enter 鍵,便可以快速選取所要的區間進行不同軟體 之間進行轉貼或轉換作業。而在遺傳評估分析時,會在多重應用各種軟體或程式 如 SAS 程式中進行片段轉貼的方式,或是為了方便管理年度檔案資訊分析,也 可以以一個年度作為一個工作表的方式建立,屆時可以查找函數 VLOOKUP 進 行查找而合併成一個資料表單。

蹼號標準化編輯 平常我們在鴨隻出生記錄世代 (如第 28 代) 的蹼號時,鴨有兩隻腳,4 個明 顯的蹼面位置可供出生時打洞形成蹼號以鑑別身分,每個蹼面呈倒三角形,自左 上角、右上角與底角打的洞分別為 1、3、5,因此可組合有 1、3、4、5、6、8、 9 等七種數字,沒有 2 與 7 號,因有 4 個蹼面,自左腳左蹼面致右腳右蹼面,分 別為千、百、時與個位數,因此可組合自 1 至 9999 號,但均不含 2 與 7 的組合 號數,如 12、200、799 等。現在說明蹼號補 0 的資料編輯,假設我們開啟「蹼 號補 0」的工作表,表內的 A1 至 H1,分別匯入包括「籠號」、「蹼號」、「父鴨蹼 號」、「母鴨蹼號」、「出生日期」、「性別」、「品系」、「批次」等欄位,A2 至 H2 3 資料分別紀錄為,「L214」、「1」、「536」、「445」、「2016/10/5」、「1」、「L201」、「1」, 前述的 B2 蹼號儲存格記錄方式並未能將代數的資料記錄進來,當我們紀錄第 28 代蹼 1 號的蹼號時,原本的欄位紀錄是「1」,為了區別是第 28 代的蹼號 1 號, 因此蹼號欄位應記錄成「280001」,我們可以使用 Excel 的 RIGHT 函數,假設 B2 儲存格為「1」,那 J2 儲存格設定為「=RIGHT("0000"&B2,4)」,J2 儲存格即 變成「0001」,再配合字串的結合函數「&」,讓 K2 的系譜蹼號「="28"&J2」, K2 儲存格即變成「280001」,也就達到我們代數與蹼號結合的目的了,前述函數 的應用,將第「28」代與蹼「1」號做結合,定義整個字串長度為 6 位數,中間 的部分就補為 0,讓資料記錄變得很整齊,同樣的方法就可以應用到「父鴨蹼號」 與「母鴨蹼號」的資料轉換上了。

性能紀錄之標準化編輯 開啟「查找性能」工作表,表內的 A1 至 H1,分別匯入包括「蹼號」、「父 鴨蹼號」、「母鴨蹼號」、「出生日期」、「性別」、「品系」、「批次」、「籠號」等欄位, 而性能資料欄位則為「29-Ie」、「29-F」、「29-Dm」、「29-Dr」、「29-Me」、「29-Ml」、 「32-Ie」、「32-F 32-Dm」、「32-Dr」、「32-Me」、「32-Ml」、「35-Ie」、「35-F35-Dm」、 「35-Dr」、「35-Me」、「35-Ml」,這樣的欄位順序是因應下階段 SAS 程式中,資 料匯入模組指令進行對應以方便程式執行。接下來要查照合併 G28 代對應系譜 資料的性能紀錄,假設 G28 代 L201 北京鴨受精持續性的檢定路徑在 「'C:\[L201G28-照蛋紀錄.xlsx'] 1-照蛋-29 週] 檔案工作表內,在此可使用「IF」、 4 「IERROR」搭配「VLOOKUP」函數,將工作表內已計算完畢之 Ie、F、Dm、 Dr、Me、Ml 等資料逐一代入。 以腳號「280003」母鴨為例,現要查找 29 週齡之入孵蛋數 (Ie),故令 I3 儲 存格為「IF(ISERROR(VLOOKUP(H3,'C:\[L201G28-照蛋紀錄.xlsx]1-照蛋-29 週 '!$A$2:$V$209,22,FALSE)),"",VLOOKUP(H3,'C:\[L201G28-照蛋紀錄.xlsx]1-照蛋 -29 週'!$A$2:$V$209,22,FALSE))」,其含義為,利用 H3(籠號)為 P143,至 「C:\[L201G28-照蛋紀錄.xlsx]1-照蛋-29 週」的工作表中查找入孵蛋數的性能資 料,若有查照到,如入孵蛋數為「12」,即回傳該數值於 I3 儲存格,但若未使 用 ISERROR 函數時,像 I2 列是公鴨資料,當使用 VLOOKUP 函數查找時, 因查無檢定數值,因此會傳回「#N/A」異常訊息,此表示使用 VLOOKUP 函數 時,是找不到可相配合的數值。在使用 VLOOKUP 函數時,如搭配 IF 與 ISERROR 等函數應用,將使資料查找表單畫面更為簡潔。當完成 I2 至 Z2 列之 29、32、35 週齡各項 Ie、F、Dm、Dr、Me、Ml 等性能查照成功後,可以將此 區域標是起來,當游標指向標示區右下角變成十字狀時,連續點按量下即可迅速 將所有性能資料整合進來。

偵測重複紀錄之錯誤值 為確保資料沒有重號或重複的情形發生,可應用 COUNTIFS 函數來進行標示並 5 刪除,以提升資料後續遺傳參數或育種價估算時所需之系譜檔與性能檔等來源檔 案之正確性。在「檢測重複」工作表中新增 A 欄欄名為「標示」,我們在 A2 儲 存格內鍵入「=COUNTIFS($b$1:b1,b1)」,B 欄為鴨腳號,因為 B2 儲存格為 「280095」,本函數的計算意義即為,從固定參照 B2 儲存格至變動參照 B2 儲存 格的範圍內,符合「280095」的個數有幾個? 得到函數計算結果僅為「1」個, 往下複製公式,到了 A3 儲存格時,本函數的計算自固定參照 B2 儲存格至變動 參照 B3 儲存格的範圍內,符合「280096」的個數仍僅有 1 個,故得到函數計算 結果為「1」,繼續往下複製公式,到了 A4 儲存格時,本函數的計算自固定參照 B2 儲存格至變動參照 B4 儲存格的範圍內,符合「280096」的個數已有 2 個 「280096」,故函數計算結果為「2」。注意第 3 列 I 欄 (籠號) 之後的 P 欄 (32-Ie: 32 週齡入孵蛋數)、Q 欄 (32-F:32 週齡受精蛋數)、R 欄 (32-Dm:32 週齡最長 受精天數)、S 欄 (32-Ie:32 週齡有效受精蛋數)、T 欄 (32-Me:32 週齡早期胚 胎死亡數)、U 欄 (32-Ml:32 週齡晚期胚胎死亡數) 分別有性狀紀錄資料 14、4、 4、4、1、3,而第 4 列的 I 欄之後所有性狀紀錄資料為空值,兩筆鴨腳號皆為「280096」 的重複紀錄,有性狀紀錄的第 3 列資料,A 欄標示為「1」,無性狀紀錄的第 4 列 資料,A 欄標示為「2」,若公式繼續往下複製,我們可以發現,沒有重複紀錄與 有重複紀錄但有性狀資料者,A 欄對應儲存格都被標示為「1」,這些都是我們需 要保留的唯一紀錄,而有重複紀錄但無性狀資料者則都被標示為「2」,這樣我們 就可以清楚的辨識哪些是我們要去除的重複性資料了。

結論 前述經過資料編輯後所產生之第 11 選育世代北京鴨受精持續性標準化系譜性能 資料檔 ('C:\L201G28-照蛋紀錄.xlsx'),可提供後續變方共變方成分((co)variance component estimation) 分析軟體 (VCE5) 進行遺傳參數估算、育種價估算 (Breeding value estimation) 估算軟體 (PEST) 進行個別種鴨選遇性狀遺傳能力 或進行 SAS 程式之模擬配種表製作 (Simulation breeding table) 時相關前置檔案 之來源,這些處理也是計量性狀遺傳選拔評估的重點資料編輯工作。