改善植物分子育種的新工具-Khufu
文章來源 : 農業科技決策資訊平台 2022-01-14
HudsonAlpha生技研究中心的研究員Josh Clevenger博士,在花生育種和遺傳學領域工作了將近八年,他越來越熱衷於改良作物,期望實現更穩健及可續性的農業。因此與HudsonAlpha的資訊生物學家Walid Korani博士合作,並創建了一種稱為Khufu的計算工具,用來快速準確地辨別及分析複雜基因組中的變異。Clevenger解釋:「我想透過更快地將有益性狀的基因導入種植在農民土地上的作物中,來縮小科學理論與現實之間的差距。為此,他在HudsonAlpha的團隊開發了一個更好的計算工具,來協助辨識遺傳因子以選擇有益性狀,開發新的快速的育種目標,並將這些性狀導入現有的作物品系中。
為了繪製遺傳圖譜註1,被研究的植物DNA序列必須和對照基因組做比對。當對焦在複雜的植物基因組時,很難標示短鏈DNA到參考基因組中,並準確識別與觀察性狀相關的SNPs註2這類分子標誌。經過多年識別花生SNPs的艱難過程,Clevenger與Korani一起開發了解決方案,新的計算工具-Khufu。Khufu使用低覆蓋率註3、短序列片段來進行定序,且只要正常成本的一小部分就可提供基因型鑑定註4結果。使用新工具,Khufu用極低的覆蓋率就可進行基因測序,並提供非常精準的SNP識別結果。由於每個個案需要的序列較短,因此即使在小型育種計劃中,全基因組測序的花費也是可負擔的。全基因組標誌的利用,大大提高了標的及整合性狀的能力和準確度,並可將這個新工具傳遞給更多的育種者和遺傳學家。合作者可以期待短時間就能得到結果,因為分析在序列生成後幾天內就能完成。
Clevenger說:「Khufu不是數據生成服務,而是一種數據分析服務,以少量成本就能提供定序,或者可以分析不同應用程式所生成的序列。Khufu的成本與SNP陣列的生成成本差不多,它不僅提供了完整基因型的分析,並對感興趣的性狀提供了標記目標,最重要的是節省了寶貴的時間。Khufu是一個高度精確的資訊學平臺,優於過去已經發表的方法。」從Illumina低定序深度註5的短序列植物樣本中,識別不同的SNP相當具有挑戰性,因為大多數植物基因組為多倍體,並且有相當多的重複區域。即使採取直接過濾的方式,也會遺失含有大量資訊的SNP。Korani解釋:「Khufu創建了一系列的演算法,可有效地找出錯誤識別的SNP,使其不管識別植物或動物族群中與特定性狀相關的SNP,皆有高達99.9%的精準度。
除此之外,Khufu非常高效地利用電腦運算資源,來顯著提升演算過程的速度。」Khufu最初是為Clevenger和Korani為了花生物種的研究而開發的,但經由重新分析過去研究的其他大量數據組,可以清楚地看到Khufu在各物種及族群中的執行效率如何。無論族群結構或基因組的複雜度高低,Khufu對小量或大量的植物進行基因型分析都是有效的。Clevenger說:「我們希望透過為其他研究人員提供這種低成本、高準度運算的軟體,能夠幫助推動許多不同領域的基因組研究。」【延伸閱讀】加速植物育種新技術
註1:「遺傳圖譜」為基因標示在染色體上的相對位置及遺傳距離;註2:「SNP」即單一核苷酸多型性,為DNA序列中的單一鹼基對變異;註3:「覆蓋率」是指基因體定序後得到的重複序列(鹼基覆蓋)的比例;註4:「基因型鑑定」是用於偵測個體間存在的DNA序列差異,再配合個體或群體的表現型加以分析其關聯性的技術;註5:「定序深度」是指定序得到的鹼基總量與基因體大小的比值
資料來源