[吳亭穎] TISCalling:應用機器學習預測植物與病毒的轉譯起始位點之方法
發稿時間:研究團隊開發了一套名為 TISCalling 的生物資訊工具,旨在識別和鑑定真核生物及病毒基因組中的轉譯起始位點 (translational initiation sites, TISs)。過去的傳統方法在尋找這些位點時常有其侷限。它們不僅難以辨識那些非典型「AUG」起始碼的轉譯起始位點(TISs),也無法大規模、系統性的分析基因體中的蛋白質基因。此外,這些方法也難以清楚揭示信使核糖核酸(mRNA)序列中,究竟哪些部分對決定蛋白質的起始位置至關重要。TISCalling 採用機器學習方法,並利用來自植物和哺乳動物的核醣體定序(Ribo-seq)數據進行訓練,使其能夠精準預測多種物種(包括非典型的起始位點)的 TISs及相對應的蛋白質基因。
除了預測 TISs,該模型還能定量評估特定信使核糖核酸 (mRNA) 序列特徵對於決定轉譯起始位點的重要性,從而揭示出保守和物種特有的調控因子,進一步地提升了我們對轉譯起始調控機制的理解。為了便利生物學家使用,TISCalling 提供了一個使用者友善的網頁介面用以查詢單一基因中的TISs 和一組命令列套件,讓生物學家可利用自己的數據資料建立預測模型。本研究由中央研究院植物暨微生物學研究所吳亭穎及農業生物技術中心劉明容及台灣大學鄭佳宜三位老師合作完成。第一作者為嚴明仁為吳亭穎研究室之專任博士後研究員; 共同作者李雅茹為劉明容研究室之專任研究助理。此研究獲中央研究院前瞻計畫及國科會補助。