美吉生物

科研動態 動態詳情

中國首個國家級人類全基因組項目啟動實施,破解精準醫學發展瓶頸

科研動態2018-01-17 14:41

 “這是我國科學家首次完全自主實施的國家級人類全基因組項目。項目負責人、哈工大生物信息技術研究院院長王亞東在啟動會上介紹,項目組將選取十萬中國自然人群作為研究對象,進行基因組、暴露組、表型組等組學研究,揭示中國人群特有基因組變異、變異頻率及其影響,最終繪制完成屬于國人自己的基因組變異圖譜和多組學健康地圖。

 “目前,我國在人類基因組研究方面的總體科學影響力,還不能認為是達到了國際領先水平。中國科學院上海生命科學研究院生物醫學大數據中心首席科學家、中國科學院院士趙國屏評價道,在組學研究進入大數據時代這個關鍵時刻,結合精準醫療方向實施中國人群多組學參比數據庫與分析系統建設這一大研究計劃,輔以正在開展的大規模人群隊列研究和正在籌劃中的人類表型組計劃,是我們實現彎道超車的大好機遇。

為什么要選定十萬人

人類基因組變異多數都是無害的,但也有些變異可導致疾病,如癌癥、心腦血管疾病、糖尿病等。中國十萬人基因組計劃就是要比較全面而精準地鑒定中國人的基因組變異及相關的其他組學(包括表型組)數據,形成比較完善的基因組變異參比數據庫。這個基本數據基礎,將大大促進我國科學和醫學工作者,鑒定與不同人群表型(包括各種復雜疾病)相關的基因組變異,以利于疾病防治,保證全民健康。

我國尚未建立高精度的中國人參考基因組,大量精準醫學前沿研究缺少參考數據,已經成為我國精準醫學發展的重大瓶頸問題。王亞東坦言,啟動中國十萬人基因組計劃就是瞄準了這一瓶頸問題。

王亞東表示,該計劃將構建世界級精度中國人參考基因組和多組學參比數據庫,這是我國精準醫學發展的重要基礎,將滿足精準醫學研究的關鍵共性需求,有助于挖掘健康和疾病的遺傳與環境風險因素的相關性、建立精準的疾病防治方案。

 那么,為什么要選定十萬人作為參比人群?實際上,研究環境和基因相互作用對健康的影響,研究腫瘤等重大疾病易感性的個體遺傳差異,罕見變異(頻率低于千分之五)可能是重要的研究對象。王亞東在接受媒體采訪時指出,我國人口接近14億,遺傳結構復雜,根據統計遺傳學理論,要達到本項目精確地鑒定罕見變異的目標,即變異檢測的精度達到萬分之一,十萬人只是一個最小限度的基因組測序數量。

那這十萬人又是如何選取出來的呢?一方面是依托精準醫學研究專項等國家科研項目,從已有的研究隊列中選取樣本;另一方面,項目還將建立一個開放的平臺,志愿者也可以參與其中。

為了保證樣本的全面性和多樣性,項目基本涵蓋了我國東北、西北、華北、華中、華東、華南、西南7大地區的漢族樣本。同時,還選擇了包括藏族、蒙古族、壯族、回族、滿族等9個人口數量在500萬以上的少數民族群體,在接下來的項目推動過程中,將逐步擴展到56個民族。

實施過程將面臨重大挑戰

人類約有2.5萬個基因,要想把十萬人每個人體內的基因密碼全部解開,面臨的首要挑戰就是十萬人基因組變異檢測的計算復雜性和質量控制。

趙國屏對《中國科學報》記者解釋道,全基因組是指全部30億堿基長的人類基因組序列。只有通過包括全基因組測序又高于現在常用的二代測序的方法,才能夠發現基因組上的單核苷酸變異(SNV)、插入/缺失變異(INDEL)和結構變異(SV)等所有基因組變異。

 “在過去的基因組計劃,雖然GWAS(全基因組關聯分析)研究曾經用到萬人以上的樣本,但全基因組測序的計劃從未有如此大的樣本。趙國屏表示,該項目產生的數據規模巨大,數據總量可達到10PB,從基因組測序數據中檢測基因組變異的計算量巨大,可達到2000CPU小時,需要建立高效的計算分析平臺完成所有數據分析工作。

除此之外,目前,國際上的基因組變異檢測方法準確率較低,其中SNP準確率低于99%INDEL準確率低于95%SV準確率低于90%。如何確保此次項目數據分析的準確度也是一大難點。

因此,我們需要建立高效的計算分析平臺完成所有數據分析工作,研發更高精度的基因組分析算法、軟件和工作流,以及基因組變異檢測的質量控制體系,確保基因組變異檢測的準確性。王亞東說。

面對龐大數據算法方面的挑戰,上海交通大學Bio-X研究院院長、中國科學院院士賀林則建議,除了算法改進和計算機能力的更新,未來側重點還應考慮放在對海量垃圾序列的劃界和處理上。

除此之外,賀林還對《中國科學報》記者指出,中國十萬人基因組計劃完成之后,立即面對的是如何解讀所得到的大量序列數據與健康和疾病之間的關系。建立遺傳咨詢行業被認為是唯一出路,然而在我國的職業大典上,至今還找不到遺傳咨詢師這一職業。

集中力量實現彎道超車

繼成功繪制人類基因組測序中國卷和水稻基因組圖譜后,進入本世紀以來,我國科學家繼續向著生命科學的深處進軍,繼續參與了人類基因組新計劃HapMap計劃、腫瘤基因組計劃和千人基因組計劃,并且在成功完成HapMap計劃的基礎上,針對若干重大疾病,大規模地開展GWAS研究工作,獲得了可喜的成就。

據趙國屏介紹,在過去二十年里,利用人類基因組研究的技術與知識,中國微生物(包括病毒)基因組研究進展迅速,在傳染病防控的基礎研究與臨床應用方面迅速走向國際前沿。另外,中國在干細胞、腫瘤防治、胎兒遺傳疾病早期檢測、慢性病代謝病防治方面的進步也有目共睹,其中干細胞的研究已經達到了國際前沿水平。但是,我國在基因組,特別是人類基因組研究方面的總體科學影響力,還達不到國際領先的水平。

趙國屏認為,對基因組的研究,本質上是對基因型的認識。我們目前所使用的關于人類基因組的比較系統和可靠的基礎數據,大部分是由以西方人群為主的國際研究項目所提供,這對于服務中國人的健康與醫藥事業是不適應的。另一方面,以往國際項目對于相應表型信息的采集,基本上是項目導向,比較分散難以整合,再加上其中亞洲人樣本有限,也更為開展基因型與表型的相關分析帶來了基礎性的問題。

 “造成這個問題的根本原因就是我們在過去二十年中,對于我們自己產生的基因組數據的整合、交互和共享沒有組織并實施持之以恒的大規模的工程性管理、支撐、服務、研究和開發工作。趙國屏再次強調說。

而此次啟動的中國十萬人基因組計劃正好給了我們彎道超車的大好機遇。中國人多組學相關項目的整合,為中國人類基因組研究走向工程化,為中國人類基因組數據能夠真正在整合與共享基礎上實現高效的挖掘與研發創造了條件。相信這個項目的扎實推進,一定能為我國健康事業和生命科學研究事業作出根本性的貢獻。

據悉,該項目設立五個課題,分別由哈爾濱工業大學、復旦大學、中國科學院北京基因組研究所、華中科技大學、中國科學院上海生命科學研究院等五個科研單位領銜,將有20個大學、科研院所和企業的166位專家學者參與到項目中。

 “現在我國測序設計和分析能力是有的,但力量卻是分散的,這次項目是一個機會,希望能夠把力量集中起來。現在,在籌備的過程中,也看到了這方面希望。趙國屏說。

來源:中國科學報

分享到:

微信掃一掃

幸运农场