佳學(xué)基因遺傳病基因檢測(cè)機(jī)構(gòu)排名,三甲醫(yī)院的選擇

基因檢測(cè)就找佳學(xué)基因!

熱門搜索
  • 癲癇
  • 精神分裂癥
  • 魚鱗病
  • 白癜風(fēng)
  • 唇腭裂
  • 多指并指
  • 特發(fā)性震顫
  • 白化病
  • 色素失禁癥
  • 狐臭
  • 斜視
  • 視網(wǎng)膜色素變性
  • 脊髓小腦萎縮
  • 軟骨發(fā)育不全
  • 血友病

客服電話

4001601189

在線咨詢

CONSULTATION

一鍵分享

CLICK SHARING

返回頂部

BACK TO TOP

分享基因科技,實(shí)現(xiàn)人人健康!
×
查病因,阻遺傳,哪里干?佳學(xué)基因準(zhǔn)確有效服務(wù)好! 靶向用藥怎么搞,佳學(xué)基因測(cè)基因,優(yōu)化療效 風(fēng)險(xiǎn)基因哪里測(cè),佳學(xué)基因
當(dāng)前位置:????致電4001601189! > 關(guān)于佳學(xué) > 技術(shù)優(yōu)勢(shì) >

【佳學(xué)基因檢測(cè)】基因序列是如何決定人的多方面性狀智力及疾病特征的?

【佳學(xué)基因檢測(cè)】基因序列是如何決定人的多方面性狀智力及疾病特征的? 人的基因信息已成為研究人的結(jié)構(gòu)與功能并讓人類改造自我的是最具活力的領(lǐng)域之一,具有日益廣泛的社會(huì)影響。在

佳學(xué)基因檢測(cè)】基因序列是如何決定人的多方面性狀智力及疾病特征的?

 

人的基因信息已成為研究人的結(jié)構(gòu)與功能并讓人類改造自我的是最具活力的領(lǐng)域之一,具有日益廣泛的社會(huì)影響。在《基因序列是如何決定人的多方面性狀智力及疾病特征的?》中,佳學(xué)基因討論了該領(lǐng)域的最新成就、正在進(jìn)行的努力和未來(lái)的挑戰(zhàn)。技術(shù)進(jìn)步、統(tǒng)計(jì)方法和研究規(guī)模的不斷擴(kuò)大都為基因解碼提供了許多見(jiàn)解,讓人們了解了導(dǎo)致當(dāng)前遺傳變異模式的過(guò)程。人類特征和疾病的大量遺傳關(guān)聯(lián)圖譜使人們能夠?qū)ζ溥z傳結(jié)構(gòu)進(jìn)行表征。最后,對(duì)遺傳變異的分子和細(xì)胞效應(yīng)的基因解碼為人們了解疾病背后的生物學(xué)過(guò)程提供了見(jiàn)解。雖然還有許多懸而未決的問(wèn)題,但隨著該領(lǐng)域越來(lái)越多地使用遺傳數(shù)據(jù)來(lái)了解我們物種的歷史及其在改善人類健康方面的應(yīng)用,它已準(zhǔn)備好取得突破性發(fā)現(xiàn)。

佳學(xué)基因?yàn)槭裁匆剿骰蛐蛄惺侨绾螞Q定人的多方面性狀及智力特征的?

佳學(xué)基因?qū)?20 世紀(jì)理解遺傳信息結(jié)構(gòu)和內(nèi)容的進(jìn)展分為四個(gè)階段。每個(gè)階段約占四分之一世紀(jì):發(fā)現(xiàn)染色體;定義 DNA 的分子結(jié)構(gòu);發(fā)現(xiàn)基因功能的分子機(jī)制;最終確定整個(gè)基因、支架和基因組的序列。這些成就推動(dòng)了整個(gè)遺傳學(xué)領(lǐng)域在 21 世紀(jì)初進(jìn)入基因組時(shí)代。

在21世紀(jì)的第一個(gè) 25 年即將結(jié)束,我們可以回顧一下基因組學(xué)在這一時(shí)期取得的最高成就:人類群體遺傳變異的特征描述和其對(duì)表型變異的貢獻(xiàn)的發(fā)現(xiàn)。自人類基因組序列草圖公布以來(lái),人類遺傳學(xué)在遺傳數(shù)據(jù)的多樣性和質(zhì)量方面都經(jīng)歷了顯著增長(zhǎng),同時(shí)人們對(duì)遺傳變異與各種表型之間的關(guān)聯(lián)有了更深入的了解(圖 1a)。這些發(fā)展證明了遺傳學(xué)在表征人類生物學(xué)(從分子到生理水平)以及我們物種的進(jìn)化歷史和復(fù)雜性狀的進(jìn)化方面發(fā)揮著根本性作用,正如我們?cè)诒揪C述中討論的那樣。

圖 1.人類基因解碼數(shù)據(jù)集及其作用

人類基因解碼數(shù)據(jù)集及其作用

A)用于人的基因解碼的數(shù)據(jù)集的增長(zhǎng),以選定的里程碑研究的性質(zhì)為例,按基因組分析的全面性(x 軸)繪制,頂部標(biāo)明技術(shù),y 軸標(biāo)明樣本數(shù)量??捎玫谋硇蛿?shù)據(jù)的類型和數(shù)量用點(diǎn)表示。帶下劃線的項(xiàng)目名稱包括來(lái)自不同祖先的個(gè)體的相對(duì)平衡的代表性。顯示的項(xiàng)目是人類基因組計(jì)劃 (HGP);HapMap;威康信托病例控制聯(lián)盟 (WTCCC);1000 基因組 (1KG)、英國(guó)生物庫(kù) (UKBB)、泛基因組計(jì)劃、基因型組織表達(dá) (GTEx) 和精準(zhǔn)醫(yī)學(xué)跨組學(xué) (TOPMed)。WGS = 全基因組測(cè)序。BC )說(shuō)明人類遺傳學(xué)如何通過(guò)兩種互補(bǔ)方法促進(jìn)人類健康。B說(shuō)明了強(qiáng)大的GWAS如何能夠建立可用于個(gè)性化疾病風(fēng)險(xiǎn)預(yù)測(cè)的多基因風(fēng)險(xiǎn)評(píng)分。C說(shuō)明了如何了解 GWAS 基因座的功能機(jī)制才能利用藥物和其他干預(yù)措施針對(duì)這些機(jī)制來(lái)預(yù)防或治療疾病。

這些投資也受到人類基因研究增進(jìn)人類健康的潛力的推動(dòng)。這可以通過(guò)兩種協(xié)同途徑展開(kāi)。準(zhǔn)確預(yù)測(cè)遺傳對(duì)疾病風(fēng)險(xiǎn)的影響可以改善診斷、預(yù)后和治療選擇。雖然基因組醫(yī)學(xué)已經(jīng)對(duì)罕見(jiàn)疾病產(chǎn)生了變革性的臨床影響 ,但復(fù)雜疾病中的類似應(yīng)用由于多基因風(fēng)險(xiǎn)評(píng)分基因解碼技術(shù)的出現(xiàn)而開(kāi)始應(yīng)用(圖 1b )。除了預(yù)測(cè)之外,人類遺傳學(xué)還通過(guò)識(shí)別與疾病有關(guān)的致病基因和分子機(jī)制來(lái)促進(jìn)新藥和干預(yù)措施的開(kāi)發(fā)(圖 1c)。這種模式得到了遺傳證據(jù)支持的藥物靶標(biāo)成功率較高的良好支持。這需要表征遺傳疾病關(guān)聯(lián)的功能機(jī)制,這些遺傳預(yù)測(cè)和機(jī)制理解目標(biāo)的基礎(chǔ)是群體遺傳學(xué),它描述了導(dǎo)致和維持人類遺傳變異的過(guò)程。

存在于人群的基因變異的來(lái)原及其模式

群體遺傳學(xué)起源于一個(gè)多世紀(jì)前,與現(xiàn)代統(tǒng)計(jì)學(xué)同時(shí)出現(xiàn),是一門研究群體內(nèi)遺傳變異起源和進(jìn)化的學(xué)科。傳統(tǒng)上,“群體”在生物學(xué)意義上是指隨機(jī)交配的個(gè)體群體。然而,當(dāng)應(yīng)用于我們自己物種時(shí),這個(gè)術(shù)語(yǔ)通常用于劃分人類群體,從而暗示人類遺傳變異的離散單位,這與全人類共享的驚人變異量形成鮮明對(duì)比 。佳學(xué)基因在普及基因解碼知識(shí)時(shí)從生物學(xué)技術(shù)意義上使用“群體”,但越來(lái)越多的學(xué)科呼吁改變將人類群體標(biāo)記為離散獨(dú)立單位的呼吁,特別是當(dāng)社會(huì)制度影響了這些單位標(biāo)簽 。事實(shí)上,美國(guó)國(guó)家人類基因組研究所的戰(zhàn)略計(jì)劃中提出了十大“到 2030 年人類基因組學(xué)的大膽預(yù)測(cè)”之一:“人類基因組學(xué)研究將超越基于種族等歷史社會(huì)結(jié)構(gòu)的群體描述。” 

Hubby 和 Lewontin 率先使用凝膠電泳法來(lái)證明自然種群在基因?qū)用嫔系淖儺?,他們引用了這樣的觀點(diǎn):“對(duì)一個(gè)種群的基因變異的描述是進(jìn)化研究的基本數(shù)據(jù)。”因此,關(guān)注一個(gè)種群的基因變異的群體遺傳學(xué)研究對(duì)于理解復(fù)雜性狀的遺傳基礎(chǔ)至關(guān)重要,而未來(lái)的許多研究機(jī)會(huì)都存在于人類群體遺傳學(xué)和統(tǒng)計(jì)遺傳學(xué)的交叉點(diǎn)上。

群體遺傳學(xué)的基因組時(shí)代數(shù)據(jù)集

早期與人類基因組計(jì)劃同時(shí)開(kāi)展的項(xiàng)目使人們對(duì)近代人類種群歷史有了更多的了解,特別是人類基因組多樣性小組 (HGDP) ;和國(guó)際 HapMap 計(jì)劃(以下簡(jiǎn)稱“HapMap”)。HGDP 包含來(lái)自全球分布人群的 1064 個(gè)個(gè)體的淋巴母細(xì)胞系,用于表征人類群體遺傳變異。HapMap 是一項(xiàng)國(guó)際合作,始于 2002 年,專注于開(kāi)發(fā)人類基因組單倍型圖譜,其特定目的是推進(jìn)遺傳關(guān)聯(lián)研究。HapMap 最終導(dǎo)致在 2009 年發(fā)布了來(lái)自 11 個(gè)人群的 1301 個(gè)樣本的超過(guò) 160 萬(wàn)個(gè)單核苷酸變異 (SNV) 。 1000 基因組計(jì)劃于 2008 年啟動(dòng),是 HapMap 項(xiàng)目的延續(xù),旨在對(duì)人類基因組中在研究人群中頻率至少為 1% 的變異進(jìn)行分類。該計(jì)劃將關(guān)注點(diǎn)從 SNV 擴(kuò)展到其他類型的遺傳變異,并使用低覆蓋率和高覆蓋率的全基因組和外顯子組測(cè)序,開(kāi)啟了專注于分析全基因組序列的群體遺傳學(xué)新階段。1000 基因組計(jì)劃的數(shù)據(jù)包括來(lái)自 26 個(gè)種群的 2,500 多個(gè)個(gè)體的序列。

除了專注于描述一般人群遺傳變異的項(xiàng)目外,由于數(shù)據(jù)資源可訪問(wèn)但與供體表型無(wú)關(guān),為復(fù)雜性狀基因圖譜創(chuàng)建的大型病例對(duì)照數(shù)據(jù)集(見(jiàn)下文)也用于群體遺傳推斷。今天,這種趨勢(shì)仍在繼續(xù),人們?cè)絹?lái)越重視生物庫(kù)數(shù)據(jù)集,這些數(shù)據(jù)集結(jié)合了來(lái)自多達(dá)數(shù)十萬(wàn)個(gè)體的基因數(shù)據(jù)集進(jìn)行全面的表型分析,通常利用醫(yī)療保健系統(tǒng)和基因型登記。生物庫(kù)對(duì)于群體遺傳研究的一個(gè)主要好處是,由于其規(guī)模以及遠(yuǎn)親和近親的存在,它們可以提供過(guò)去幾百年來(lái)基因流動(dòng)、選擇性交配和種群結(jié)構(gòu)的高分辨率洞察。例如,英國(guó)生物庫(kù)包含超過(guò) 40,000 個(gè)一級(jí)和二級(jí)親屬對(duì),F(xiàn)innGen 包含超過(guò) 30,000 個(gè)一級(jí)和二級(jí)親屬對(duì)。

雖然早期以疾病為重點(diǎn)的病例對(duì)照數(shù)據(jù)集中來(lái)自非歐洲血統(tǒng)的數(shù)據(jù)很少,但在生物庫(kù)時(shí)代取得了一些進(jìn)展 — — 至少在非歐洲捐獻(xiàn)者的絕對(duì)數(shù)量上,例如日本生物庫(kù)和 All of Us。但是,歐洲血統(tǒng)仍然在大多數(shù)生物庫(kù)中占主導(dǎo)地位,例如英國(guó)生物庫(kù)、FinnGen、deCODE 和愛(ài)沙尼亞生物庫(kù)。不幸的是,盡管非洲人群對(duì)于理解人類遺傳變異的起源具有特殊價(jià)值,但在遺傳數(shù)據(jù)集中仍然未得到充分研究和代表性不足。此外,對(duì)大規(guī)模和生物庫(kù)數(shù)據(jù)集的研究通常仍然忽略來(lái)自少數(shù)群體的數(shù)據(jù),這不僅強(qiáng)調(diào)了多樣化數(shù)據(jù)對(duì)于分析的重要性,而且強(qiáng)調(diào)了處理不平衡數(shù)據(jù)集和不同程度的連鎖不平衡(LD,不同遺傳變異的等位基因相關(guān)性)的方法在人類遺傳研究中的重要性。在基因研究多樣化過(guò)程中,對(duì)數(shù)據(jù)和方法的需求與倫理、法律和社會(huì)問(wèn)題密不可分。從 HGDP 開(kāi)始,許多人口遺傳學(xué)研究都曾面臨并將繼續(xù)面臨有關(guān)從參與個(gè)人及其社區(qū)收集和使用基因數(shù)據(jù)的倫理問(wèn)題。對(duì)于生物庫(kù)項(xiàng)目和其他基因研究,知情同意實(shí)踐至關(guān)重要,同時(shí)還需要社區(qū)參與和向利益相關(guān)者發(fā)布結(jié)果。

從遺傳學(xué)研究洞察人類種群歷史

應(yīng)用于自然種群遺傳變異數(shù)據(jù)的種群遺傳學(xué)方法能夠基于四個(gè)基本過(guò)程推斷過(guò)去:突變、重組、漂移(由有限的種群規(guī)模引起)和選擇。第五個(gè)過(guò)程——遷移(基因流動(dòng))越來(lái)越受到重視,它被認(rèn)為是在多個(gè)時(shí)間尺度上塑造人類遺傳變異的力量。總之,對(duì)這些過(guò)程的分析為了解人類種群歷史及其對(duì)當(dāng)代人類遺傳變異模式的貢獻(xiàn)提供了寶貴的見(jiàn)解。

群體遺傳學(xué)研究的主要重點(diǎn)領(lǐng)域之一是描述人類在漫長(zhǎng)時(shí)間尺度上的遷徙特征。最近,人類起源的新模型凸顯了非洲深層人口結(jié)構(gòu)的復(fù)雜性,這反過(guò)來(lái)又為擴(kuò)大古代基因滲入現(xiàn)代人類的研究重點(diǎn)提供了途徑,超越非洲以外的模式。在許多地理區(qū)域,數(shù)千年來(lái)的局部遷徙使遺傳距離和地理距離之間呈現(xiàn)出高度相關(guān)性。然而,殖民化和奴隸制等歷史事件進(jìn)一步導(dǎo)致了混合種群的建立和存續(xù)——這些種群是兩個(gè)或多個(gè)先前分離的源種群之間基因流動(dòng)的后代,其后代個(gè)體隨著時(shí)間的推移從源種群中獲得不同比例的血統(tǒng)。基因組時(shí)代測(cè)序技術(shù)的進(jìn)步和醫(yī)學(xué)研究大規(guī)模數(shù)據(jù)集的引入,使人們能夠深入了解最近和更局部的基因流動(dòng),例如美國(guó)南部非洲裔美國(guó)人大遷徙(1910-1970 年)。雖然一些遷徙事件從考古學(xué)和歷史記錄中相對(duì)知名,但捕捉生物祖先的基因數(shù)據(jù)為人類歷史上的人口流動(dòng)提供了獨(dú)特的見(jiàn)解。

人類歷史中大部分時(shí)期的種群建立事件導(dǎo)致遺傳變異急劇減少。再加上人類物種在非洲的起源相對(duì)較晚,導(dǎo)致了一種模式:人類個(gè)體基因組之間的遺傳差異非常小,比許多其他物種的差異要?。怀R?jiàn)變異往往是跨種群共享的;大多數(shù)人類遺傳變異相當(dāng)罕見(jiàn),僅限于單一大陸祖先。雖然單核苷酸變異出現(xiàn)在基因組 3.1% 的位點(diǎn)中,但絕大多數(shù)已編目的變異都極為罕見(jiàn),因此任何兩個(gè)個(gè)體之間的差異平均只有幾百萬(wàn)個(gè)單核苷酸變異,占基因組的不到 0.1%。由于連續(xù)奠基者效應(yīng),遺傳變異的數(shù)量隨著人口與非洲的距離而減少:最近為協(xié)調(diào) HGDP 和 1000 Genomes 高質(zhì)量全基因組序列數(shù)據(jù)而做出的努力計(jì)算出每個(gè)非洲個(gè)體平均有 6.1M 個(gè) SNV,其他個(gè)體有 5.3M 個(gè) SNV,結(jié)構(gòu)變異也有類似的模式。在成對(duì)比較中,兩個(gè)約魯巴人對(duì)測(cè)序的單核苷酸變異有 4,897,091 個(gè)成對(duì)差異,比兩個(gè)法國(guó)人或兩個(gè)東亞人高出 38% 以上。LD 在非洲血統(tǒng)中也是最低的,其次是歐洲、亞洲和美國(guó)血統(tǒng)。

人類疾病和特征的遺傳結(jié)構(gòu)

將遺傳變異與表型聯(lián)系起來(lái)并了解其背后的生物學(xué)機(jī)制一直是人類遺傳學(xué)的基本目標(biāo),但實(shí)現(xiàn)這一目標(biāo)的手段在過(guò)去幾十年中發(fā)生了巨大變化。最初的努力集中于對(duì)患有嚴(yán)重或高度家族性疾病的個(gè)體進(jìn)行基因分型,以確定他們共有的致病突變,假設(shè)這些突變具有高度滲透性且數(shù)量很少。與此同時(shí),連鎖研究收集了患病和未患病個(gè)體的家族,并追蹤了病例中過(guò)度表達(dá)的基因片段,有時(shí)暗示了許多基因的大單倍型。隨著基因分型成本的下降,共同性狀的研究轉(zhuǎn)向關(guān)聯(lián)研究,其中對(duì)大量不相關(guān)的病例和對(duì)照進(jìn)行基因分型,并測(cè)試單個(gè)變異與感興趣性狀的相關(guān)性。在候選基因關(guān)聯(lián)研究的初始階段,只對(duì)預(yù)先定義的區(qū)域進(jìn)行基因分型和測(cè)試,導(dǎo)致了相互矛盾的發(fā)現(xiàn),許多人質(zhì)疑常見(jiàn)變異對(duì)常見(jiàn)疾病的貢獻(xiàn)。然而,全基因組關(guān)聯(lián)研究 (GWAS)的理論和實(shí)際應(yīng)用,加上嚴(yán)格的多重檢驗(yàn)校正,開(kāi)始產(chǎn)生可在獨(dú)立研究中重復(fù)的穩(wěn)健關(guān)聯(lián)。即使是這些早期的關(guān)聯(lián)也常常出奇的薄弱,表明常見(jiàn)遺傳變異對(duì)表型的貢獻(xiàn)很小,或者涉及許多變異的高度多基因貢獻(xiàn)。隨著 GWAS 樣本量的增長(zhǎng),常見(jiàn)性狀多基因性的證據(jù)不斷積累,這意味著需要進(jìn)行非常大規(guī)模的研究才能識(shí)別出所有導(dǎo)致疾病的遺傳變異。這促使了大型生物庫(kù)的興起,并推動(dòng)了全基因組顯著關(guān)聯(lián)的數(shù)量達(dá)到數(shù)十萬(wàn),從而能夠高度精確地估計(jì)疾病結(jié)構(gòu):整個(gè)基因組中導(dǎo)致疾病的變異的數(shù)量、頻率、基因組分布和疾病貢獻(xiàn)。

最近,疾病基因解碼又回到了原點(diǎn),大規(guī)模的兄弟姐妹和基于家庭的 GWAS 出現(xiàn)了,這種研究與早期的連鎖研究相似,但規(guī)模更大?;诩彝サ难芯靠梢詫⒓膊〗Y(jié)構(gòu)劃分為所謂的直接影響和間接影響;前者與個(gè)體內(nèi)的變異有關(guān),后者與其親屬共享的變異有關(guān)(可能通過(guò)共享環(huán)境起作用)。雖然這些研究規(guī)模仍然相對(duì)較小,但它們已經(jīng)表明,許多明顯的遺傳關(guān)聯(lián)實(shí)際上與環(huán)境對(duì)特征的影響有關(guān),而不是因果關(guān)系,可能跨越幾代人和社區(qū)。雖然常見(jiàn)特征的研究主要由常見(jiàn)變異的 GWAS 推動(dòng),這得益于廉價(jià)的基因分型陣列,但現(xiàn)在可以通過(guò)大規(guī)模的外顯子組和基因組測(cè)序研究來(lái)量化罕見(jiàn)變異的貢獻(xiàn),這些研究可以捕捉到遺傳變異的全譜。直接遺傳關(guān)聯(lián)研究通常對(duì)罕見(jiàn)變異的效力不足,導(dǎo)致使用負(fù)擔(dān)測(cè)試來(lái)“壓縮”測(cè)試基因中的所有變異。盡管實(shí)現(xiàn)方式和標(biāo)準(zhǔn)不同,但類似的方法通常包括連鎖分析的特征,并應(yīng)用于孟德?tīng)柤膊∵z傳學(xué)。

普遍存在的常見(jiàn)變異遺傳性

在基因分型出現(xiàn)的幾十年前,遺傳因素對(duì)某一性狀的總貢獻(xiàn),即可通過(guò)雙胞胎和基于家庭的研究來(lái)估算。在某些嚴(yán)格的假設(shè)下,同卵雙胞胎和異卵雙胞胎之間或跨家庭關(guān)系中表型相關(guān)性的增強(qiáng)可分解為遺傳和環(huán)境成分。大規(guī)?;蚍中褪沟妙愃频脑砟軌驊?yīng)用于假定無(wú)關(guān)的個(gè)體,通過(guò)對(duì)比遺傳相似性和表型相似性的細(xì)微模式來(lái)估算所謂的基因型、SNP或芯片遺傳性。得到的參數(shù)量化了由所有基因型變異和與它們相關(guān)的任何未分類變異所解釋的表型差異。已經(jīng)設(shè)計(jì)出多種方法來(lái)估計(jì) SNP 遺傳力,要么使用個(gè)體層面的數(shù)據(jù),要么使用多基因評(píng)分,要么僅僅使用匯總層面的數(shù)據(jù),但所有這些方法都集中在一個(gè)普遍的發(fā)現(xiàn)上,那就是大多數(shù)常見(jiàn)性狀都具有顯著的 SNP 遺傳力。例如,在英國(guó)生物庫(kù)中,551 種常見(jiàn)表型在所有疾病和非疾病性狀中的平均 SNP 遺傳力分別為 10.9% 和 15.6% ;在日本生物庫(kù)中,58 種連續(xù)性狀的平均 SNP 遺傳力估計(jì)為 8.6%。事實(shí)上,幾乎每一種常見(jiàn)的生物庫(kù)表型都與遺傳學(xué)有某種相關(guān)性,F(xiàn)innGen 生物庫(kù)中 91% 的性狀表現(xiàn)出至少一種全基因組的顯著關(guān)聯(lián)(對(duì)于病例數(shù) > 10,000 例的性狀)。因此,識(shí)別影響任何共同特征的一些遺傳變異應(yīng)該是預(yù)期而不是例外。

共同性狀的極端多基因性

除 SNP 遺傳力外,推動(dòng)遺傳學(xué)發(fā)現(xiàn)的另一個(gè)關(guān)鍵參數(shù)是性狀多基因性:影響性狀的因果變異總數(shù)及其效應(yīng)大小的分布。高度多基因性狀涉及許多弱因果變異,需要大量樣本才能表征。由于大多數(shù)因果變異仍然未知,因此提出了各種性狀多基因性的量化方法,例如對(duì)性狀的非零效應(yīng)數(shù)量、獨(dú)立變異的有效數(shù)量或解釋給定遺傳力分?jǐn)?shù)的因果變異的最小數(shù)量 。無(wú)論采用何種統(tǒng)計(jì)模型,多基因性一直被估計(jì)為非常高,范圍從某些估計(jì)量的數(shù)千個(gè)因果變異到其他估計(jì)量的數(shù)百萬(wàn)個(gè)變異。這些驚人的估計(jì)值意味著,對(duì)于某些性狀而言,許多因果變異平均通過(guò)基因組中的幾乎每個(gè)基因起作用,并涉及一半以上的常見(jiàn)多態(tài)性??傮w而言,細(xì)胞和色素沉著性狀表現(xiàn)出最低的多基因性(數(shù)百種因果變異),而人體測(cè)量和認(rèn)知/行為性狀表現(xiàn)出一些最高的估計(jì)值(>10,000 種有效變異)。雖然具有相似遺傳力的性狀通常表現(xiàn)出不同程度的多基因性,但不同性狀之間多基因性的差異通常低于預(yù)期,這表明選擇(驅(qū)動(dòng)多基因性的因素之一)可能對(duì)不同性狀具有多效性,而不是對(duì)任何一種測(cè)量的表型起作用。最近,一項(xiàng)對(duì) 540 萬(wàn)參與者身高的 GWAS 研究表明,12,111 個(gè)聯(lián)合顯著變異解釋了 40% 的表型變異(而總的 SNP 遺傳率為 45%),為高性狀多基因性提供了第一個(gè)直接證據(jù)。高多基因性的進(jìn)化原因仍在積極研究中,但其含義很明顯:了解人類特征需要提煉數(shù)萬(wàn)個(gè)變異的功能。

疾病多基因性的功能劃分

與分區(qū) SNP 遺傳力類似,多基因性也可以分區(qū),以量化給定的功能注釋包含的變異對(duì)疾病的影響強(qiáng)還是弱。令人驚訝的是,分區(qū)多基因性的估計(jì)值與分區(qū)遺傳力表現(xiàn)出非常高的相關(guān)性 (r =0.88) 。例如,與其他 SNP 相比,保守區(qū)域中的 SNP 在遺傳力方面富集了 13 倍,在多基因性方面富集了 14 倍,這意味著它們對(duì)遺傳力的過(guò)大貢獻(xiàn)可能部分歸因于因果變異數(shù)量的增加,而不是絕對(duì)效應(yīng)大小的增加。這種模型被稱為遺傳力的“扁平化”,認(rèn)為自然選擇已經(jīng)將功能重要區(qū)域中的因果變異分布(或“扁平化”)為更加多基因的。由于較高的多基因性也會(huì)導(dǎo)致 GWAS 功效下降,因此最顯著的 GWAS 關(guān)聯(lián)(以及在較小規(guī)模 GWAS 研究中發(fā)現(xiàn)的關(guān)聯(lián))可能并不位于功能上最“重要”的區(qū)域。遺傳效應(yīng)的“扁平化”也可能解釋為什么許多復(fù)雜性狀似乎是“全基因的” :由少數(shù)對(duì)性狀有直接影響的“核心”基因控制,而這些基因又受到負(fù)選擇的不成比例的抑制,從而增加了與性狀沒(méi)有直接聯(lián)系的“外圍”基因的相對(duì)貢獻(xiàn)。對(duì)扁平化和全基因模型的一種解釋是,僅從頂級(jí) GWAS 命中中映射“核心”基因可能很困難,因?yàn)檩^大的變異效應(yīng)大小并不涉及最生物學(xué)相關(guān)的基因或藥物靶點(diǎn)。有趣的是,最近的分析表明,無(wú)論效應(yīng)大小、等位基因頻率或 GWAS 年份如何,已批準(zhǔn)的藥物靶基因都富含 GWAS 關(guān)聯(lián)證據(jù)。因此,更大規(guī)模、更強(qiáng)大的 GWAS 可能繼續(xù)為疾病機(jī)制和治療方法提供重要見(jiàn)解,甚至提高相關(guān)性。

罕見(jiàn)變異遺傳性

大型全基因組和全外顯子組測(cè)序研究的出現(xiàn)開(kāi)始使罕見(jiàn)和低頻變異疾病結(jié)構(gòu)的特征描述成為可能。最初,研究依靠參考數(shù)據(jù)的基因型推斷來(lái)探索低頻變異(0.5-5%)的遺傳力。例如,在英國(guó)生物銀行的 40 個(gè)特征中,編碼變異解釋的低頻 SNP 遺傳力(17%,富集 38 倍)比例大于常見(jiàn) SNP 遺傳力(2%,富集 7.7 倍),這與負(fù)選擇將效應(yīng)較大的(通常是編碼)變異保持在較低頻率的作用一致。盡管如此,所有編碼和 UTR 變異(即通過(guò)外顯子組測(cè)序捕獲的變異)仍然只能解釋 26.8% 的低頻 SNP 遺傳力,這表明全基因組測(cè)序?qū)τ谧R(shí)別大多數(shù)低頻效應(yīng)是必要的。

最近,利用來(lái)自 25,465 名無(wú)關(guān)個(gè)體的全基因組測(cè)序數(shù)據(jù)來(lái)估計(jì)總的 SNP 遺傳力,包括罕見(jiàn)變異。這些總遺傳力估計(jì)值為身高 68% 和 BMI 30%,而常見(jiàn)的 SNP 遺傳力分別為 48% 和 24%。因此,與單獨(dú)使用常見(jiàn)變異相比,罕見(jiàn)變異可能會(huì)使解釋性狀方差增加 1.25 到 1.4 倍。身高遺傳力的主要貢獻(xiàn)來(lái)自低 LD 的非常罕見(jiàn)變異,這些變異特別難以從參考圖組中推斷出來(lái)。盡管這是一項(xiàng)根本性的進(jìn)步,但該研究也有局限性:使用復(fù)雜的遺傳力劃分來(lái)解釋等位基因頻率和 LD 偏差,以及使用傳統(tǒng)的常見(jiàn)變異方法來(lái)解釋種群結(jié)構(gòu)(這可能不適用于罕見(jiàn)變異)。更多的數(shù)據(jù)、更多的性狀和新穎的方法將繼續(xù)闡明全基因組遺傳力的問(wèn)題。有趣的是,這兩個(gè)估值都明顯低于先前雙胞胎研究的估值,這意味著雙胞胎隊(duì)列分析中存在額外的未分類的遺傳變異(例如,由于結(jié)構(gòu)變異)或系統(tǒng)偏差。

新興方法(如負(fù)擔(dān)遺傳力回歸)已將全基因組分區(qū)遺傳力的估計(jì)擴(kuò)展到罕見(jiàn)變異。假設(shè)稀有等位基因可能在基因內(nèi)具有一致的效應(yīng),該方法量化了可通過(guò)所有基因的基因負(fù)擔(dān)來(lái)解釋的性狀的總變異。當(dāng)應(yīng)用于英國(guó)生物銀行中 22 種常見(jiàn)性狀的 690 萬(wàn)個(gè)編碼變異時(shí),平均負(fù)擔(dān)遺傳力估計(jì)為 1.3%(對(duì)于功能喪失和頻率低于 0.001 的錯(cuò)義變異)并且對(duì)于每種性狀均顯著非零。值得注意的是,在同一隊(duì)列的獨(dú)立分析中單獨(dú)顯著的基因通常可以解釋很大一部分負(fù)擔(dān)遺傳力:例如,僅APOB就解釋了 LDL 膽固醇 39% 的負(fù)擔(dān)遺傳力,172 種已知的腫瘤抑制基因解釋了復(fù)合癌癥表型 48% 的負(fù)擔(dān)遺傳力。如果準(zhǔn)確的話,這些估計(jì)值將意味著罕見(jiàn)變異特征結(jié)構(gòu)的多基因性遠(yuǎn)低于常見(jiàn)變異中經(jīng)常觀察到的極端多基因性。佳學(xué)基因解碼提醒,罕見(jiàn)變異疾病結(jié)構(gòu)的表征仍處于起步階段,需要更大的隊(duì)列來(lái)理解這些參數(shù)并超越相對(duì)簡(jiǎn)單的負(fù)擔(dān)模型。

目前已經(jīng)開(kāi)展了幾項(xiàng)大規(guī)模全外顯子組關(guān)聯(lián)研究,并發(fā)現(xiàn)了新的罕見(jiàn)變異關(guān)聯(lián)。對(duì)英國(guó)生物銀行中約 450,000 名個(gè)體的外顯子組測(cè)序數(shù)據(jù)進(jìn)行了約 4,000 種性狀的關(guān)聯(lián)測(cè)試,在 564 個(gè)基因中鑒定出 8,865 個(gè)顯著關(guān)聯(lián)。研究觀察到了對(duì)疾病結(jié)構(gòu)的多重洞察。首先,罕見(jiàn)編碼關(guān)聯(lián)在常見(jiàn) GWAS 基因座附近顯著富集,距離 GWAS 關(guān)聯(lián)最近的基因富集率為 59.3 倍,而距離 GWAS 關(guān)聯(lián)一兆堿基范圍內(nèi)的基因富集率降低至 11.4 倍。這些發(fā)現(xiàn)表明,罕見(jiàn)變異和常見(jiàn)變異對(duì)常見(jiàn)疾病的影響呈現(xiàn)出驚人的趨同。其次,F(xiàn)DA 批準(zhǔn)的藥物靶標(biāo)基因表現(xiàn)出關(guān)聯(lián)的可能性高出 3.6 倍,這與之前的發(fā)現(xiàn)一致,即具有人類遺傳學(xué)證據(jù)的藥物靶標(biāo)更有可能獲得批準(zhǔn)。第三,77% 的關(guān)聯(lián)只能使用負(fù)擔(dān)分析來(lái)識(shí)別,而無(wú)法使用單一變異關(guān)聯(lián),強(qiáng)調(diào)負(fù)擔(dān)遺傳性是這一樣本量發(fā)現(xiàn)的主要驅(qū)動(dòng)力。第四,雖然降低疾病的關(guān)聯(lián)可能是最具吸引力的藥物靶點(diǎn),但僅發(fā)現(xiàn)了五個(gè)這樣的關(guān)聯(lián),并且都是之前已知的,表明在未確定的隊(duì)列中檢測(cè)保護(hù)作用的能力較低。雖然大多數(shù)罕見(jiàn)變異關(guān)聯(lián)都是有害的,但一項(xiàng)針對(duì) n=749,459 人吸煙行為的外顯子組研究是迄今為止規(guī)模最大的研究之一,該研究發(fā)現(xiàn)了CHRNB2中的罕見(jiàn)變異與重度吸煙的幾率降低 35% 相關(guān)。這一發(fā)現(xiàn)凸顯了發(fā)現(xiàn)治療常見(jiàn)表型的新手段的機(jī)會(huì)越來(lái)越多。

跨祖先遺傳結(jié)構(gòu)

雖然上述分析大多集中于假定同質(zhì)群體的遺傳結(jié)構(gòu),但在理解不同群體的遺傳結(jié)構(gòu)方面正在取得進(jìn)展。理論和數(shù)據(jù)驅(qū)動(dòng)的研究表明,即使?jié)撛诘囊蚬儺愂枪蚕淼?,多基因評(píng)分中的個(gè)體變異關(guān)聯(lián)和關(guān)聯(lián)集合很可能很難轉(zhuǎn)化為遺傳距離較遠(yuǎn)的群體 。這種缺乏可轉(zhuǎn)移性可能是由因果變異等位基因頻率、非因果變異的連鎖不平衡 (LD) 模式以及真正的潛在效應(yīng)(例如,受基因-基因或基因-環(huán)境相互作用的調(diào)節(jié))等多種差異造成的。最近,在一個(gè)大型混合生物庫(kù)中,涉及 84 種性狀的遺傳距離和多基因風(fēng)險(xiǎn)評(píng)分預(yù)測(cè)準(zhǔn)確度之間存在驚人的線性關(guān)系(遺傳距離和準(zhǔn)確度之間的平均 Pearson 相關(guān)性為 -0.95)。重要的是,雖然平均風(fēng)險(xiǎn)分?jǐn)?shù)值也與遺傳距離顯著相關(guān),但相關(guān)性的強(qiáng)度和方向在不同性狀和人群中差異很大,凸顯了校正跨祖先分值估計(jì)值的挑戰(zhàn)。除了證明缺乏可移植性之外,頻率、LD 和效應(yīng)大小的貢獻(xiàn)現(xiàn)在也正在量化。最近一項(xiàng)針對(duì)混血個(gè)體的研究使用當(dāng)?shù)匮y(tǒng)來(lái)量化非洲和歐洲血統(tǒng)片段之間因果效應(yīng)大小的相關(guān)性。該估計(jì)值非常高,在 38 種性狀和三個(gè)非常不同的生物庫(kù)中,平均因果效應(yīng)大小相關(guān)性為 0.95+/-0.02。這種高度的遺傳相關(guān)性也與之前的研究一致,表明多基因評(píng)分可移植性差可能主要由人群間頻率和 LD 差異來(lái)解釋,而不是不同的因果變異。有趣的是,在同一研究中對(duì)來(lái)自不同種群的非混合個(gè)體進(jìn)行估計(jì)時(shí),遺傳相關(guān)性明顯較低(0.50+/-0.07),先前的研究也顯示跨祖先相關(guān)性范圍從 0.46 到 0.85,通常遠(yuǎn)低于 1.0,鑒于現(xiàn)有多祖先隊(duì)列的缺乏,這些發(fā)現(xiàn)和懸而未決的問(wèn)題進(jìn)一步強(qiáng)調(diào)了設(shè)計(jì)關(guān)聯(lián)研究以最大限度地提高群體水平和個(gè)體水平遺傳多樣性的重要性。事實(shí)上,大型多祖先生物庫(kù)已經(jīng)展示出增強(qiáng)的識(shí)別和細(xì)化因果變異的能力。

多種方法正在涌現(xiàn),以最大限度地提高跨種群和祖先的遺傳數(shù)據(jù)的效用。許多研究表明,通過(guò)整合功能注釋,可以改善多基因預(yù)測(cè)和變異精細(xì)定位。值得注意的是,多基因預(yù)測(cè)準(zhǔn)確度增益中的跨祖先準(zhǔn)確度通常比種群內(nèi)增益高得多,這表明更好地識(shí)別因果變異可以減輕由于種群間頻率或 LD 差異而導(dǎo)致的一些異質(zhì)性。此外,可以通過(guò)將(可能異質(zhì)的)變異級(jí)效應(yīng)聚合到基因等集合中,然后將這些集合的效應(yīng)跨種群結(jié)合起來(lái),來(lái)提高功效。原則上,此類變異集可以在各種生物尺度(基因、途徑)上聚合,其效應(yīng)通過(guò)生物網(wǎng)絡(luò)進(jìn)一步傳播。這些方法強(qiáng)調(diào)了如何將對(duì)跨性狀和種群的因果生物網(wǎng)絡(luò)的更深入理解重新納入多祖先分析,以進(jìn)一步提高功效。

人類群體遺傳學(xué)與統(tǒng)計(jì)遺傳學(xué)交叉領(lǐng)域的機(jī)遇

正如人類基因組計(jì)劃從一開(kāi)始就概述的那樣,人類基因組學(xué)研究的動(dòng)機(jī)是了解人類疾病和復(fù)雜性狀的遺傳基礎(chǔ)。展望未來(lái),此類研究必須借鑒來(lái)自人類物種多樣性的群體遺傳模型和數(shù)據(jù)。佳學(xué)基因檢測(cè)概述了統(tǒng)計(jì)和群體遺傳學(xué)交叉領(lǐng)域的一系列研究機(jī)會(huì)。

如上所述,遺傳關(guān)聯(lián)和多基因評(píng)分的跨祖先可轉(zhuǎn)移性仍然是該領(lǐng)域的一個(gè)關(guān)鍵挑戰(zhàn),而許多非歐洲血統(tǒng)缺乏可靠的數(shù)據(jù)集,這加劇了這一挑戰(zhàn)。雖然對(duì)混合人群的初步研究表明,因果效應(yīng)大小可能在人群中大致相同,但基因-基因和基因-環(huán)境相互作用的全部范圍,以及它們的種群或性狀特異性,仍有待量化。了解這些參數(shù)將進(jìn)一步為在整個(gè)人類多樣性范圍內(nèi)設(shè)計(jì)準(zhǔn)確的預(yù)測(cè)分?jǐn)?shù)提供參考。需要群體遺傳摘要和祖先模型來(lái)提高關(guān)聯(lián)結(jié)果的可轉(zhuǎn)移性,特別是對(duì)于混合血統(tǒng)的個(gè)體,本地祖先感知分?jǐn)?shù)構(gòu)建可能會(huì)提高預(yù)測(cè)準(zhǔn)確性。多項(xiàng)研究表明,增加遺傳多樣性可提高統(tǒng)計(jì)精細(xì)作圖的分辨率,從而提高多基因評(píng)分的準(zhǔn)確性。因此,來(lái)自代表性不足的個(gè)體的數(shù)據(jù)的多樣性將為所有個(gè)體帶來(lái)直接利益。

此外,環(huán)境異質(zhì)性遍及人類遺傳學(xué)研究,混淆了我們對(duì)人類疾病和復(fù)雜性狀的遺傳基礎(chǔ)的理解,導(dǎo)致僅根據(jù)遺傳數(shù)據(jù)無(wú)法準(zhǔn)確預(yù)測(cè)性狀。選擇性交配和血緣關(guān)系模型強(qiáng)調(diào),違反隨機(jī)交配和平衡種群動(dòng)態(tài)的標(biāo)準(zhǔn)群體遺傳學(xué)假設(shè)會(huì)夸大人類性狀之間觀察到的相關(guān)性。最近的聚類和對(duì)比學(xué)習(xí)方法強(qiáng)調(diào)了影響下游遺傳效應(yīng)估計(jì)的混雜因素。雖然基于家庭的研究可以估計(jì)遺傳變異對(duì)某一性狀的直接和間接影響,但基于家庭的直接影響估計(jì)可能會(huì)受到遺傳混雜因素的影響,而使用全基因組關(guān)聯(lián)結(jié)果估計(jì)易感性時(shí),這種影響會(huì)加劇。生物庫(kù)的規(guī)模、元數(shù)據(jù)和環(huán)境協(xié)變量的日益詳細(xì)以及縱向跟蹤工作的開(kāi)展將使人們更加了解環(huán)境混雜因素并更好地控制這些因素,同時(shí)允許利用遠(yuǎn)親來(lái)估計(jì)遺傳效應(yīng)并了解近期的人口遺傳過(guò)程,例如譜系崩塌。對(duì)人際關(guān)系、環(huán)境相關(guān)性和相互作用的復(fù)雜性進(jìn)行建模將提高遺傳發(fā)現(xiàn)的因果有效性和普遍性。

為了在風(fēng)險(xiǎn)預(yù)測(cè)和遺傳研究中確定性狀的優(yōu)先次序,復(fù)雜性狀結(jié)構(gòu)的進(jìn)化模型是關(guān)鍵。最近關(guān)于穩(wěn)定選擇的研究表明,許多經(jīng)過(guò)充分研究的復(fù)雜數(shù)量性狀的性狀結(jié)構(gòu)在多基因性方面相似,并且這種選擇模式可能導(dǎo)致關(guān)聯(lián)結(jié)果在種群間轉(zhuǎn)移性降低。此外,對(duì)適應(yīng)度影響較小的性狀產(chǎn)生的可轉(zhuǎn)移關(guān)聯(lián)較少,而弱負(fù)選擇會(huì)產(chǎn)生更多種群特異性的性狀結(jié)構(gòu)。量化多基因選擇和適應(yīng)對(duì)復(fù)雜性狀的程度仍然是一個(gè)巨大的挑戰(zhàn),部分原因是解開(kāi)細(xì)微的種群分層的復(fù)雜性。檢測(cè)精細(xì)種群結(jié)構(gòu)的改進(jìn)方法、更大規(guī)模的家庭內(nèi)分析和全面的選擇模型將使我們能夠更全面地了解全基因組的進(jìn)化過(guò)程。除了解答人類進(jìn)化的基本問(wèn)題之外,這些發(fā)現(xiàn)還具有實(shí)際意義:如何從數(shù)千個(gè)與性狀相關(guān)的基因座中挖掘出與疾病最相關(guān)的基因和藥物靶點(diǎn),以及如何整合罕見(jiàn)和常見(jiàn)變異的發(fā)現(xiàn)。

除了了解已知關(guān)聯(lián)的機(jī)制之外,還有許多機(jī)會(huì)整合新的或難以收集的變異。大型生物庫(kù)強(qiáng)調(diào)了結(jié)構(gòu)變異的重要作用,包括拷貝數(shù)變異和串聯(lián)重復(fù),它們對(duì)迄今為止發(fā)現(xiàn)的性狀的影響大小最大 。結(jié)構(gòu)變異通常不直接進(jìn)行基因分型,也常常不被推斷,這使得我們對(duì)單一變異以外的疾病機(jī)制的認(rèn)識(shí)存在空白。直接從數(shù)據(jù)中識(shí)別復(fù)雜結(jié)構(gòu)變化的方法,以及基因組組裝的改進(jìn),可能會(huì)揭示全新類別的疾病相關(guān)變異。同樣,雖然加性變異和顯性變異的作用已通過(guò)大規(guī)模生物庫(kù)和遺傳力分析得到很好的表征,但上位效應(yīng)的影響在很大程度上仍然是個(gè)謎。雖然遺傳相互作用和熱點(diǎn)在模型生物中廣泛存在,但由于搜索空間的廣度和統(tǒng)計(jì)限制,它們?cè)谌祟愔械谋碚饕恢本哂刑魬?zhàn)性。對(duì)于比簡(jiǎn)單的成對(duì)相互作用更復(fù)雜的關(guān)系尤其如此,在人類群體中甚至不可能列舉這些關(guān)系。群體遺傳建模和功能研究的整合可能會(huì)突破統(tǒng)計(jì)限制,并將我們對(duì)特征效應(yīng)的理解擴(kuò)展到更高層次。

繼續(xù)研究群體遺傳學(xué)和統(tǒng)計(jì)遺傳學(xué)之間的關(guān)系,以及提高使用基于家庭和系譜的方法研究生物庫(kù)中的特征的能力,將有助于改進(jìn)變異發(fā)現(xiàn)和風(fēng)險(xiǎn)預(yù)測(cè),同時(shí)識(shí)別出具有較大環(huán)境影響的特征,對(duì)于這些特征,需要額外的研究、數(shù)據(jù)和方法進(jìn)行風(fēng)險(xiǎn)評(píng)估、治療和預(yù)防。

 

基因變異的分子和細(xì)胞效應(yīng)

影響復(fù)雜生理特征和疾病的遺傳變異必然對(duì)分子功能產(chǎn)生近端效應(yīng),進(jìn)而影響隨后的細(xì)胞水平分子過(guò)程。揭示這些遺傳關(guān)聯(lián)的分子和細(xì)胞介質(zhì)已成為當(dāng)代人類遺傳學(xué)的中心焦點(diǎn),因?yàn)樗梢詾閺姆肿訉用胬斫饧膊〉囊蚬^(guò)程提供見(jiàn)解。這一點(diǎn)的意義超出了基礎(chǔ)生物學(xué)的范圍,因?yàn)檫@些過(guò)程是潛在的干預(yù)目標(biāo) (圖1c )。此外,雖然變異的許多分子效應(yīng)對(duì)生理表型沒(méi)有影響(圖 2),但它們代表了基因組序列變異的自然實(shí)驗(yàn),有助于理解基因組功能的生物學(xué)。

 

遺傳對(duì)不同層次功能的影響的說(shuō)明

圖 2. 遺傳對(duì)不同層次功能的影響的說(shuō)明。有大量變異影響基因組和細(xì)胞的分子功能,其中許多變異對(duì)下游沒(méi)有影響或影響較小。影響生理、解剖和疾病特征的變異可以直接受到自然選擇。紫色圖表示成功發(fā)現(xiàn)分子特征的遺傳關(guān)聯(lián)(由 molQTL 映射捕獲)以及生理和疾病特征的遺傳關(guān)聯(lián)(由經(jīng)典 GWAS 捕獲),但我們對(duì)細(xì)胞和組織水平特征的遺傳關(guān)聯(lián)的了解存在差距。

分析遺傳變異功能效應(yīng)的方法

盡管變異的分子效應(yīng)分析自誕生之日起就成為分子遺傳學(xué)的一部分,但直到 21 世紀(jì) DNA 雜交陣列技術(shù)出現(xiàn)后,全基因組分析才成為可能。這項(xiàng)技術(shù)進(jìn)步導(dǎo)致了表達(dá)數(shù)量性狀基因座 (eQTL) 作圖,以識(shí)別與基因表達(dá)水平相關(guān)的變異,這種方法大約 15 年前首次應(yīng)用于人類(圖 3a)。從那時(shí)起,這種方法已經(jīng)發(fā)展到涵蓋從表觀基因組測(cè)量到剪接和蛋白質(zhì)水平的分子表型,統(tǒng)稱為分子 QTL (molQTL)。大型項(xiàng)目已經(jīng)為各種組織和細(xì)胞構(gòu)建了 molQTL 資源,包括在體外刺激下,單細(xì)胞技術(shù)的使用也越來(lái)越多。迄今為止,大多數(shù)穩(wěn)健鑒定的 molQTL 都是順式的,即通過(guò)順式調(diào)控機(jī)制影響附近的靶基因,因?yàn)橹挥型ㄟ^(guò)大樣本量和仔細(xì)控制混雜因素,才能可靠地鑒定基因組中變體和基因之間的反式QTL。

 

圖 3.理解大規(guī)模遺傳變異的分子效應(yīng)的方法

 

圖 3. 理解大規(guī)模遺傳變異的分子效應(yīng)的方法。a) 分子 QTL (molQTL) 映射,b) 基因組的人工擾動(dòng),c) 從多層功能組學(xué)數(shù)據(jù)進(jìn)行推斷。

在體外細(xì)胞系統(tǒng)中進(jìn)行的實(shí)驗(yàn)性基因組擾動(dòng)已迅速成為可擴(kuò)展地映射遺傳變異分子效應(yīng)的流行工具(圖 3b)。這些方法包括 MPRA(大規(guī)模并行報(bào)告基因檢測(cè))等染色體外檢測(cè)和使用 CRISPR 工具包的基因組擾動(dòng),以及對(duì)分子效應(yīng)的各種讀數(shù)。正在進(jìn)行的研究如 IGVF(基因組變異對(duì)功能的影響)和 AVE(變異效應(yīng)圖譜),旨在更系統(tǒng)地將這些工具應(yīng)用于非編碼和編碼變異。大多數(shù)這些方法的一個(gè)關(guān)鍵先決條件是高質(zhì)量精細(xì)映射以針對(duì)相關(guān)基因座上的可能致病變異,因此 GWAS 社區(qū)不斷改進(jìn)的方法和資源將極大地增強(qiáng)這些實(shí)驗(yàn)工作。

此外,來(lái)自 ENCODE 等項(xiàng)目的大量功能基因組學(xué)數(shù)據(jù)集為預(yù)測(cè)推斷遺傳變異效應(yīng)提供了強(qiáng)有力的基礎(chǔ),即使沒(méi)有直接分析基因組變異(圖 3c)。這些方法的開(kāi)發(fā)是一個(gè)非常活躍的研究領(lǐng)域,特別是在預(yù)測(cè)編碼和剪接影響變異的影響方面取得了進(jìn)展,而預(yù)測(cè)轉(zhuǎn)錄調(diào)控變異的影響已被證明具有挑戰(zhàn)性。

復(fù)雜性狀基因座的分子結(jié)構(gòu)

遺傳變異可能通過(guò)數(shù)十種不同的分子機(jī)制影響生物體表型。在這些機(jī)制中,最容易解釋的可能是編碼變異,它直接影響蛋白質(zhì)編碼序列和功能。然而,與早期孟德?tīng)栠z傳病變異圖譜發(fā)現(xiàn)致病 SNP 幾乎總是影響編碼序列不同,GWAS 很早就揭示了復(fù)雜性狀關(guān)聯(lián)背后的遺傳變異通常是非編碼的,并且會(huì)影響基因表達(dá)。這些發(fā)現(xiàn)激發(fā)了人們對(duì)了解遺傳變異如何影響基因調(diào)控,特別是如何影響基因表達(dá)水平的興趣。

在過(guò)去十年中,已開(kāi)發(fā)出多種統(tǒng)計(jì)方法并將其應(yīng)用于不同的數(shù)據(jù)集,以識(shí)別 GWAS 基因座的功能富集。迄今為止所鑒定的最引人注目的 GWAS 功能富集位于染色質(zhì)可及性高的區(qū)域或與增強(qiáng)子和啟動(dòng)子相關(guān)的組蛋白修飾區(qū)域。事實(shí)上,多種常見(jiàn)性狀的大部分 SNP 遺傳力可以定位到調(diào)控區(qū)域而非編碼區(qū)域,據(jù)估計(jì),在 11 種疾病中,高達(dá) 79% 的 SNP 遺傳力位于 DNAse I 超敏位點(diǎn)(涵蓋 16% 的變異,富集 4.9 倍),或在 17 種常見(jiàn)性狀中,15% 的 SNP 遺傳力位于增強(qiáng)子元素中(涵蓋 0.4% 的變異,富集 37.5 倍)。此外,哺乳動(dòng)物中保守的區(qū)域估計(jì)包含 35% 的 SNP 遺傳力(涵蓋 2.6% 的變異,富集率 9.6 倍),這與進(jìn)化受限元素在塑造疾病結(jié)構(gòu)中的預(yù)期作用一致。

據(jù)報(bào)道,GWAS 位點(diǎn)在與多種類型的調(diào)控變異相關(guān)的變異中也富集。正如預(yù)期的那樣,這些變異包括影響基因表達(dá)水平調(diào)控的遺傳變異,例如通過(guò)影響 DNA 甲基化、組蛋白修飾水平和染色質(zhì)可及性。 eQTL 精細(xì)定位的 SNP 中性狀遺傳力的富集與增強(qiáng)子區(qū)域中的性狀遺傳力的富集相似(非特異性 eQTL/增強(qiáng)子約為 5 倍,在性狀相關(guān)細(xì)胞類型中特異性識(shí)別的 eQTL 或增強(qiáng)子約為 20 倍。然而,估計(jì)由重疊 eQTL SNP 的常見(jiàn)變異解釋的總體性狀遺傳力(通過(guò)中介或富集分析估計(jì)的性狀平均分別為 11%或 14%)往往比重疊增強(qiáng)子和啟動(dòng)子區(qū)域的遺傳力(23.9-79.2%)小得多。盡管 11-14% 和 80% 的估計(jì)值可能分別代表由增強(qiáng)子或啟動(dòng)子中的 eQTL 和變異解釋的遺傳力的保守和樂(lè)觀估計(jì),但這些觀察結(jié)果表明我們的 eQTL 圖譜的質(zhì)量遠(yuǎn)遠(yuǎn)落后于增強(qiáng)子和啟動(dòng)子區(qū)域,并且需要開(kāi)展更多研究來(lái)了解調(diào)控變異如何影響基因表達(dá)。

除了影響基因表達(dá)水平的變異之外,GWAS 基因座還在許多其他類型的分子 QTL 中富集,例如影響 mRNA 剪接的QTL和對(duì)轉(zhuǎn)錄本結(jié)構(gòu)和轉(zhuǎn)錄后修飾有其他影響的QTL。這些分子 QTL 中 GWAS 信號(hào)的估計(jì)富集程度變化很大,可能與性狀有關(guān)。例如,幾項(xiàng)研究報(bào)告稱,影響 RNA 剪接的變異 (sQTL) 中神經(jīng)精神 GWAS 基因座的富集程度高于 eQTL;最近的一項(xiàng)研究發(fā)現(xiàn),RNA 編輯 QTL 中自身免疫 GWAS 信號(hào)的富集程度高于 eQTL 和 sQTL 。迄今為止,不同轉(zhuǎn)錄后 molQTL 解釋的總體遺傳力與增強(qiáng)子和啟動(dòng)子區(qū)域內(nèi)的 eQTL 或變異所解釋的遺傳力相比相形見(jiàn)絀。不過(guò),這可能僅僅反映了這樣一個(gè)事實(shí):與其他調(diào)控機(jī)制相比,eQTL 和增強(qiáng)子已經(jīng)在更大規(guī)模和更廣泛的細(xì)胞類型中得到了研究。

除了功能富集表明GWAS 基因座直接分子驅(qū)動(dòng)因素的順式調(diào)控機(jī)制外,GWAS 還提供了獨(dú)特的因果關(guān)系錨點(diǎn),用于識(shí)別導(dǎo)致性狀的因果分子過(guò)程發(fā)生的細(xì)胞類型和細(xì)胞狀態(tài)。了解這些細(xì)胞類型的特異性可以為疾病生物學(xué)以及最大限度減少脫靶副作用的干預(yù)措施的潛在目標(biāo)提供信息。對(duì)于大多數(shù)復(fù)雜的性狀,從臨床特征推斷因果細(xì)胞類型并非易事,因?yàn)榧膊〉陌Y狀可以精確定位不同的組織、細(xì)胞類型或發(fā)育階段,而不是導(dǎo)致疾病的過(guò)程發(fā)生的位置。應(yīng)對(duì)這一挑戰(zhàn)最有效的方法是分析在特定組織和細(xì)胞類型中活躍的基因和調(diào)控元件的 GWAS 遺傳力富集(例如,值得注意的是,一個(gè)主要發(fā)現(xiàn)是增強(qiáng)子/啟動(dòng)子區(qū)域中 GWAS 基因座的富集在直觀的細(xì)胞類型或組織類型中最高。例如,自身免疫性疾病基因座最富集于在免疫細(xì)胞類型(例如 T 細(xì)胞和 B 細(xì)胞)中活躍的增強(qiáng)子,而神經(jīng)精神疾病基因座最富集于神經(jīng)元細(xì)胞類型。盡管如此,這些富集通常只能讓我們粗略地了解哪些細(xì)胞類型會(huì)導(dǎo)致某種特征或疾病,還需要進(jìn)行更多研究來(lái)確定遺傳信號(hào)是否足夠強(qiáng)以識(shí)別更精確的致病細(xì)胞類型。事實(shí)上,之前的研究觀察到,盡管具有細(xì)胞類型特異性活動(dòng)模式的基因或增強(qiáng)子在性狀遺傳性方面高度富集,但大部分遺傳性存在于在許多或大多數(shù)細(xì)胞類型中廣泛活躍的基因或增強(qiáng)子中。這些觀察結(jié)果表明,大多數(shù)遺傳信號(hào)將存在于具有廣泛活性而非細(xì)胞類型特異性活性的增強(qiáng)子中。因此,功能增強(qiáng)子的多效性可能會(huì)限制我們使用遺傳信號(hào)“精細(xì)定位”致病細(xì)胞類型的能力。

使用 molQTL 解釋復(fù)雜性狀基因座

MolQTL 定位從根本上來(lái)說(shuō)是一種遺傳方法,而圖 3中展示的其他方法則植根于分子生物學(xué)和計(jì)算生物學(xué)。因此,佳學(xué)基因解碼在下文中更詳細(xì)地討論 molQTL 定位。

2010 年代初,人們使用了直接分析(重疊顯著的 GWAS 和 eQTL SNP)來(lái)識(shí)別與性狀相關(guān)的變異,這些變異也會(huì)對(duì)基因表達(dá)水平產(chǎn)生功能性影響,從而有助于識(shí)別潛在的致病基因。然而,隨著 GWAS 和 eQTL 信號(hào)數(shù)量的增加,顯然需要新的統(tǒng)計(jì)方法,特別是為了解決由于 LD ,大量變異與某些分子表型相關(guān)的情況。因此,開(kāi)發(fā)了幾種先進(jìn)的統(tǒng)計(jì)方法來(lái)評(píng)估共定位:相同的變異是否可能是特定基因位點(diǎn)上 GWAS 信號(hào)和 molQTL 信號(hào)的因果驅(qū)動(dòng)因素。另一種方法是估計(jì)“分子關(guān)聯(lián)”,例如轉(zhuǎn)錄組范圍關(guān)聯(lián)研究 (TWAS),它測(cè)試預(yù)測(cè)的分子表型(例如表達(dá))與性狀之間的關(guān)聯(lián),并且同樣可以應(yīng)用于匯總級(jí)別數(shù)據(jù)。這種方法放寬了共定位的要求,即分子和疾病性狀之間共享因果變異 - 它們只需要相關(guān) - 同時(shí)通過(guò)使用多變量預(yù)測(cè)模型來(lái)提高靈敏度。雖然這兩種方法都不能保證特定基因的表達(dá)與疾病病因有因果關(guān)系,但共定位消除了由于 LD 導(dǎo)致的虛假重疊,而分子關(guān)聯(lián)能夠?qū)ο嚓P(guān)效應(yīng)和方向進(jìn)行敏感的量化。

使用這些方法可以得到一個(gè)顯著的觀察結(jié)果,即與 eQTL共定位或可通過(guò)分子關(guān)聯(lián)解釋的 GWAS 基因座比例很低。即使對(duì)于許多免疫或血液相關(guān)性狀,這種情況也很明顯,在這些性狀中,來(lái)自相關(guān)細(xì)胞類型的可用 eQTL 數(shù)據(jù)被認(rèn)為是全面的。例如,只有大約 25% 的自身免疫性狀 GWAS 基因座與來(lái)自不同免疫細(xì)胞類型的 eQTL 共定位。添加其他分子 QTL(如剪接 QTL)可以提高共定位率,但仍然會(huì)使大多數(shù)自身免疫相關(guān)基因座不共定位。更普遍地說(shuō),在復(fù)雜性狀中,順式 eQTL 介導(dǎo)的遺傳效應(yīng)平均只占性狀遺傳率的 11%。另一個(gè)復(fù)雜因素是,調(diào)控元件和變異可調(diào)節(jié)多個(gè)基因,而共定位 eQTL 所拾取的基因并不一定是該基因座中真正導(dǎo)致疾病的基因。有幾個(gè)原因可以解釋 GWAS 共定位率相對(duì)較低。首先,影響基因調(diào)控的遺傳變異(獨(dú)立于基因表達(dá)水平)可能發(fā)揮比我們之前預(yù)期的更大的作用。雖然大多數(shù)研究集中在遺傳變異如何調(diào)節(jié)基因表達(dá)水平,但正如之前所討論的,遺傳變異可以通過(guò)各種其他調(diào)控機(jī)制影響細(xì)胞生物學(xué)。盡管如此,由于 GWAS 和表達(dá) QTL 之間的共定位率在幾乎所有復(fù)雜性狀和所有 molQTL 中都是最高的,因此普遍的觀點(diǎn)是大多數(shù)性狀變異通過(guò)影響蛋白質(zhì)表達(dá)水平來(lái)發(fā)揮作用。為了支持這一觀點(diǎn),最近的幾項(xiàng)研究發(fā)現(xiàn),影響染色質(zhì)活性(組蛋白標(biāo)記 QTL 或 hQTL)或可及性(染色質(zhì)可及性 QTL 或 caQTL)的遺傳變異的共定位率比來(lái)自相同細(xì)胞或組織類型的 eQTL 高得多(有時(shí)高出約 50%)。這些觀察結(jié)果表明,與性狀相關(guān)的變異通常通過(guò)調(diào)節(jié)增強(qiáng)子或啟動(dòng)子活性來(lái)調(diào)節(jié)基因表達(dá)水平。然而,統(tǒng)計(jì)上檢測(cè)它們對(duì)基因表達(dá)的影響的能力可能弱于對(duì)染色質(zhì)水平表型的影響。這與增強(qiáng)子活性具有比基因表達(dá)水平更簡(jiǎn)單遺傳結(jié)構(gòu)的想法相一致,因?yàn)榉€(wěn)態(tài) mRNA 表達(dá)水平除了影響轉(zhuǎn)錄起始的機(jī)制外,還受到轉(zhuǎn)錄前和轉(zhuǎn)錄后 mRNA 加工機(jī)制的影響。與 eQTL 相比,染色質(zhì) QTL 共定位率更高的另一個(gè)解釋是發(fā)現(xiàn)閾值的差異:要檢測(cè)到染色質(zhì) QTL,增強(qiáng)子必須在給定的細(xì)胞或組織類型中活躍,而對(duì)于同一變體而言,增強(qiáng)子必須既具有活性又能驅(qū)動(dòng)基因轉(zhuǎn)錄,才能成為 eQTL。例如,已發(fā)現(xiàn)“啟動(dòng)”增強(qiáng)子在多種類型的幼稚免疫細(xì)胞中含有 caQTL,但它們似乎僅在受細(xì)胞因子或病原體刺激的細(xì)胞中才是 eQTL。

已經(jīng)提出了幾種理論來(lái)解釋分子 QTL 和 GWAS 匹配結(jié)果之間有限的重疊。與復(fù)雜性狀有關(guān)的基因可能具有冗余增強(qiáng)子,這些增強(qiáng)子可以緩沖遺傳變異對(duì)基因表達(dá)水平的影響,從而使與復(fù)雜性狀相關(guān)的 eQTL 更難識(shí)別。類似地,eQTL 定位的特征可能有利于發(fā)現(xiàn)選擇性約束、調(diào)控復(fù)雜性和功能重要性較低的位點(diǎn)和基因,從而使結(jié)果偏離識(shí)別性狀變異基因。另一種可能的解釋是,對(duì)于大多數(shù)性狀,我們尚未研究與疾病最相關(guān)的細(xì)胞類型或細(xì)胞狀態(tài)中的基因表達(dá)。事實(shí)上,盡管分子 QTL 在組織間存在大量共享,但許多依賴于細(xì)胞狀態(tài)時(shí)間背景的動(dòng)態(tài) QTL 可能只能在一些尚未研究的稀有細(xì)胞類型或發(fā)育軌跡中識(shí)別。

悲觀的解釋可能是,eQTL 研究在解釋復(fù)雜性狀相關(guān)變異方面的價(jià)值目前和未來(lái)都將保持適中。然而,我們應(yīng)該記住,早期從樣本量有限的 GWAS 中發(fā)現(xiàn)的成果也很有限。隨著 GWAS 樣本量增長(zhǎng)到數(shù)萬(wàn)甚至數(shù)十萬(wàn),變革性見(jiàn)解應(yīng)運(yùn)而生,其中許多見(jiàn)解現(xiàn)在塑造了我們對(duì)人類性狀和生物學(xué)的理解。molQTL 研究的樣本量尚未擴(kuò)大到數(shù)十萬(wàn),最大的研究來(lái)自大量組織樣本,這限制了檢測(cè)可能在特定細(xì)胞類型和細(xì)胞狀態(tài)下起作用并導(dǎo)致疾病的調(diào)控效應(yīng)的能力、分辨率和可解釋性。雖然覆蓋所有相關(guān)細(xì)胞類型的更大、特定于上下文的 molQTL 圖譜不太可能為 GWAS 基因座的分子解釋提供單一完整的解決方案,但它仍然是唯一允許詢問(wèn)不同原代細(xì)胞類型中遺傳變異效應(yīng)的方法。因此,我們預(yù)見(jiàn)到,擴(kuò)大 molQTL 研究在未來(lái)將繼續(xù)具有價(jià)值,同時(shí)還具有其他使用體外擾動(dòng)和從表觀基因組數(shù)據(jù)進(jìn)行計(jì)算推斷的方法(圖 3)。

疾病相關(guān)基因位點(diǎn)的細(xì)胞程序和生理效應(yīng)

在過(guò)去 10 年中,GWAS 功能解釋的主要重點(diǎn)是識(shí)別基因座中的因果驅(qū)動(dòng)基因。雖然用于這一推斷的工具箱仍不完整,但在數(shù)百甚至數(shù)千個(gè) GWAS 基因座中,已經(jīng)以合理的置信度識(shí)別出了順式致病基因。然而,到目前為止,這些研究提供的有關(guān)疾病背后的細(xì)胞程序和下游生理機(jī)制的信息有限(圖 2)。這是由于我們知識(shí)上存在兩個(gè)主要空白:人類基因的功能注釋非常不完整,而對(duì)將單個(gè)基因與更廣泛的細(xì)胞行為聯(lián)系起來(lái)的細(xì)胞程序和調(diào)控網(wǎng)絡(luò)的理解更加不完整。此外,基因和變異可以在細(xì)胞和組織中產(chǎn)生多效性影響,因此很難區(qū)分致病作用。

因此,我們?cè)诓粩嗤七M(jìn)對(duì)順式調(diào)控機(jī)制的解讀的同時(shí),必須積極努力將變異和基因與細(xì)胞程序聯(lián)系起來(lái),并進(jìn)一步與構(gòu)成性狀和疾病的生理機(jī)制聯(lián)系起來(lái)。有許多方法可以實(shí)現(xiàn)這一目標(biāo),通常將圖 3中概述的概念擴(kuò)展到細(xì)胞表型,從而提供順式調(diào)控空間之外的功能效應(yīng)信息。具有大量基因座的功能強(qiáng)大的 GWAS 可以對(duì)細(xì)胞網(wǎng)絡(luò)和通路注釋中涉及的基因進(jìn)行富集分析,從而精確定位可能與性狀相關(guān)的功能。此外,GWAS 變異可以直接與整個(gè)基因組的分子性狀相關(guān)聯(lián),特別是通過(guò) trans-eQTL 作圖。這需要數(shù)千個(gè)個(gè)體的非常大的樣本量和仔細(xì)的分析以避免混雜因素。未來(lái)的單細(xì)胞分析有可能進(jìn)一步提高這種方法的信息量。用于測(cè)量或推斷細(xì)胞性狀(如轉(zhuǎn)錄因子活性或細(xì)胞形態(tài))的 GWAS 可以進(jìn)一步將分子變化與細(xì)胞程序聯(lián)系起來(lái),但在足夠大的樣本量中進(jìn)行表型分析一直是一個(gè)挑戰(zhàn)(圖 2)。用于大規(guī)模測(cè)量組織水平表型的 GWAS 提供了有趣的例子,這些性狀在直接從細(xì)胞測(cè)量的分子性狀和傳統(tǒng) GWAS 捕獲的高度復(fù)雜的生理表型之間,在機(jī)制上更具可解釋性。一種表征細(xì)胞性狀遺傳效應(yīng)的新興方法是“細(xì)胞村”,其中來(lái)自多個(gè)供體的細(xì)胞一起生長(zhǎng)并通過(guò)細(xì)胞分選等方法進(jìn)行表型分析,細(xì)胞表型組中遺傳變異的富集表明與該性狀有關(guān)聯(lián)。

佳學(xué)基因現(xiàn)在的認(rèn)識(shí)及未來(lái)方向

人類遺傳學(xué)作為一個(gè)充滿活力的領(lǐng)域繼續(xù)蓬勃發(fā)展。如上所述,不斷擴(kuò)大和多樣化的數(shù)據(jù)集不僅包括遺傳變異,還包括表型數(shù)據(jù)或推斷、環(huán)境因素和家庭關(guān)系,為了解導(dǎo)致人類遺傳變異譜的群體遺傳過(guò)程提供了充足的機(jī)會(huì)。遺傳關(guān)聯(lián)研究終于開(kāi)始覆蓋整個(gè)頻譜中不同類型的變異。群體遺傳學(xué)和統(tǒng)計(jì)遺傳學(xué)的整合為改善復(fù)雜性狀遺傳結(jié)構(gòu)的映射提供了豐富的機(jī)會(huì)。隨著可靠識(shí)別的遺傳關(guān)聯(lián)數(shù)量激增,其功能解釋的挑戰(zhàn)已成為該領(lǐng)域的一個(gè)核心問(wèn)題,現(xiàn)在正在使用從遺傳學(xué)擴(kuò)展到分子計(jì)算生物學(xué)的多種工具來(lái)解決。

這些進(jìn)展還揭示了該領(lǐng)域長(zhǎng)期存在的挑戰(zhàn)和懸而未決的問(wèn)題,其中一些在表 1中突出顯示。除了生成更多數(shù)據(jù)之外,進(jìn)展可能還來(lái)自數(shù)量、分子、群體和流行病學(xué)遺傳學(xué)等學(xué)科之間見(jiàn)解的綜合。要了解疾病結(jié)構(gòu)(尤其是廣泛的多基因性和多效性)的原因和后果,需要數(shù)量遺傳學(xué)的進(jìn)展來(lái)結(jié)合自然選擇的參數(shù),再加上遺傳流行病學(xué)的進(jìn)展來(lái)了解相關(guān)的環(huán)境背景和不同性狀之間共有的風(fēng)險(xiǎn)因素。反過(guò)來(lái),后者可能會(huì)受益于家庭研究設(shè)計(jì)的進(jìn)步所帶來(lái)的環(huán)境和遺傳方差的劃分,而家庭研究設(shè)計(jì)的進(jìn)步也開(kāi)始利用因果推理和反事實(shí)推理的基本理論來(lái)幫助解釋。理解調(diào)控變異的語(yǔ)言和語(yǔ)法需要將種群規(guī)模的數(shù)量遺傳學(xué)與實(shí)驗(yàn)分子遺傳學(xué)相結(jié)合,前者可以量化體內(nèi)和疾病背景下的變異效應(yīng),后者可以探測(cè)未觀察到的擾動(dòng)的影響并在體外和非疾病或合成疾病背景下驗(yàn)證新的預(yù)測(cè)。這兩種方法都可以從統(tǒng)計(jì)遺傳學(xué)和機(jī)器學(xué)習(xí)的新興工具中受益,用于預(yù)測(cè)、優(yōu)先排序和特征解釋,從而更有效地識(shí)別最相關(guān)的疾病基因及其更廣泛的疾病網(wǎng)絡(luò)效應(yīng)。最后,所有這些研究都可以從多樣化、多祖先隊(duì)列和種群遺傳學(xué)的進(jìn)步中受益,以利用現(xiàn)代和古代基因組數(shù)據(jù)了解當(dāng)代人群復(fù)雜的遺傳譜系。

表 1.未來(lái)5至10年人類遺傳學(xué)研究需要解決的突出挑戰(zhàn),重點(diǎn)關(guān)注群體遺傳學(xué)、常見(jiàn)復(fù)雜性狀和基礎(chǔ)研究。

挑戰(zhàn) 目標(biāo) 未來(lái)之路
完成遺傳變異圖譜 全面表征全球人口各類基因組變異 對(duì)全球數(shù)萬(wàn)名個(gè)體進(jìn)行長(zhǎng)讀測(cè)序
人類適應(yīng)機(jī)制 識(shí)別人類適應(yīng)的遺傳變異和基因 來(lái)自不同人群的數(shù)據(jù);統(tǒng)計(jì)模型;功能跟蹤
選擇性約束圖 在選擇性約束下注釋基因組元素和分子過(guò)程,這是功能相關(guān)性的關(guān)鍵指標(biāo) 海量基因數(shù)據(jù)集
基因-環(huán)境相互作用和相關(guān)性 量化和控制生物庫(kù)數(shù)據(jù)集中的環(huán)境異質(zhì)性,識(shí)別重要的環(huán)境混雜因素 通過(guò)縱向跟蹤和地理映射協(xié)調(diào)跨生物庫(kù)的元數(shù)據(jù);多樣化的基于家庭的研究設(shè)計(jì)
順式GWAS 致病基因 一個(gè)強(qiáng)大且相當(dāng)準(zhǔn)確的工具包,用于對(duì)任何 GWAS 基因座的可能致病驅(qū)動(dòng)基因進(jìn)行計(jì)算機(jī)注釋 將不同的工具(來(lái)自單細(xì)胞的 molQTL、增強(qiáng)子圖譜、CRISPR)與黃金標(biāo)準(zhǔn)注釋進(jìn)行整合
基因組的調(diào)控代碼 預(yù)測(cè)遺傳變異的特定環(huán)境順式調(diào)控效應(yīng) 結(jié)合深度學(xué)習(xí)和人工智能方法的功能基因組學(xué)數(shù)據(jù)和驗(yàn)證數(shù)據(jù)集
復(fù)雜疾病背后的細(xì)胞程序 識(shí)別介導(dǎo) GWAS 關(guān)聯(lián)的細(xì)胞過(guò)程及其發(fā)生的細(xì)胞狀態(tài) 人類遺傳學(xué)與大規(guī)模體外實(shí)驗(yàn)和分子細(xì)胞生物學(xué)的整合
復(fù)雜疾病背后的器官和生理過(guò)程 識(shí)別介導(dǎo) GWAS 關(guān)聯(lián)的組織和器官功能變化以及其他生理表型 為 GWAS、類器官和模型生物研究測(cè)量或推斷這些低級(jí)特征
pheWAS 解釋 根據(jù) pheWAS 數(shù)據(jù)推斷特征之間的可解釋因果關(guān)系 先進(jìn)的統(tǒng)計(jì)模型;全面且可解釋的表型和元數(shù)據(jù)
可翻譯和可解釋的多基因評(píng)分 遺傳預(yù)測(cè)因子包含常見(jiàn)和罕見(jiàn)變異以及環(huán)境風(fēng)險(xiǎn)因素,可在不同群體之間轉(zhuǎn)化 先進(jìn)的統(tǒng)計(jì)模型;更多樣化的 GWAS 數(shù)據(jù)集;更好的精細(xì)繪圖

鑒于本世紀(jì)的快速發(fā)展,人類遺傳學(xué)現(xiàn)已準(zhǔn)備好更深入地了解人類生物學(xué) - 并改善人類健康。成功描述遺傳變異、繪制遺傳關(guān)聯(lián)圖譜和識(shí)別其功能效應(yīng)為從機(jī)制上理解這些過(guò)程奠定了基礎(chǔ)。這為在診斷環(huán)境中成功預(yù)測(cè)和識(shí)別影響導(dǎo)致疾病的過(guò)程的干預(yù)措施打開(kāi)了大門。最終目標(biāo)是將罕見(jiàn)和常見(jiàn)的遺傳風(fēng)險(xiǎn)因素與環(huán)境風(fēng)險(xiǎn)以及藥物遺傳學(xué)在定制治療選擇方面的進(jìn)步相結(jié)合。同樣重要的是繪制遺傳學(xué)的極限,并了解遺傳性的廣泛模式如何通過(guò)個(gè)體一生中復(fù)雜而相互關(guān)聯(lián)的遺傳過(guò)程和多種環(huán)境因素而出現(xiàn)。在這里,人類遺傳學(xué)與流行病學(xué)和分子生物學(xué)等鄰近領(lǐng)域之間的相互作用至關(guān)重要。

除了這些挑戰(zhàn)和前進(jìn)方向之外,人類遺傳學(xué)要取得持續(xù)成功并在全球范圍內(nèi)得到認(rèn)可,就必須仔細(xì)審查該領(lǐng)域作為一個(gè)專業(yè)社區(qū)的情況,以及它與周圍社會(huì)的關(guān)系。與其他科學(xué)領(lǐng)域一樣,人類遺傳學(xué)也有著問(wèn)題重重的歷史,并且一直存在著與專業(yè)社區(qū)內(nèi)部和研究參與者對(duì)土著社區(qū)和少數(shù)民族的剝削和排斥有關(guān)的問(wèn)題。面對(duì)和解決這些問(wèn)題對(duì)于鋪平一個(gè)更加包容和負(fù)責(zé)任的未來(lái)至關(guān)重要。遺傳學(xué)研究越來(lái)越多地被納入社會(huì)科學(xué),需要跨學(xué)科進(jìn)行有效的溝通,以確保充分理解遺傳推斷的局限性。

然而,人類遺傳學(xué)提供了一些最令人信服的經(jīng)驗(yàn)證據(jù),證明了我們的集體起源和所有人類相互交織的生物構(gòu)成,以及人類特征和疾病的復(fù)雜性和不確定性。這一敘述可以得到更廣泛的傳播。遺傳學(xué)在公眾了解我們個(gè)人的家族史和祖先方面已經(jīng)發(fā)揮了重要作用,并且在醫(yī)療保健中發(fā)揮著越來(lái)越重要的作用。因此,必須建立一個(gè)精通基因數(shù)據(jù)的適當(dāng)使用和限制的社會(huì)。這需要擺脫遺傳學(xué)公共傳播中經(jīng)常使用的簡(jiǎn)化和確定性的語(yǔ)言。采取一種更具包容性、透明性和道德意識(shí)的方法不僅是道德要求,而且對(duì)于該領(lǐng)域的持續(xù)進(jìn)步和可信度也至關(guān)重要。

(責(zé)任編輯:佳學(xué)基因)
頂一下
(0)
0%
踩一下
(0)
0%
推薦內(nèi)容:
來(lái)了,就說(shuō)兩句!
請(qǐng)自覺(jué)遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動(dòng)的言論。
評(píng)價(jià):
表情:
用戶名: 驗(yàn)證碼: 點(diǎn)擊我更換圖片

Copyright © 2013-2033 網(wǎng)站由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司,湖北佳學(xué)基因醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室有限公司所有 京ICP備16057506號(hào)-1;鄂ICP備2021017120號(hào)-1

設(shè)計(jì)制作 基因解碼基因檢測(cè)信息技術(shù)部