現(xiàn)代人類起源于非洲,相比于其它大陸,現(xiàn)代人類在非洲居住時(shí)間*長。并且在遷徙,融合和對環(huán)境適應(yīng)性進(jìn)化的過程中形成了超過3000個(gè)民族和2100種語言。目前非洲人群不僅具有世界上*豐富的遺傳多樣性和表型多樣性,并且現(xiàn)代人類近三分之一的語言都在非洲,是全世界語言*為多樣化的地區(qū)之一。但是目前的遺傳學(xué)和基因組學(xué)的研究中,只有不到3%的樣本來自非洲,存在嚴(yán)重的滯后性。
研究非洲人群遺傳多樣性不僅將加深我們對于現(xiàn)代人類起源、早期遺傳結(jié)構(gòu)以及適應(yīng)性進(jìn)化的理解,并且也能為健康和診斷研究及開發(fā)提供豐富的新遺傳信息。
2023年3月2日,賓夕法尼亞大學(xué)Sarah A. Tishkoff團(tuán)隊(duì)(共同一作為復(fù)旦大學(xué)樊少華青年研究員和斯坦福大學(xué)Jeffrey P. Spence)在Cell上發(fā)表了文章Whole-genome sequencing reveals a complex African population demographic history and signatures of local adaptation。研究中對**代表性的非洲12個(gè)群體180個(gè)個(gè)體進(jìn)行全基因組測序分析。這些民族地理分布廣泛,以不同方式為生(包括農(nóng)業(yè),打獵收集和游牧),并且涵蓋了非洲四個(gè)主要的語系。
基于人類參考基因組,研究發(fā)現(xiàn)共發(fā)現(xiàn)三千兩百萬個(gè)單核苷酸多態(tài)性位點(diǎn)(single nucleotide polymorphism, SNP),其中大約五百三十個(gè)位點(diǎn)是在之前沒有發(fā)現(xiàn)的。這些新發(fā)現(xiàn)的突變廣泛的存在于增強(qiáng)子,啟動子以及轉(zhuǎn)錄因子結(jié)合位點(diǎn)等基因組功能區(qū)域。
研究發(fā)現(xiàn)這12個(gè)民族的平均SNP個(gè)數(shù)和遺傳多樣性均具有顯著的差異。以打獵和收集為生的桑人(Ju|’hoansi和!Xoo)和熱帶雨林小矮人(rainforest hunter-gatherther, RHG)的SNP數(shù)量和遺傳多態(tài)性*高,而Amhara,F(xiàn)ulani,Chabu以及Hadza等民族的遺傳多態(tài)性則*低。研究發(fā)現(xiàn)大量的非非洲人的基因滲入(Amhara和Fulani)以及嚴(yán)重的群體瓶頸 (Hadza和Chabu) 是造成遺傳多態(tài)性低的主要原因。例如,生活在坦桑尼亞的Hadza和埃塞俄比亞的Chabu群體的人口數(shù)量已經(jīng)少于1000人。
利用鄰近距離法 (Neighbor-joining method) 對本研究中的12個(gè)民族,和來自千人基因組的歐洲人群(CEU),北方漢族(CHB),托斯卡納人群(TSI)以及西蒙斯基因組多態(tài)性研究計(jì)劃(Simons Genome Diversity Project,SGDP)中的巴布亞人群(Papuan)進(jìn)行系統(tǒng)計(jì)劃分析發(fā)現(xiàn),現(xiàn)代桑人(Ju|’hoansi 和!Xoo)的祖先是現(xiàn)代人類*早發(fā)生分歧的一支,隨后發(fā)生分歧的是熱帶雨林小矮人的祖先。其他民族在系統(tǒng)進(jìn)化樹的聚類模式與他們目前所處的地理環(huán)境顯著相關(guān),這說明地理環(huán)境是制約不同民族間基因交流的重要因素。
現(xiàn)代桑人和小矮人祖先的早期分歧的現(xiàn)象也被主成分分析(principal component analysis, PCA)和ADMIXTURE所支持。同時(shí)PCA和ADMIXTURE分析在目前坦桑尼亞說Kheosan語言的Hadza和Sandawe的基因組中也發(fā)現(xiàn)了桑人相關(guān)的祖源成分。
雖然僅有南部非洲的桑人以及東非坦桑尼亞的Hadza和Sandawe說Khoesan語言, 研究中利用PCA分析將之前發(fā)表的來自不同地區(qū)的55個(gè)古非洲人樣本投射到現(xiàn)代非洲人樣本中。研究發(fā)現(xiàn)大量的來自不同地區(qū)的古非洲人被投射在桑人和東非Hadza和Sandawe人群之間;但是這些地區(qū)目前卻沒有講Khoesan語言的民族。該結(jié)果提示Khoesan語系的地域分布曾經(jīng)非常廣,遍及整個(gè)非洲, 但是可能受到班圖大遷徙的影響目前大都滅絕。
由于受到基因交流 (gene flow) 和遺傳重組(recombination)等因素的影響,鄰近距離法,主成分分析和ADMIXTURE無法用來構(gòu)建現(xiàn)代人類早期遺傳結(jié)構(gòu)。但當(dāng)將這些因素納入到復(fù)雜模型中,發(fā)現(xiàn)現(xiàn)代桑人和小矮人的共同祖先,而不是現(xiàn)代桑人的祖先,是現(xiàn)代人類*早分歧的一支。并且研究推斷現(xiàn)代人類的分歧發(fā)生在28萬年前,這與之前的考古和基于古DNA推斷的時(shí)間一致。
研究中還結(jié)合正選擇分析的算法、功能基因組學(xué)手段和方法以及大規(guī)模全基因組關(guān)聯(lián)分析的結(jié)果,對12個(gè)非洲民族特異的適應(yīng)性進(jìn)化進(jìn)行研究,**的繪制了一副非洲人群適應(yīng)性進(jìn)化的圖譜。
膚色多樣性是現(xiàn)代人類對于不同維度地區(qū)適應(yīng)性進(jìn)化的一個(gè)重要標(biāo)志。桑人是非洲人群中膚色*淺的民族,但是研究對于桑人淺膚色的遺傳學(xué)基礎(chǔ)仍然缺乏了解。利用功能基因組學(xué)等方法,本研究發(fā)現(xiàn)一個(gè)位于PDPK1基因內(nèi)部增強(qiáng)子的突變r(jià)s77665059-C,是影響桑人淺膚色的一個(gè)決定性的因素。該增強(qiáng)子僅在黑色素細(xì)胞中特異活躍,使用Crispri沉默該增強(qiáng)子會降低PDPK1基因的表達(dá)量和黑色素和合成。研究進(jìn)一步發(fā)現(xiàn)rs77665059-C在桑人中尤其是!Xoo中頻率超過了80%;但是在其它非洲(平均頻率14%)和非非洲民族中(平均頻率3%)頻率卻顯著的低。研究發(fā)現(xiàn)rs77665059-C突變會導(dǎo)致PDPK1基因增強(qiáng)子在黑色素瘤細(xì)胞系中活性降低,降低PDPK1基因的表達(dá),并且與桑人中的淺膚色表型顯著相關(guān)。為桑人的淺膚色進(jìn)化的遺傳學(xué)研究提出了新的解釋。