本文是一篇法医学论文,本研究获得了新疆维吾尔族和青海藏族381个Y-SNPs单倍群和41个Y-STRs基因分型数据,刻画了两个研究群体精细化父系遗传结构特征,丰富了法医学DNA数据库。
1材料与方法
1.1主要实验材料
1.1.1实验样本
本研究由司法鉴定科学研究院伦理委员会批准,伦理审查批件号为SJY2021-W027。在知情同意下,随机选取青海地区藏族100例和新疆地区维吾尔族100例健康无关男性个体。所有志愿者至少三代或以上居住在青海或新疆地区,且没有与其他民族进行通婚。每人采取外周静脉血2ml,收集于EDTA抗凝管内,并集中保存于-20℃备用。
1.1.2参考群体
根据文献记载及学者研究,通过语系、民族、地域等角度从YHRD数据库中选取参考群体,共筛选出43个参考群体。其中包括24个国内群体:8个藏缅语族群体(云南白族、四川羌族、凉山彝族、湖南瑶族、成都藏族、甘肃藏族、拉萨藏族和湖北土家族);5个壮侗语族群体(贵州布依族、广西壮族、贵州仡佬族、海南黎族和湖南侗族);4个汉语族群体(黑龙江汉族、江苏汉族、青海回族和宁夏回族);3个蒙古语族群体(新疆蒙古族、呼伦贝尔蒙古族和内蒙古达斡尔族);3个突厥语族群体(阿克苏维吾尔族、青海撒拉族和甘肃裕固族);1个朝鲜语组群体(延边朝鲜族),19个国外群体:7个亚洲群体(日本人、越南河江布依族、老挝人、越南老街布依族、沙特阿拉伯人、印度人和哈萨克斯坦人);4个美洲群体(美国原住民、阿根廷人、欧裔美国人和非裔美国人);3个非洲群体(乍得人、埃及人和肯尼亚人);4个欧洲群体(比利时人、西班牙人、匈牙利人和俄罗斯人);1个大洋洲群体(澳大利亚人)。研究及参考群体具体信息见表1。
1.2主要实验试剂
2结果
2.1 Y-SNP单倍群的遗传多态性
2.1.1 Y染色体单倍群分布
381个Y-SNPs在新疆维吾尔族和青海藏族中分别检测出42种和27种Y-SNP单倍群,两个民族单倍群分布及频率见图1和图2。在新疆维吾尔族中,共检出9种主干单倍群,其中主要单倍群为R单倍群(37%),其他单倍群依次为J单倍群(17%),C单倍群(14%),G单倍群(8%),Q单倍群(7%),O单倍群(7%),N单倍群(7%),T单倍群(2%)和I单倍群(1%)。对R单倍群进行划分,其中R1亚群所占比例远远高于R2,分别为33%和4%。在R1单倍群下,R1a单倍群所占比例高于R1b,分别为25%和8%。对所有主干单倍群进一步进行高分辨划分,得到末端单倍群,其频率分布为0.01~0.09,其中优势单倍群频率分布由大到小依次为J2a-M410(9%)、C2a1a3a-F3796(8%)、R1a1a1b2a2a1-Z2123(7%)和J2a1a-L26(6%)。
在青海藏族中,共检出9种主干单倍群,其中主要单倍群为D单倍群(52%),第二单倍群是O单倍群(32%),其他单倍群依次为C单倍群(5%),N单倍群(3%),J单倍群(3%),R单倍群(2%),G单倍群(1%),L单倍群(1%)和Q单倍群(1%)。对D单倍群进行划分,其中D1a1a亚群所占比例小于D1a1b,分别为6%和46%。对O单倍群进行划分,O1单倍群所占比例小于O2单倍群,分别为3%和29%。对主干单倍群进行细分,得到的末端优势单倍群依次为D1a1b1a1a1a~-PH97(33%),O2a2b1a1a1a4a-CTS4658(23%),D1a1b1a2~-Z42602(13%)和D1a1a1a1a1-PH1991(7%)。
2.2 41个Y-STR的遗传多态性
2.2.1 41个Y-STR的等位基因及频率分布
在新疆维吾尔族中,100例样本中一共检测出99种单倍型,98种单倍型出现1次,1种单倍型出现2次。41个Y-STR上共检出328个等位基因,单拷贝位点中,等位基因频率为0.01~0.96,等位基因数量从2(DYS645和DYS593)到12(DYS447)。多拷贝位点的等位基因频率为0.01~0.17,等位基因数从24个(DYS404S1)~34个(DYS358)。
在青海藏族群体中,100例样本中一共检测出91种单倍型,82种单倍型出现1次,9种单倍型出现2次。共检出287个等位基因,单拷贝位点中,等位基因频率为0.01~0.9,等位基因数量从3(DYS3915和DYS645)到13(DYS518)。多拷贝位点的等位基因频率为0.01~0.29,等位基因数从29个(DYS404S1)~48个(DYS358)。各基因座的等位基因频率信息和GD值见表5。
3 讨论 ................................ 39
4 结论 ................................ 45
3讨论
3.1新疆维吾尔族和青海藏族群体Y染色体遗传结构
3.1.1新疆维吾尔族和青海藏族群体Y-SNP法医学分析
近年来对于东亚人群的Y-SNP研究愈发增多[42,43],学者们认为D-M174、C-M130、O-M175和N-M231四大单倍群是东亚人群的主要单倍群,其中在中国最大的民族汉族中,最主要的是O单倍群,C单倍群所占频率远不及O单倍群[44],但是在新疆维吾尔族中频率却较高,D单倍群在中国西藏等地区频繁分布[45]。
本课题组前期基于二代测序技术构建了一个高分辨率的包含381个Y-SNP的复合扩增体系。参考最新版2019年ISOGG网站选择位点,纳入标准如下:1)针对中国人群D、N、C和O四大主要单倍群,以及下级分支所包含的相应Y-SNP位点;2)包括Y染色体单倍群树全部20个主干分支(A-T)及其亚群;3)在已发表的文章中,筛选属于中国群体内的Y-SNP单倍群相关位点;4)设计的扩增产物在250 bp以内。研究证明[10]该体系可以在系统发育树中将男性个体划分到更精细的分支从而实现Y单倍群结果的更高分辨率,有助于中国男性个体在族源推断方面的的法医学应用。
200例新疆维吾尔族和青海藏族男性个体中,分析了381个Y-SNPs,一共检测出来60种不同的单倍群。新疆维吾尔族中频率较高的主干单倍群依次为R-M207、J-M304和C-M130单倍群,频率较高的末端单倍群依次为J2a-M172、C2a1a3a-F3796和R1a1a1b2a2a1-Z2123单倍群;青海藏族中频率较高的主干单倍群依次为D-CTS3946和O-M175单倍群,频率较高的末端单倍群依次为D1a1b1a1a1a~-PH97和O2a2b1a1a1a4a-CTS4658单倍群。这与前期学者的研究一致,C单倍群高频率分布在新疆维吾尔族等地,而D单倍群在中国西藏等地区分布频率较高。两个研究群体间单倍群分布差异较大,这可能是由于地理的隔离和语言沟通的局限等原因,导致两个群体之间的基因交流缺乏。另外,研究证明O2-M122单倍群在中国汉族人群中频率很高,与汉族群体不同的是,O2单倍群在新疆维吾尔族群体中的比例仅为4%,而在青海藏族群体中则高达29%,这可能是因为相比维吾尔族,藏族和汉族群体间的交流交融更为频繁,在中国漫长的历史发展中,汉藏先民早在古羌人时期就产生了经济文化交流互动[46]。
4结论
(1)本研究获得了新疆维吾尔族和青海藏族381个Y-SNPs单倍群和41个Y-STRs基因分型数据,刻画了两个研究群体精细化父系遗传结构特征,丰富了法医学DNA数据库。
(2)381个Y-SNPs在新疆维吾尔族和青海藏族群体中分别检测出42和27种单倍群,维吾尔族以R、J和C单倍群为主,藏族以D和O单倍群为主。两个群体单倍群分布差异较大,几乎不存在共享单倍群,说明新疆维吾尔族和青海藏族群体间基因交流较少,在父系起源和演化方面相关性不大。
(3)41个Y-STR位点在新疆维吾尔族和青海藏族群体中分别检测出99和91种单倍型,且具有较高的单倍型多样性和分辨能力,可以成为区分新疆维吾尔族和青海藏族相关男性个体的有力工具。
(4)群体遗传结构分析显示群体遗传关系受到语系、地理和民族等因素影响,新疆维吾尔族与阿克苏维吾尔族、新疆蒙古族和青海撒拉族遗传关系最亲密,青海藏族和甘肃藏族以及拉萨藏族遗传距离最近。
参考文献(略)