追踪曹操基因释疑

  【核心提示】追踪曹操基因释疑中国的人类学要平衡发展起来,主要在于抓住人类的社会学特征与生物学特征的关系,或者说是文化与基因的关系,用分子人类学的手段去回答社会人类学难以阐述的问题。

  【王传超/文】

  1. 为什么做这个项目?

  2009 年末,河南省安阳市宣布发现了曹操墓,出土了一男两女三具尸骨,考古人员推测男尸可能是曹操。消息一发表,立即在国内舆论界掀起轩然大波,质疑者甚众,引起对曹操墓真伪的争议。当时由于没有可以作为标准的曹操家族DNA特征来作为骨骸验证的对照,遗传学无法就骨骸的身份作出判断。能否找到明确的曹操家族DNA特征,从而分析曹操的身世,对曹操及汉魏历史的研究都有极为重要的意义。同时,复旦大学正在积极推进历史人类学学科的发展,期望使用遗传学工具来准确定位历史上的民族和家族,解决单纯的历史学方法所无法解决的问题。曹姓作为一个重要的姓氏,同时又具有不大不小的适当规模,被选择为第一个深入研究的姓氏。2010 年1月26日,复旦大学现代人类学教育部重点实验室和历史学系联合启动复旦大学文科科研推进计划项目-曹操后代的历史人类学调查,利用姓氏和Y 染色体相关性原理,调查分析曹氏Y 染色体,进而给曹操身世血统的研究提供科学的证据,也开始了人类基因调查从民族分析向家族分析的转变,从史前时期向历史时期的迈进。

  2. 中间遇到哪些波折?

  我们刚刚发布新闻说我们准备鉴定曹操遗骨真假的时候,很多网友、很多专家都出来问。甚至我们还没有鉴定,他们就出来“辟谣”。有考古专家表示:“考古不必要以DNA为佐证”,骨骼现在也是重要文物,为了鉴定他身份在上面钻个洞取DNA本身就是一个破坏文物的事情,好像完全没必要。如果为了鉴定他身份,完全可以从墓的形制等等鉴定。所以考古学不需要用这些新的技术新的方法作无谓的事情。但是大多数网友不买账,表示“DNA是最权威可信的证据,如果确认这个墓是曹操的话,为什么不作(鉴定)呢?”所以要解决遗骨的身份问题,只能通过DNA的手段,没有什么其他手段可以来做。当然,证明了这个骨头不是曹操的,也不能确认这个墓不是曹操的。比如这个墓里面随便躺一个人,或许是盗墓贼。反过来,如果证明了这个骨头是曹操的,那么这个墓是曹操的,就基本上没有问题了。当然这个墓里面现在躺的人太多了,有了三个人了,他/她们分别是谁,都是需要DNA解决的问题了。

  实际上通过我们的DNA宣传,现在有部分考古学专家有了针对性的回应,他承认DNA鉴定是一个很好的方法,但称DNA鉴定曹操有两大难题。一个是只有在专业的实验室里面测试之后才能有科学的、客观的答案,才能知道这骨骼能不能作DNA鉴定。当然我们从照片上看到,这个骨骼保存得很好,没有受酸性物质的污染,没有被什么金属锈迹浸染过,而且一直保存在比较阴冷的环境下,所以做古DNA的鉴定条件还是相当成熟的。另外一点,必须要找到确定的曹操后裔,成功地提取遗传数据作为参考。这两点好像都是给我们的工作做铺垫用的。实际上这两大难题在其他学校可能是难题,但是在复旦绝不是难题,因为我们有国际一流的专业古DNA实验室,这解决了第一个难题。第二个,如何找曹操的后代,魏晋南北朝史的优秀历史学家韩昇教授已经用历史学方法找到了。我们课题组对上海图书馆收藏的118 件曹氏族谱进行了全面查阅和筛选,将家谱所载世系同历史记载相比较,挑选出比较可靠的家谱,其中包含自称是曹操后裔的家谱。把曹氏取样的面铺得广一些,多取一些样本,能够更加全面地反映出自古以来多支曹氏家族的基因状况,获得整体的把握。家谱调查反映出,与曹参或者曹操有关系的曹氏,大量分布于长江流域,与史料所见五胡十六国以后曹操家族迁居于江南的情况是吻合的。据此,我们大致确定了几处最接近曹操后裔的居住地,一是位于安徽、山东、河南、江苏四省的交界处,以安徽亳州为中心,这里是曹操政权的发源地,也是安阳汉墓被发现的地区;二是江东地区,包括安徽泾县、繁昌、歙县、绩溪、浙江的金华、东阳、绍兴、余姚、萧山和江西赣州等地;三是湖南等省沿江地区,如湖南兴化、郴州、益阳、长沙等地。曹操后裔在哪里,我们都抽一遍血就都可以验证了。

  3. 技术手段和理论依据有哪些?

  现代社会中,几乎每人都有自己的姓氏。一个人的姓氏不仅仅是简单的符号,还有着丰富的文化、历史、宗族背景。以血缘为脉络的姓氏记录着各家族甚至于各民族的源流,常被用于寻根溯源、族群识别、婚姻关系等相关研究。数千年来大部分姓氏都从父传递,而人类基因组中的Y染色体更严格地遵循父系遗传,因此姓氏与Y染色体有很好的平行对应关系。随着Y染色体上众多遗传标记的发现,用Y染色体结合姓氏分析人类学问题的方法,在分子人类学领域发挥出了重要作用。

  与姓氏不同,人类的Y染色体直接代表着父系遗传,永远是父子相传的,不会受到任何社会文化和自然因素的影响。人体内有23对染色体,其中22对常染色体中,每一对染色体都有一条来自父系,一条来自母系,两条染色体在传代过程中对应的部分会发生交换,从而造成混血的效应,就是遗传学上说的重组。另一对性染色体包括X染色体和Y染色体。在女性体内,X染色体也是成对的,分别来自父母双方,所以也不能避免混血的影响。而在男性体内,却只有一条来自母亲的X染色体和一条来自父亲的Y染色体,也就是说男性的Y染色体只能来源于父亲,所以人体性染色体的遗传方式决定了Y染色体遵从严格的父系遗传。

  Y染色体与X染色体之间是否会发生重组呢?要回答这个问题,必须先了解Y染色体的结构。人类Y染色体DNA大约包含六千万个碱基对,其中染色体两端的5%为拟常染色体区域(pseudoautosomal region),在传代过程中与X染色体相应区段会发生重组,而主干部分的95%为非重组区域(NRY, non-recombinating portion of Y chromosome),不与任何染色体发生重组。所以,Y染色体主干部分的此特性,保证了子代能完整地继承父代的Y染色体主干而不受混血影响,保证了Y染色体主干的严格父系遗传。

  所以,以现代的分子生物学技术为基础,研究Y染色体主干的类型分布,是直接追溯群体或者家族的父系起源的最佳方法,是验证祖先与后代的父系关联的关键手段。例如,在曹操的后人中分析Y染色体特征,我们就可以了解曹操本人的Y染色体特征。实际上,在一段有较可信历史记录的时期内,整个家族的姓氏与父系遗传的关联是可以保证的,所以家族的姓氏往往与固定的Y染色体类型共同传递,紧密关联。

  在一代一代的父子相承的传递过程中,Y染色体也在慢慢地积累着变化。正是因为遗传突变的积累,使得人类父系遗传体系中,距离越远的个体的Y染色体差异也越大。Y染色体上的突变形成的个体差异主要有两大类,有一种叫做短串联重复,缩写叫STR,如果大家看过分子生物学的有关书籍,经常会看到。在基因组里面一个固定的区段,由几个碱基组成一个单位,不断地重复,重复数在人和人之间是不同的。打个比方,就像一辆火车,它有不同的车皮数,每节车皮都是一样的。这辆火车可以装10节车皮,也可以装12节车皮,每个人对应的区段上装的数量都不一样,这就构成了重复数的差异。另外一种叫单核苷酸多态,SNP,这个更流行。我们研究曹操的基因,关键就是要找到相应的SNP。SNP是固定的点上面的一种碱基类型的差异,从一种类型变到另外一种类型,这个点的旁边的其他序列都是一样的,但就这一个点上会发生变化,比如人类基因组中这个点原始型是A,有些人突然变成了G,这种变化会造成特定点上的性质的彻底改变。打个比方,这就像两辆卡车。一辆卡车装的是可口可乐,一辆卡车装的是七喜,这是完全不同的两个类型。只要看一个点,就知道这两辆车完全不同。

  要确立父系遗传体系,最重要的前提是祖先的突变可以稳定的保留在后代的Y染色体上。SNP突变因为突变速率极低,可以做到在后代中永久地保留,后代只能在祖先的突变基础上积累新的突变,而不会丢失祖先的突变特征。通过比较人类与黑猩猩的Y染色体差异,以及大家系中的Y染色体的差异程度,Y染色体上的SNP突变的速率被计算了出来。每出生一个男子,一个染色体位置上发生SNP突变的概率为大约三千万分之一。实际上由于Y常染色质区的保守性,以及人类历史上大量男子都没有男性后代保留至今的事实,实际的群体中突变率应该低几个数量级。而我们通常研究的是Y染色体非重组区大约三千万个碱基对的常染色质区,按照每个碱基对三千万分之一的突变率,这个区段内每个男子平均都会有一个新的突变。这个新的突变随机地出现在Y常染区的任意一个点上,如果这个突变了的点上再发生一次突变,那么这个突变就在后代中丢失了,我们就无法通过后代确定祖先的Y染色体突变谱。但是同一个点上先后发生两次突变的概率,按照概率计算方法就是三千万分之一的平方,也就是九百万亿分之一,相对于人类自古以来的人口,这个概率就近似于零。所以我们可以说,绝大多数情况下,祖先的Y染色体上出现的SNP突变特征在后代中能够找到,而后代只能在祖先Y染色体突变谱的基础上增加新的突变。

  由多个SNP突变构成的一种突变谱被称为一种单倍型。祖先型与所有后代型合称为一个单倍群。一个家族的所有Y染色体理论上都属于一个单倍群,因为其中所有的男性都应该来自同一个祖先。当然,单倍群的概念可大可小。大而言之,全世界的Y染色体都属于一种单倍群,都来自二十多万年前的一个东非晚期智人男子。进而,全世界又可以分为20种主干单倍群,编号从A到T。

  A型大致分布在东北非和西南非。B型出现在中非部分和东非部分,可能是黑人的扩张造成的。E型分布的地方就比较多,在西非洲和东南非很多,这是大部分黑人的主要类型,在欧洲和东非也有一部分的分布,甚至分布到亚洲的一些地方,分布到北亚的一些地方。前面几种类型在中国人里面一般是找不到的,D型在中国比较多,在中国的西藏,北方的一些地方,很多类型就出现在了日本,所以D型也是很传奇的一个类型,它是在中国地区最古老的一个类型,在东亚地区也很古老,在人群里面很少出现。C型也是出现在远东地区,在澳洲非常多,在北亚也非常多,它是被另外一种类型挤压以后出现两头多中间少的分布方式,然后一部分出现在北美的纳丁尼人,F型是一个上游型,它包括了F下面的所有类型,它的分布是这样的,整个欧亚大陆和美洲大陆基本上都是F型。其中G型出现在高加索山区和小亚细亚,然后以此为中心向四周扩散。H型出现在印度、巴基斯坦和伊朗地区,它是雅利安人扩张造成的结果,但也可能是荼拉维达人留下的,也可能是更早的人留下的。I型出现在欧洲的大部分地区,但是分布也不多,应该是欧洲、印欧的一种土著型。J型出现在亚非语系、阿拉伯世界和欧洲的很多地方,是白种人的类型,犹太人里面大部分都是J型。K型也是一个大的类型,包括下面很多类型,它是一个上游型,它的分布在亚洲很常见,但是把下面类型去除掉之后的纯K型是非常非常罕见的。T型是一个比较少见的型,也是分布在阿拉伯世界。然后L型分布在以巴基斯坦为中心的一圈地区,S和M就只分布在新几内亚土著人之间,食人群体里。N型很有意思,它的起源是在中国,但是居然分布到了整个北压地区的很多民族中间,并且在乌拉尔民族的群体里面占到了绝大多数,在芬兰、亚沙尼亚这些国家里面,占到了绝大多数,所以这些欧洲人居然都是从中国出去的,这部分欧洲人在欧洲号称自己是黄种人,但是我们怎么看都不像,至少比新疆人白多了,但他们还是号称自己是黄种人,所以这是一种民族心理上的错觉,我们看的时候会更多地关注一些差异,他们在欧洲觉得自己跟周围的白种人差别太大,因为他们关注这些差异,并且在大脑里面把这些差异给放大了。然后O型对于我们来说是最重要的,因为它是东亚人最主要的类型,在东亚人里面,几乎占到了百分之七十到百分之八十,在中国人里面甚至更多,O型是黄种人的关键型,但是刚才说的跑到欧洲去的N型跟O型是兄弟型,非常接近的。O型下面分很多类型,分O1、O2、O3这三大种。O1出现在中国东南的百越民族的后代中间,包括侗傣语系与南岛语系的这些民族,台湾高山族里面有些民族像阿美族占到百分之百。O2型非常有意思,一部分叫做O2a,下面分两部分,一个分支出现在东南亚,从苗族开始往西南地方绝大部分都是O2a,另外一个分支出现在日本和朝鲜,从朝鲜往东北的地方大部分都是这个类型。O3是一个大头,在中国大部分民族里面都有O3,而且O3大部分都是占多数,在汉族人里面更是多数,占到了大概百分之六十,O3下面有很多很多分支,这些分支能够让我们辨认汉族人里面到底有多少差异。然后Q型,Q型是出现在北亚的叶尼塞语系,进入到楚科奇-堪察加语系,然后进入到美洲印第安人,越往南Q型越多,美洲南方很多民族百分百都是Q型,因为他们一路走一路丢类型,到最后只剩下一种类型,所以迁徙得越到后面,类型就越少,因为不可能所有的人都能够成功迁徙,它的源头很可能就是在北亚叶尼塞语系这个地方,古代有两大批,现在被俄国人杀的只剩下一个民族,我们一直怀疑匈奴人就是叶尼塞语系的人,跟现在大部分人群都不一样。最后一个类型是R型,R型跟Q型、P型都是同源的姐妹型,但是它大部分分布在欧洲,所以是一个往东跑,一个往西跑,在欧洲的话也占到很大一部分,但是我们一直怀疑它是从亚洲跑过去的,所以白种人可能是从亚洲起源的。

  那么这么多Y染色体类型的话,曹姓有哪一些?曹操到底是属于哪个型的?

  4. 曹操的Y染色体类型

  我们用Y染色体上的100个单核苷酸位点(SNP)对全国各地曹姓79个家族的280个男性以及其他姓氏的446个男性进行分型。我们所选取的100个SNP位点涵盖了最新Y染色体谱系树上的O、N、C、D、Q、R、J等东亚地区可见的所有单倍群。如果同一家族的个体间Y染色体单倍型不同,该家族则是由一些不同来源的单纯家族组成的复合家族,因此实际上我们总共研究了111个曹姓单纯家族。我们也在家族成员知情同意后将大部分家谱资料影印保存。根据家谱资料,15个曹姓家族宣称是曹操后代,他们中共有6种Y染色体单倍型,其中仅有一种单倍型是曹操的,而其它5种可能是由于收养、从母姓、非亲生等原因而引入的。我们需要通过分析不同单倍型在家族间的分布来确认哪个才最可能是曹操的Y染色体单倍型。

  我们把这些曹姓家族分成三类:宣称是曹操后代的、未宣称是曹操后代(或宣称是其他祖源)的、其他姓氏的普通对照人群。首先,我们两两比较了每种单倍型在这三类家族间的频率差异,在未宣称为曹操后代的家系与普通对照人群间并未发现任何单倍型有显著差异,这表明曹姓与其他姓氏一样也是多起源的,所以我们在之后的分析中把未宣称的家族和普通人群合并在一起作为对照组。非常有趣的是,O2-M268是唯一在宣称是曹操后代的家族中显著高频出现的单倍型(Fisher精确检验,P=9.323×10-5),很有可能这就是曹操的Y染色体单倍型。某种单倍型是否是曹操的单倍型不能仅从其在宣称的家族里频率来判断,还要考虑其在宣称的家族与对照人群的频率差异。这里我们用OR值去估算O2-M268是曹操单倍型的可能性,OR值可判断两组变量间关系(带置信区间)。O2-M268在宣称为曹操后代的家族和对照人群间的OR值为12.72,所以其为曹操单倍型的可能性为92.71% (=12.72/(12.72+1)×100%)。还有一点需注意,有8个曹姓家族坚决认为不是曹操后代,这8个家族的Y染色体单倍型也都不是O2-M268,这也增大了O2-M268为曹操单倍型的可能性。

  另外,我们也估算了反概率,即假定所有的曹操家谱都是伪造的,那么出现6个家族都是相同的O2-M268单倍型的巧合概率。由于这些家族在确信的历史中都没有联络,所以他们如果来源不同而基因类型相同就只能是由巧合造成的。我们知道,两个事件同时发生的巧合概率是两个事件单独发生的概率的乘积。那么我们可以这样估计曹操家谱相关家族的基因巧合概率:出现两个家族基因相同的事件计为一次巧合事件,概率就是O2-M268在全国汉族人中的频率约5%;出现第三个相同基因的家族则是两次巧合事件,概率为5%乘以5%;那么6个分布在不同地域的曹姓家族同时是O2-M268的概率是(5%)5=3.125×10-7,大约为千万分之三。也就是几乎不可能。

  单倍型O3-002611是在其他曹姓家族中出现频率最高,也是唯一在宣称是曹参直系后裔的5个曹姓家族中都唯一出现的单倍型。我们继续使用推断曹操Y染色体单倍型的方法,对不同曹姓家族进行分类去推定曹参最可能的单倍型:5个自称是曹参后裔的O3-002611家族作为宣称组,79个未宣称的O3-002611家族和458个其他单倍型的家族作为对照组。经分析,O3-002611就是曹参最可能的单倍型(Fisher精确检验,P=1.968×10-4),可能性近于100%(OR值很高)。综合考虑我们的分析结果,我们认为魏武帝曹操不太可能是曹参的后裔,遗传学证据并不支持曹操自称的士族出身。

  5. 曹操DNA结果对于人类学这个学科的发展有什么意义?

  传统上主张将人类学分类为文化人类学和体质(生物)人类学两个大的方面,凡是研究人类社会属性的称为文化人类学或称社会人类学,凡是研究人类自然属性的称为体质人类学或称人类生物学。国内人类生物学的发展形势并不乐观。大部分高校和社科类研究所都设有文化人类学相关学科专业,唯独复旦生命学院在金力老师等的倡议下才设立了人类生物学专业并申请了博士点。在文化人类学的大环境下,复旦的人类生物学专业犹如一颗宝贵的种子努力探寻、争取着自己的发展空间。自02年,复旦成立现代人类学研究中心至今,我们已经在中国人的起源和蒙古人种的形成、肤纹肤色、语言特征的起源和演化等诸多方面取得了突破进展。成绩是辉煌的,忧患却依然存在,拿一个简单的数据来说明:04年复旦开始设立人类生物学硕士和博士点,每年招收1-2名学生,但培养的学生里至今仍从事人类生物学教学和科研的仅李辉老师一人。究其原因,主要是在文化人类学大环境下,大家大多割裂并漠视人类的社会学特征与人类的生物学特征及其对人类社会学特征的影响的关系。

  中国的人类学要平衡发展起来,主要在于抓住人类的社会学特征与生物学特征的关系,或者说是文化与基因的关系,用分子人类学的手段去回答社会人类学难以阐述的问题。所以我们着眼于中华民族的姓氏文化,利用姓氏与Y染色体较好的平行传递关系去理清中华姓氏精细的Y染色体遗传结构,较成功的例子是与历史系合作通过调查现代曹姓人群来反推曹操的Y染色体类型为O2—M268,曹操的Y 染色体类型与其自称的先祖曹参的并不一致,此次曹姓家族Y 染色体调查是将遗传学用于古代史研究的一个成功范例,且提供了两个重要的契机,一是促成了历史学和分子生物学的深层次合作研究,建立了国内第一个以分子生物学为主要研究工具的历史人类学新学科;二是加快了人类基因调查从以民族向以家族为对象的转变。利用姓氏谱牒材料来确立深度家系(deep-rooting pedigree),这对于分析Y染色体进化也有重要意义,比如我们可以深家系的Y染色体测序来精确估算Y染色体的突变率,来为人群起源分化提供更准确的分子钟。我们希望此次曹操的Y染色体项目可以让更多的人了解分子人类学,推动这个新兴学科的发展。

转载中国社会科学报网2012年04月17日

  

Comments are closed.