论文简介:通过 2000 年的考古基因组时间横断面了解伊特鲁里亚人的起源和遗产


Jenne 自然部落:  几个世纪以来,人们一直在争论来自意大利半岛中部地区被称为伊特鲁里亚的神秘伊特鲁里亚文明的起源、发展和遗产。这份2021年9月24日发表的《通过 2000 年的考古基因组时间横断面,伊特鲁里亚人的起源和遗产》研究报告结束这场争论。感兴趣的专业童鞋可去官网阅读英文原版论文或在本公号后台找小编索取英文PDF版,本文为肉机中文简版,只适合作为交流 学习 参考资料。
点击上方蓝字,关注公众号,开始阅读。
本文19111字,阅读大约需要X分钟。

通过 2000 年的考古基因组时间横断面了解伊特鲁里亚人的起源和遗产
科西莫· 波斯  瓦伦蒂娜· 扎罗   亚历山德拉· 莫迪    亚历山大· 佩尔策 [...]约翰内斯· 克劳斯 +29 位作者 
科学进展•2021 年 9 月 24 日•第7卷,第39 期
概要
几个世纪以来,人们一直在争论来自意大利半岛中部地区被称为伊特鲁里亚的神秘伊特鲁里亚文明的起源、发展和遗产。在这里,我们研究了跨越伊特鲁里亚和意大利南部近两千年(公元前 800 年至公元 1000 年)的 82 个人的基因组时间横断面分析。在铁器时代,我们发现了印欧相关草原血统的一个组成部分,并且在推定的非印欧语系伊特鲁里亚人中缺乏最近与安纳托利亚相关的混合基因。尽管包含来自中欧、北非和近东血统的不同个体,但本地基因库在公元前第一个千年基本上得以保持。这在罗马帝国时期发生了巨大变化,我们报告了人口范围内突然转变为约 50% 与地中海东部血统的混合。最后,我们确定了中世纪早期出现在意大利中部的北欧基因,从而形成了当今意大利人口的遗传结构。
介绍
伊特鲁里亚文明在铁器时代占领了意大利中部的大片地区,包括托斯卡纳、拉齐奥和翁布里亚的现代地区,在其存在期间局部扩展到邻近的意大利地区(图 1A)。这种文化以其卓越的冶金技术、复杂的文化表现形式和已灭绝的语言——一种尚未被完全理解的非印欧语言而闻名 。鉴于这种文化与其同代邻居的区别,与伊特鲁里亚文明相关的群体的地理起源长期以来一直是一个激烈争论的话题,早在古代就有两个主要的相互竞争的假设。第一种观点提出了安纳托利亚/爱琴海的起源,正如古希腊作家希罗多德和莱斯博斯的所指出的那样。这一假设得到了在公元前 8 世纪和 6 世纪之间所谓的东方化时期,在伊特鲁里亚存在的古希腊文化元素的支持。第二种观点主张本土发展,如哈利卡纳索斯的历史学家狄奥尼修斯(Dionysius of Halicansus)在公元前一世纪所描述的那样。根据这一假设,伊特鲁里亚人在当地起源于与公元前 900 年左右的青铜时代晚期(原始)维拉诺瓦文化相关的群体。虽然考古学家目前的共识支持后一种假设 ,但被斜体印欧语族群(例如拉丁人)包围的可能的非印欧语孤立的持续存在是一个有趣且无法解释的现象,仍然需要进一步考古学、历史语言学和遗传学调查。
经过四个多世纪的广泛区域发展,公元前四世纪,伊特鲁里亚文明开始通过一系列罗马-伊特鲁里亚战争被罗马共和国同化,于公元前264年结束。尽管发生了这段变化,但伊特鲁里亚的文化和宗教传统在随后的几个世纪中依然存在,甚至在公元前 27 年之后,伊特鲁里亚并入罗马帝国的第七区也是如此。在移民时期和公元 5 世纪西罗马帝国崩溃后,该地区被短暂地并入东罗马帝国。随后,在中世纪早期,意大利半岛的大部分地区被与日耳曼相关的族群所征服,这些群体被称为 伦巴德人(或 龙戈巴德人)。伦巴德 王国和公国建于公元六世纪下半叶,在意大利统治了两个多世纪。他们在北方被加洛林帝国(公元 774 年)继承,后来发展成为神圣罗马帝国。

图。1. 新生成的数据集的地理和时间分布。( A ) 意大利半岛地理图(右),包括放大图(左),显示伊特鲁里亚领土的最大延伸范围以及此处新分析的每个考古遗址的位置和人数(未填充符号指没有某个日期)。( B ) 每个已测日期的个体或与这些个体遗传相关的样本的平均放射性碳日期和 2-sigma 间隔(S.意大利南部 的四个放射性碳日期被分组,报告其最低和最高 2-sigma 值)(表 S1、A 和 B )。
对生活在上述时期的个体的古代 DNA (aDNA) 的分析,可以提供一种直接的方法来调查这些历史记录的事件是否与迁移或高流动率导致的人口水平祖先模式的可检测变化有关,这些变化在多大程度上影响了意大利人的当代基因构成。遗传分析对伊特鲁里亚历史研究的潜在贡献已经在过去十年中进行了讨论和探索。当今的托斯卡纳线粒体 DNA (mtDNAs) 证明与当前安纳托利亚种群的关系,这被解释为伊特鲁里亚人最近起源于近东的证据。相比之下,从伊特鲁里亚有关联的个人线粒体DNA早期的研究没有发现来自同一地区的伊特鲁里亚人和现今的种群之间的遗传连续性的任何证据,除了在托斯卡纳(一些偏僻的地方)。意大利的古代基因组非常有限,整个意大利大陆从新石器时代到罗马共和国时期的数据非常稀少(图S1)。来自铁器时代和罗马共和国(公元前 900 至 27 年)古城罗马及其周边地区的人拥有主要的基因组成分,这些成分是青铜时代以后大多数欧洲人的特征。此外,还发现三个人携带来自非洲和近东的近期遗传影响,这进一步证明了罗马早在铁器时代就与地中海有着广泛的联系。出乎意料的是,在帝国后期首都附近几乎所有的人都携带了大比例的东地中海血统,后来在古代晚期和中世纪早期减少了。然而,这些变化在多大程度上代表了意大利半岛其他地区发生的过程,仍有待罗马及其他古老大都市区以外的个体澄清。
在这项研究中,我们通过一个由 70 个个体组成的古老基因组时间横断面调查了伊特鲁里亚伊特鲁里亚相关个体和后续群体的遗传历史。这些来自 12 个考古遗址,伴随着 46 个新产生的直接放射性碳日期,跨越近两千年,从公元前 800 年到公元 1000 年(图 1B)。此外,我们从巴西利卡塔的“维诺萨温泉”考古遗址(日期是指校准的放射性碳日期的中点;表 S1)生成了可追溯到公元 8 世纪的 16 个个体放射性碳的全基因组数据,以比较意大利中部和南部中世纪早期的个人基因构成(图 1))。总之,这些数据解决了有关伊特鲁里亚相关群体的遗传起源及其与其他当代和后来群体的关系的关键问题。此外,我们评估了历史事件的遗传影响,例如在伊特鲁里亚建立罗马帝国,描述了意大利半岛中部和南部中世纪早期个体的基因构成,并揭示了这些过去文化和现代人口之间的遗传连续性水平。
结果
我们从 86 个人的颞骨和牙齿样本的牙釉质部分提取 DNA,创建双链 DNA 文库,并使用鸟枪法或溶液捕获方法检索整个线粒体基因组和多达约 124 万个单核苷酸每个个体的人类基因组中的多态性 (SNP)(表 S1A 和材料与方法)。按照认证标准,我们将所有下游分析限制为具有低核和 mtDNA 污染、典型 aDNA 损伤模式和 SNP 计数高于 31,000 的样本(表 S1A)。这些质量控制产生了 82 个个体的最终样本集,根据他们的放射性碳日期和遗传亲和力分为三个时间间隔:48 个人从公元前 800 年到公元前 1 年(铁器时代和罗马共和国),公元 1 年至公元 500 年(帝国时期)6 人,公元 500 年至公元 1000 年 28 人(12 人来自意大利中部,16 人来自意大利南部)。虽然我们更愿意反映传统的历史年表(伊特鲁里亚到公元前 300 年,共和党到公元前 27 年),但大的放射性碳测年间隔和遗传结果都不能保证以这种方式划分数据集(图 2B和表 S2F)。

图2. 古代和现代种群的遗传图谱和聚类。( A ) PCA 从人类起源阵列上基因分型的 60 个西欧亚种群的基因组变异推断出来(灰色点,地理区域用灰色标记),包括现代意大利人(没有轮廓的圆圈),我们将新报告的古代个体(符号有轮廓,不为非放射性碳测年的个体填充)和比较古老的种群(没有轮廓的星星)。( B )比较古老的个体和 20 个现代意大利中部 (TSI.SG) 的无监督混合 ( K = 11)。( C ) 无监督混合 ( K= 11) 新报告的古代个体,不包括遗传相关个体。WHG 和 CHG 指的是西部和高加索狩猎采集者,而 SW 和 NE 欧洲 分别指的是欧洲西南部和东北部。
在与第一个时间间隔相关的个体中,绝大多数(48 个中的 40 个)形成了一个名为“C.意大利-伊特鲁里亚的遗传簇,在主成分分析(PCA)中与当今的西班牙个体重叠,该分析是根据人类起源数据集(图 2A)构建的西欧亚群体。在这个时间间隔(公元前 800 到 1 年)中,确定了三组 PCA 异常值,即四个个体转向北非种群 (C.意大利-伊特鲁里亚.Afr),三个个体转向中欧种群 (C.意大利-伊特鲁里亚.Ceu) ,一个个体转向近东种群(C.意大利-伊特鲁里亚_MAS001)(表 S1A)。为了进一步检查所研究的意大利中部和南部种群的遗传聚类,我们对 71 个个体进行了无监督的 结合体(图 2,B 和 C) 排除遗传相关个体后(表 S1B 和图 S2)。C.意大利-伊特鲁里亚 个体拥有与安纳托利亚新石器时代农民、欧洲狩猎采集者和青铜时代来自 庞蒂克-里海 草原的牧民相关的三个遗传祖先。C.意大利-伊特鲁里亚.Ceu 具有更高比例的“草原相关血统”,而 C.意大利_MAS001 显示出伊朗新石器时代农民的遗传成分最大化。后者也存在于 C.意大利-伊特鲁里亚.Afr 个体中,以及在新石器时代早期摩洛哥群体中确定的祖先成分。
自从在新石器时代晚期和青铜器时代早期与草原相关的祖先传播到欧洲以来,与印欧语系的传播有关 ,并且与“草原”家园的语言学证据一致 ,我们试图正式估计与非印欧伊特鲁里亚语言相关的伊特鲁里亚人中草原相关血统的比例。我们首先将来自 C.意大利-伊特鲁里亚 集群(图 3A)的21 个日期和基因无关的个体分组,并用 qpAdm(P> 0.05)对其建模,将其作为草原相关血统的混合体,以俄罗斯西部(颜那亚)萨马拉的青铜时代牧民和意大利的新石器时代或铜器时代人群为代表(表 S4B)。该分析表明,大约 25% 的血统来自与这种远端草原相关的来源,当比较种群减少到比颜那亚人在时间和空间上更接近的种群时,这一比例达到了约 50%,例如中欧钟杯文化(图 3B))。此外,C.意大利-伊特鲁里亚 可以成功建模,因为它的整个祖先来自其他欧洲人群,例如来自意大利北部的早期钟杯群体和来自南欧(伊比利亚、克罗地亚和希腊)的铁器时代人群(表 S4A)。PCA 揭示了铁器时代和来自托斯卡纳和拉齐奥的罗马共和国个体之间的完全重叠,包括罗马古城 ,这表明,在铁器时代之前,与草原有关的祖先在多语言环境中广泛存在,并同质化,已知多语言环境中包括讲印欧语(即意大利语和凯尔特语)和非印欧语(即伊特鲁里亚语)的人。

图 3. 铁器时代和罗马共和国个体的遗传定位和建模。( A ) 来自铁器时代和罗马共和国的意大利个体的 PCA(带轮廓的符号)加上来自意大利的铜器和青铜器时代的个体以及 qpAdm 中使用的其他源种群(无轮廓的符号)。灰点代表当今的西欧亚个体(见图2A)。( B ) 用 qpAdm 估计的 C.意大利-伊特鲁里亚 和 C.意大利-伊特鲁里亚.Ceu 中草原相关血统的比例(表 S4B)。MN 和 EBA 分别指的是新石器时代中期和青铜时代早期。
本研究中确定的其他同时代祖先群体,虽然由少数个体代表,却为这张图片增加了细节和复杂性。两个与 C.意大利-伊特鲁里亚.Ceu 无关的个体(VET005 和 CAM002)的特征是与颜那亚相关的血统比例较高(40%),并且与来自中欧和南欧的铜石时代或青铜时代的欧洲群体一致,这些欧洲群体携带着高比例的草原相关血统(图 3,A 和 B,以及表 S4,A 和 B)。这个信号由确认˚F 4 t-统计˚F 4(昂格,测试; C.意大利-伊特鲁里亚.Ceu,C.意大利-伊特鲁里亚)(即显著负ž | 3 |得分>)时测试人群包括东部狩猎采集者 (EHG) 个体,约占颜那亚相关血统的一半(表 S2C)。这表明 EHG 与 C.意大利-伊特鲁里亚.Ceu 的亲和力高于与主要 C.意大利-伊特鲁里亚.Ceu 的亲和力,而当测试种群仅限于没有草原相关血统的南欧新石器时代群体时,观察到相反的情况。然后我们测试了C.意大利-伊特鲁里亚.Ceu 是否带有与当地血统混合的特征。f 3表 (C.意大利-伊特鲁里亚, Test ; C.意大利-伊特鲁里亚.Ceu) 的统计数据没有显示 C.意大利-伊特鲁里亚.Ceu 的证据是由 C.意大利-伊特鲁里亚 和 255 个古代测试中的任何一个混合产生的我们数据集中的人口(表 S3A)。此外,虽然可以将 qpAdm 中的 C.意大利-伊特鲁里亚.Ceu 建模为伊特鲁里亚相关个体和中欧 钟杯文化 的混合体(图 3B),但当 C.意大利-伊特鲁里亚.Ceu 移动到参考集时,该模型仍然成立,并且被新石器时代的人群所取代,这与传入的未在当地混合的北方血统一致(表 S4C)。最后,我们使用 DATES 软件估计了两个 C.意大利-伊特鲁里亚.Ceu 个体的混合日期。个体 VET005 导致不可行的日期(负值),而 CAM002 提供了 19.7 ± 8.6 代的混合日期,对应于个体日期(公元前七世纪)前572 ± 249 年。这些结果表明,两个测试的 C.意大利-伊特鲁里亚.Ceu 个体代表了一个新传入的祖先,这不是最近本地混合的结果。这些人来自两个不同的考古遗址,放射性碳测年代分别可以追溯到公元前 7 世纪和 3 世纪。因此,这种独特的祖先特征可能已经独立地从北部地区多次到达意大利中部,而不是持续几个世纪。
在 C.意大利-伊特鲁里亚.Afr 中分组的三个个体——在排除遗传异常值后(材料和方法,图 4A和表 S2A)——不能被建模为新石器时代相关和青铜时代相关欧洲血统的混合(表S4B)。这些人的历史可以追溯到公元前 300 年左右,在相距 100 公里以上的两个考古遗址(塔奎尼亚和维图洛尼亚)中被挖掘出来。f 3 (C.意大利-伊特鲁里亚, X; C.意大利-伊特鲁里亚.Afr) 和f 4形式的统计数据(Onge, X, C.意大利-伊特鲁里亚, C.意大利-伊特鲁里亚.Afr) 显示C.意大利-伊特鲁里亚.Afr 是伊特鲁里亚人和古代或现代人(作为代理人)的混合体,他们携带着高比例的北非或撒哈拉以南地区祖先(表 S2、B 和 C,以及 S3、A 和 B)。使用 qpAdm,包括 C.意大利-伊特鲁里亚作为来源之一的所有混合物模型都被拒绝(表 S4D)。然而,鉴于来自北非的具有可比年龄的基因组的可用性有限,我们警告说,随着来自该地区的更多数据可用,祖先比例可能会更正确地估计。

图 4. 铁器时代和帝国时期个体的遗传定位和建模。( A ) 从铁器时代到帝国时期的意大利个体的 PCA(带轮廓的符号)加上青铜器和铁器时代的个体(无轮廓的符号)用作 qpAdm 中的源种群。灰点代表当今的西欧亚个体(见图2A)。( B ) 铁器时代异常值组和 C.意大利-帝国 中 C.意大利-伊特鲁里亚 血统的比例,用 qpAdm 估计。对于每个测试,报告的非 C.意大利-伊特鲁里亚群体是提供最接近所有拟合模型中位数的比例的群体(表 S4D)。MBA、MLBA 和 LBA 分别指青铜器时代中、中晚期和晚期,IA 指铁器时代。
与之前报道的青铜时代西西里岛和铁器时代撒丁岛 的发现相反,我们没有在意大利中部 2000 年以上的个体中发现与伊朗相关的血统的证据(图 S3)。我们能够将C.意大利-伊特鲁里亚和 C.意大利-伊特鲁里亚.Ceu 建模为三个远端来源 [安纳托利亚新石器时代、西方狩猎采集者 (WHG) 和 颜那亚_萨马拉] 的混合体,即使新石器时代的伊朗人被置于 qpAdm 的参考集中(表S4H)。这表明青铜器和铁器时代西西里人和撒丁岛人的遗传历史与意大利大陆上的群体有很大不同,考古记录中观察到的独特的相互作用领域证实了这一点。C.意大利-伊特鲁里亚_MAS001 个体代表了我们数据集中的一个例外,显示 PCA 空间向近东人口约公元前 200 年的转变(图 4A)。虽然f 统计并没有显着拒绝与C.意大利-伊特鲁里亚 集群的祖先连续性(表 S2C),但新石器时代和草原相关祖先之间的混合模型不适合该个体的遗传特征(表 S4B)。相反,C.意大利-伊特鲁里亚_MAS001 可以被建模为 C.意大利-伊特鲁里亚 集群和来自高加索地区的人口之间的混合体,例如青铜时代的亚美尼亚人(图 4B),这表明至少到公元前二世纪,伊特鲁里亚有伊朗相关血统的零星存在公元前世纪。
在第一个千年的前半段,我们观察到所有研究个体的 PCA 空间显着向近东基因转移(图 4A),分布在当今东南欧人群占据的遗传空间中。我们将公元 1 年到 500 年之间的非异常个体分组到“C.意大利-帝国”集群(表 S2A)中。正式f 4- 测试显示它比 C.意大利-伊特鲁里亚 与来自伊朗、非洲和近东的古代群体有更高的亲和力(表 S2C)。然后我们使用 qpAdm 来量化这个群体的祖先成分,其中 C.意大利-帝国被建模为来源 C.意大利-伊特鲁里亚 和 158 个已发表的来自青铜器和铁器时代的欧洲和近东基因组的混合物。因此,发现最适合数据的模型是来自黎凡特或安纳托利亚种群对本地/预先存在的C.意大利-伊特鲁里亚基因库贡献 38% 至 59% 的模型(图 4B和表 S4D)。在罗马帝国时期的古代个体中也报告了来自东地中海的大量基因流动。尽管我们从公元前五个世纪的数据点数量有限,但新结果表明罗马非本地血统的贡献大于伊特鲁里亚(图 4A)。然而,帝国时期传入群体的这种大规模遗传影响不仅限于罗马周围的大都市区,而且还扩展到这里所考虑的邻近和更远的地区。
关于我们古代基因组横断面的最后一个时间间隔(公元 500 到 1000 年),我们观察到,与 C.意大利-帝国相比,归入“中世纪早期的意大利人”集群的个体通常向中欧群体转移,并且在很大程度上与现在-来自意大利中部 (TSI.SG) 的现代种群有很大重叠(图 5A)。使用f 4测试,我们可以证明,与C.意大利-帝国 相比,中世纪早期的意大利人 对东地中海人口的亲和力降低证实了这种转变(表 S2D)。此外,中世纪早期的意大利人 集群可以在 qpAdm 中成功建模为之前的C.意大利-帝国组与来自北欧和东欧的古代晚期或中世纪组(在测试的 59 个种群中)的混合,估计比例为 60 到 90 % 和 10% 到 40%,分别(表 S4E)。值得注意的是,受支持最多的模型是那些以与来自匈牙利和意大利北部的伦巴德人 墓地相关的个人为特色的模型。如果我们专门将分析限制在那些携带未混合的北欧遗传血统 (皮埃蒙特_N.伦巴德人) 的伦巴德 相关个体,那么我们将获得对C.意大利_中世纪早期集群的约 20% 的贡献(图 5B)。这一发现与隆巴德时期意大利中部的北欧血统的遗传输入一致。然而,意大利其他日耳曼部落(如东哥特人)的影响也可能增强了观察到的基因组转变。

图 5. 中世纪早期和现代个体的基因定位和建模。( A ) 从帝国时期到中世纪早期的意大利人(带轮廓的符号)和现代意大利人(无轮廓的符号)的 PCA。灰点代表当今的西欧亚个体(见图2A)。(B)用 qpAdm 估计的中世纪早期的意大利人中 伦巴德 相关个体的北方血统比例(表 S4E)。( C ) 现代意大利中部 (Tuscan.DG) 和意大利南部的 中世纪早期的意大利人和 S.意大利南部 血统的比例,分别用 qpAdm 估计(表 S4G)。
由于现代意大利中部人在 PCA 空间中与中世纪早期的意大利人个体在很大程度上重叠(图 5A),我们测试了源自后者的前一组的一致性。为了提高分辨率,qpAdm 在参考集中的当今世界人口中实施。没有现代意大利人口与源自 中世纪早期的意大利人 集群(P值低于 0.05)一致,尽管来自托斯卡纳 (Tuscan.)  的高覆盖基因组没有产生强烈拒绝遗传连续性的理由(P = 0.02)(图5C和表 S2E 和 S4G)。这表明当今意大利中部群体的基因构成至少在公元 1000 年左右形成。为了调查是否在来自意大利南部的同时代人中观察到类似的情况,对来自巴西利卡塔韦诺萨的中世纪早期考古遗址的数据进行了类似的分析。除 VEN002 外,所有 维诺萨 个体 (S.意大利南部) 在 PC 空间中与现代意大利南部人群广泛重叠,并且可以在 qpAdm 中联合建模为源自同一祖先流(P = 0.42)(图 5, A 和 C )。在 PCA 空间中,来自罗马的大多数中世纪和早期现代个体处于托斯卡纳和巴西利卡塔的中世纪早期群体之间的中间位置(图 5A)。因此,这种分布与当前反映地理的南北遗传梯度一致图S4),意大利弥补了欧洲和东地中海之间的遗传差异。
为了研究性别偏见在这些基因组转化中的潜在影响,我们计算了单亲标记随时间变化的频率。mtDNA 多样性在公元 1 年之前和之后似乎没有显着变化(图 S5A)。相比之下,新报告的公元前 800 至 1 年的意大利中部个体显示出约 75% 的 Y 染色体单倍群 R1b 频率,主要以 R1b-P312 多态性及其衍生的 R1b-L2 为代表,与钟杯文化 综合体相关的草原血统一起扩散到欧洲各地。这表明,这种 R1b Y 染色体谱系在青铜时代通过与草原相关的运动传播到意大利半岛。在第一个千年 CE 中,随着近东相关 Y 染色体谱系(例如 J)的出现率更高,其频率降低到约 40%(图 S5B)。虽然我们不能排除大量的女性流动性,但 Y 染色体单倍群频率的显着变化表明男性流动性在从帝国时期开始观察到的基因转变中发挥了重要作用。
讨论
对来自托斯卡纳、拉齐奥和巴西利卡塔的跨越约 2000 年意大利历史的 82 个古代个体的基因组分析揭示了遗传转化的主要事件。在我们意大利中部时间横断面的第一个区间(公元前 800年 到 公元前1 年),大多数个体形成了同质遗传簇(C.意大利-伊特鲁里亚),这表明具有追溯到其他地区的祖先的个体的零星存在并没有留下大量的局部遗传遗产。特别是,与之前的建议相反,与伊特鲁里亚相关的基因库似乎并非源自近东最近的人口流动。尽管两个相邻群体之间存在文化和语言差异,但伊特鲁里亚人携带着与其他邻近人群共享的本地遗传特征,例如来自罗马及其周边地区的拉丁人(表 S2F)。C.意大利-伊特鲁里亚 基因图谱的很大一部分可归因于与草原相关的血统,这证实了在大多数其他欧洲地区观察到的趋势,即该基因成分在青铜时代也到达意大利中部,但早于到达撒丁岛。由于估计原始意大利语和后裔语言(例如拉丁语、奥斯坎语和翁布里亚语)之间的分裂发生在公元前第二个千年,因此它们在意大利的存在与至少一千年前颜纳亚语相关群体离开大草原的运动没有直接关系。取而代之的是,假设与草原相关的群体是印欧语系最初进入欧洲的原因,更进化的印欧语形式,包括斜体,可能会在后期传播到整个意大利。迄今为止,从意大利北部测序的唯一三个与钟杯复合体相关的个体可追溯到公元前 2000 年左右,揭示了草原相关祖先的非普遍存在,这表明混合过程正在进行中。
历史记载的伊特鲁里亚非印欧伊特鲁里亚语言的持续存在表明,尽管存在大规模混合,这种语言社区仍然得以维持,这种情况类似于伊比利亚的巴斯克地区,在那里非印欧语言今天仍然存在。这种语言的持久性,加上基因的更替,挑战了基因等同于语言的简单假设,并提出了一个更复杂的场景,可能涉及伊特鲁里亚语言社区对(早期)意大利语使用者的同化,可能是在公元前二千年长期的混合期间。最近发现早在公元前 1650 年就在意大利中部与草原相关的血统,随后随着时间的推移,这一部分的增加,使这一假设变得可信。尽管伊特鲁里亚语被认为是一种残存的语言,它在意大利中部一直存在到帝国时期,但它并不是孤立的。取而代之的是,伊特鲁里亚语似乎与 Rhaetic(一种记录在阿尔卑斯山脉东部的一种语言,古代历史学家声称是从波谷迁移的人群中)和利姆诺斯语(一种在爱琴海的古代 利姆诺斯岛上被假定使用的语言)有关。这留下了一个问题,即这些神秘的“提尔森语”语言是否可能以某种方式与地中海东部的海上扩张有关。然而,在C.意大利-伊特鲁里亚 中缺乏与伊朗相关的血统也可能表明,横跨地中海两岸的密切语言亲缘关系可能代表了离开意大利半岛的人口流动。
我们数据集中具有非本地遗传特征的最早个体是采用放射性碳测年 可追溯到公元前 7 世纪的 (CAM002),并表现出欧洲中部的遗传特征。在早期铁器时代,与凯尔特人相关的群体相关的哈尔施塔特文化占据了阿尔卑斯山以北的地区。尽管有考古证据表明,从公元前 8 世纪开始,伊特鲁里亚文明与北方文化群体之间进行了商品和技术交流,但后来才报道了广泛的直接接触,即在拉特纳文化阶段,当时与凯尔特人相关的群体传播到意大利北部伊特鲁里亚领土。在提供的数据集中,我们发现了另一个采用放射性碳测年可追溯到公元前三世纪的个体 (VET005) ,其基因图谱与个体 CAM002 重叠,尽管它们的放射性碳年龄相差约 400 年。这表明从哈尔施塔特到拉特纳文化时期在伊特鲁里亚零星发现的中欧遗传祖先的来源具有连续性。
在公元前最后四个世纪,我们发现具有非本地遗传血统的个体的比例高于前四个世纪,这表明与近东和北非的亲缘关系最大。这可以通过伊特鲁里亚和其他地区之间增加的相互联系来解释,不仅对于那些与港口相关的社会,也包括内陆地区的社会。在维图洛尼亚 (VET) 的圣日耳曼诺考古遗址 (VET) 观察到这种跨大陆连通性的一个标志性案例,即使在同一个墓穴中,也有明显的遗传转变,从公元前 8 世纪到 6 世纪的本地遗传图谱到公元前四至三世纪的中欧和北非相关血统。在后一时期,在来自遥远地点 [Tarquinia (TAQ)] 的另外两个个体中观察到类似的北非遗传信号。虽然需要更多来自这个时间范围的数据来确定这些发现是否代表一种普遍现象,但这个祖先的到来可能受到迦太基帝国跨地中海扩张的影响。
然而,公元前第一个千年的绝大多数个体,从后维拉诺万时期到罗马共和国结束的 800 多年里,都表现出很大程度的遗传连续性。虽然在伊特鲁里亚,我们没有检测到对中欧血统的亲和力增加,但我们无法排除在具有相似遗传特征的人群之间的邻近地区发生混合的可能性,例如与拉丁语相关群体(表 S2F)。然而,伊特鲁里亚近一千年来显着的遗传稳定性与历史记录相符,历史记录将其与罗马共和国的同化描述为一个政治过程而非人口过程,进一步证明了该地区伊特鲁里亚文化及其语言在该地区得以维持几个世纪。
与此形成鲜明对比的是,所有分析过的罗马帝国和古代晚期(公元 1 至 500 年)的个体都显示出血统向东地中海人口的显着转变。虽然这种转变的强度可能会受到不同埋葬方式(例如火葬和土葬)随时间变化的频率的影响 ,但它清楚地描述了罗马帝国在社会经济和地理流动性增强的时代,在大规模人口迁移中的作用。在意大利中部,包括罗马周围,到目前为止检测到的外来祖先主要来自近东,而不是帝国的其他地区。大约 50% 的先前伊特鲁里亚相关基因库的基因替换可能受到奴隶和士兵流动的影响,以及人类从东地中海到意大利流动的更大模式。在罗马帝国,公民身份逐渐扩展到更多类别的自由人,直到 212 年的卡拉卡拉敕令使其在他们中间普及,而扩大公民身份很可能促进了当地和其他人群之间的混合。我们来自伊特鲁里亚的新数据表明,近东血统的涌入远远超出了大首都地区本身,并表明这种更广泛的人口流动模式可能影响了意大利半岛的大部分地区。
继续我们的基因组横断面进入中世纪早期(公元 500 至 1000 年),我们观察到一些前伊特鲁里亚地区,通过北欧相关血统的传播发生了额外的遗传转变。混合模型与从先前发表的与伦巴德文化相关的个人引入的这种遗传成分一致,尽管其他文化群体也可能做出了贡献。因此,在西罗马帝国崩溃和伦巴德王国建立后,定居者在意大利半岛的大部分地区扩张,可能对意大利中部的遗传结构产生了可追溯的影响。最后,我们的分析发现,从中世纪早期到今天,托斯卡纳、拉齐奥和巴西利卡塔地区的人口具有广泛的连续性,这表明今天意大利中部和南部人口的主要基因库基本上形成于至少1000年前。
总之,我们的研究揭示了意大利族群历史的五个主要方面。首先,尽管说非印欧语言,但与伊特鲁里亚文化相关的个体具有很高比例的草原相关血统。如果伊特鲁里亚语言确实是青铜器时代扩张之前的遗存语言,那么尽管存在广泛的遗传不连续性,它仍将代表语言连续性的罕见例子之一 。伊特鲁里亚人的草原相关血统可能是由青铜时代的印欧人介导的,可能是通过长时间的混合过程导致部分语言转变。其次,在青铜时代混合之后,尽管可能有近东、北非和中欧血统的个体零星存在,但与伊特鲁里亚相关的基因库在近 800 年中大致保持同质性。第三,在罗马帝国时期,东地中海血统取代了大部分与伊特鲁里亚相关的基因谱。第四,在中世纪早期,来自北欧血统的大量遗传输入被引入,可能是通过日耳曼部落传播到意大利半岛。第五,今天意大利中部和南部人口的基因组成在第一个千年前基本上已经形成。
尽管需要对整个意大利的 aDNA 进行更广泛的地理分析来证实上述结论,但在托斯卡纳和拉齐奥北部观察到的与罗马市及其周边地区报告的极为相似的血统变化表明,公元第一个千年期间的历史事件确定了意大利半岛延伸部分的大规模基因转化。在伊比利亚,在铁器时代和现代人口之间也观察到了类似的更替。这表明罗马帝国可能对南欧人的基因图谱留下了持久的人口贡献,弥合了欧亚大陆西部基因图谱上欧洲和近东群体之间的差距。来自帝国其他地区的其他考古学数据集对于更好地确定传入群体的遗传起源和辨别区域特定的混合模式至关重要。
材料和方法
考古取样
本项目中分析的考古材料来自不同的收集活动。所有标本都是在获得处理考古样本的适当机构的批准和/或与本研究作者中列出的当地科学家和策展人合作的情况下进行采样的。来自 Chiusi (Siena) 的样本集来自佛罗伦萨大学人类学和民族学博物馆,由合著者 MZ 策展 来自 Tarquinia (Viterbo) 的样本集来自莱比锡大学解剖研究所,由合著者 HF 策展来自 Venosa (Potenza) 的样本来自意大利文化遗产部 (Mi-BACT) 罗马文明博物馆,由合著者 LB 和后来的合著者 AS 在采样时策划 Casenovole (Grosseto) 的一组样本来自 Soprintendenza per i Beni archeologici della Toscana (prot. 0002442 16/02/2015, CI. 34.16.04/301)。来自 Poggio Renzo(锡耶纳)的一组样本来自 Soprintendenza per i Beni archeologici della Toscana(prot. 000954 22/06/2016,CI 34.16.04/280)。来自 Campiglia dei Foci(锡耶纳)、托斯卡纳的 Magliano(格罗塞托)、Marsiliana d'Albegna(Le Pianacce,格罗塞托)和沃尔泰拉(比萨)的样本集来自皮斯托亚佛罗伦萨的考古、美术和景观监管局和 Prato,在采样时由合著者 EP 和后来的合著者 AR 策划 来自 Marsiliana d'Albegna (Poggio di Macchiabuia, Grosseto) 的样本来自锡耶纳大学历史与文化遗产系,由合著者 AZ 策划 Chiostraccio 洞穴的样本来自锡耶纳大学的史前史和人类学收藏,由合著者 SR 策划 Vetulonia (Grosseto) 和 Poggio Pelliccia (Grosseto) 的样本集来自历史、考古学、地理、艺术和娱乐系佛罗伦萨大学,由 LC 管理,用于识别和获取锡耶纳和格罗塞托省史前材料数据的授权被 Soprintendenza per i Beni archeologici della Toscana(prot. 10413 20)授予物理科学、地球和环境系/06/2011,CI. 34.31.01/53-43)。有关分析的位点和样本的更详细描述,请参阅补充文本和表 S1A。来自 Vetulonia (Grosseto) 和 Poggio Pelliccia (Grosseto) 的一组样本来自佛罗伦萨大学历史、考古、地理、艺术和娱乐系,由 LC 授权策划,用于识别和获取各省史前材料的数据锡耶纳和格罗塞托的物理科学、地球和环境系由 Soprintendenza per i Beni archeologici della Toscana (prot. 10413 20/06/2011, CI. 34.31.01/53-43) 授予。有关分析的位点和样本的更详细描述,请参阅补充文本和表 S1A。来自 Vetulonia (Grosseto) 和 Poggio Pelliccia (Grosseto) 的一组样本来自佛罗伦萨大学历史、考古、地理、艺术和娱乐系,由 LC 授权策划,用于识别和获取各省史前材料的数据锡耶纳和格罗塞托的物理科学、地球和环境系由 Soprintendenza per i Beni archeologici della Toscana (prot. 10413 20/06/2011, CI. 34.31.01/53-43) 授予。有关分析的位点和样本的更详细描述,请参阅补充文本和表 S1A。Soprintendenza per i Beni archeologici della Toscana (prot. 10413 20/06/2011, CI) 授权从锡耶纳和格罗塞托省的史前材料中识别和获取数据34.31.01/53-43)。有关分析的位点和样本的更详细描述,请参阅补充文本和表 S1A。Soprintendenza per i Beni archeologici della Toscana (prot. 10413 20/06/2011, CI) 授权从锡耶纳和格罗塞托省的史前材料中识别和获取数据34.31.01/53-43)。有关分析的位点和样本的更详细描述,请参阅补充文本和表 S1A。
aDNA 样品处理和质量控制
本研究中分析的骨骼样本在德国耶拿马克斯普朗克人类历史科学研究所 (MPI-SHH) 的专用洁净室设施中进行处理;德国蒂宾根大学;和意大利佛罗伦萨大学。在采样之前,样本进行了显微 CT 扫描和/或照片记录,作为处理工作流程记录的一部分。如 Pinhasi等人的工作所述,通过使用电锯切割岩骨并在耳蜗周围最密集的区域钻孔来对颞骨的岩骨部分进行采样。通过从牙根尖端向牙冠钻孔或沿牙根和牙冠之间的连接处锯开并直接在牙髓腔内钻孔来取样牙齿。按照既定的方案从大约 50 到 100 毫克的骨头或牙粉中提取 DNA 。每个提取批次中都包括阴性和洞穴熊阳性对照。将样品在 1 ml 提取缓冲液 [0.45 M EDTA (pH 8.0) 和蛋白酶 K (0.25 mg/ml)] 中在 37°C 下孵育至少 16 小时,在某些情况下,在 56°C 下再孵育 1 小时。悬浮液离心,上清液首先转移到含有盐酸胍的结合缓冲液中,然后转移到硅胶柱(高纯病毒核酸大容量试剂盒,罗氏),如 Korlević等人的工作所述。使用洗涤缓冲液(高纯病毒核酸试剂盒,罗氏)进行两次洗涤后,将 DNA 在 EBT 缓冲液 [10 mM tris-Cl (pH 8.5) 和 0.05% Tween 20] 中分两轮洗脱,最终体积为 100微升。双链和双索引的Illumina DNA文库从20至25微升的每个提取物,以下以前公开的方案(制备55,56)。对于大多数样品(表 S1A),使用尿嘧啶-DNA-糖基化酶处理(UDG-half)保留或部分去除由 DNA 损伤引起的脱氨基胞嘧啶,该处理在末端的 5' 和 3 个核苷酸中保留了特征性的 aDNA 损伤模式DNA片段的'末端,而对于一个样品(UDC_P),那些被完全去除(UDG-full)。在每次实验的同时进行阴性和阳性对照。使用 IS7/IS8 引物 和 LightCycler 480 (Roche) 上的 DyNAmo SYBP Green 定量聚合酶链反应 (qPCR) 试剂盒 (Thermo Fisher Scientific)。随后,通过使用 PfuTurbo DNA 聚合酶(安捷伦科技)的 10 个循环 PCR 反应,使用独特的索引组合 [每个长度为 8 个碱基对 (bp)] 对文库进行双重索引。扩增后,索引产物在 MinElute 柱(Qiagen)上纯化,在 50 μl EBT 缓冲液中洗脱,并按照上述方法用 IS5/IS6 引物定量。然后将索引文库扩增到总共 10 13使用 Herculase II Fusion DNA 聚合酶 (Agilent Technologies) 和 IS5/IS6 引物组在每个反应中复制 DNA。在另一轮纯化之后,使用 D1000 试剂盒(TapeStation 核酸系统,Agilent 4200)在TapeStation 系统上对每个扩增的文库进行定量。然后准备所有文库的 10 nM 等摩尔池用于鸟枪测序。使用单端配置(1 × 75 + 8 + 8 个循环)在 Illumina HiSeq 4000 仪器上对合并的双索引文库进行了约 500 万次读取循环的深度测序。还汇集了从空白制备的文库,并在 Illumina NextSeq500 平台上对末端(2 × 50 + 8 + 8 个循环)鸟枪法进行了测序。使用 EAGER v1.92.59  评估人类内源性 DNA 的数量和质量。选择显示内源性 DNA 百分比 > 0.1% 并且分别在 5' 和 3' 片段末端存在典型 CtoT 和 GtoA 替换的样本,以富集约 390,000 或约 124 万个全基因组信息 SNP ,遵循已建立的溶液中捕获富集分析(分别为 390K 或 1240K 捕获)(60)。一个个体 (UDC_P) 被直接用鸟·枪测序。在捕获之前,所选文库用 IS5/IS6 引物进一步扩增,以达到 200 至 400 ng/μl 的 DNA 浓度,随后使用 NanoDrop 分光光度计(Thermo Fisher Scientific)进行定量。此外,全mtDNA捕获用于核捕获富集后人类线粒体基因组覆盖率低的样品。不同富集策略产生的捕获 DNA 产物在 Illumina HiSeq 4000 平台上进行单端或双端测序。
放射性碳测年
对于选择进行放射性碳测年的 50 个个体(图 1B和表 S1A),通常将低于 1 克岩骨或牙齿的样本发送到德国曼海姆的 CEZ Archaeometry gGmbH。从标本中提取胶原蛋白,通过超滤纯化(部分,> 30 kDa),冷冻干燥,并在元素分析仪中燃烧成 CO 2。CO 2催化转化为石墨。测年是使用 Klaus-Tschira-Archäometrie-Zentrum 的 MICADAS-AMS 进行的。所得的14 C 年龄被归一化为 d 13 C = -25% 并使用 SwissCal 1.0 软件使用INTCAL13 数据集进行校准。
量化和统计分析
后测序数据处理
测序文库被解复用,允许每个索引中最多有一个不匹配,并通过 EAGER 管道 (v1.92.59) 进行预处理。我们使用 AdapterRemoval (v2.2.0)剪切了适配器序列并丢弃了短于 30 bp 的单端读数。使用此工具,我们还通过仅保留具有至少 10 bp 重叠区域的读取对来执行配对末端测序数据的合并。随后使用 BWA (v0.7.12) 将序列映射到人类参考基因组hg19,禁用播种选项,严格参数设置为 0.01,映射质量过滤器为 30。然后使用 DeDup (v0.12.2) 去除克隆分子,它考虑读取的开始和结束坐标来识别和丢弃相同的序列。
aDNA的认证
在基因型调用之前,我们估计了线粒体和核基因组中的污染水平,以使用下述多种方法验证检索到的 DNA。还分析了提取和文库制备空白,以控制实验室步骤中潜在的背景污染。(i) 使用 mapDamage2.0。我们检查了 aDNA 典型特征的存在,因为 DNA 序列的平均长度较短(~40 到 70 bp)和分子末端位置错误编码病变的比例增加。(ii) 通过计算归一化 X 比(靶向 X 染色体 SNP 的覆盖率/靶向常染色体 SNP 的覆盖率)和 Y 比(靶向 Y 染色体 SNP 的覆盖率/靶向常染色体的覆盖率)推断每个个体的遗传性别SNP)。为了去除可能源自 aDNA 损伤的替换,我们修剪了每次读取的前两个和最后两个位置(UDG 完整库的一个位置)并对新生成的 BAM 文件进行性别确定。未受污染标本的预期结果是女性的 X 比 ~ 1 和 Y 比 ~ 0,男性的 X 和 Y 比 ~ 0.5。处于男性和女性中间位置的个体被分配到未确定的性别并表明存在 DNA 污染。ANGSD (v0.910, 方法 1) 接下来在男性个体上运行,通过测量在 X 染色体的多态性位点上观察到的杂合率,在考虑可能是单态的侧翼区域的测序错误后,估计核污染。X 染色体污染水平低于 6% 和至少 140 个 X 染色体 SNP 覆盖两次的所有男性样本都被认为适合进一步分析。(iii) 使用 schmutzi(参数:-notusepredC –uselenght)对男性和女性进行了人类线粒体污染测试,它迭代地确定内源性 mtDNA 序列,同时还根据现代潜在欧亚污染物丝裂基因组的比较数据库估计人类线粒体污染。对于与核 DNA 相比,mtDNA 分子比例相对较低的个体(mt/核 DNA 比率 < 200),mtDNA 污染估计值(低于 5%)被认为是核污染的可靠指标。由于高污染水平(ETR015 和 CSN012)或无法覆盖足够多的 SNP 以进行可靠的基于个体的分析,例如 PCA(ETR004 和 VET011),因此在本研究中报告的 86 个个体中有 4 个被排除在群体遗传分析之外。超过 31,000 个 SNP 覆盖在 1240K 面板上,而 Affymetrix Human Origins 面板上覆盖了大约一半(~600K SNP)(表 S1A)。
基因分型并与数据集合并
为了减少下游分析中脱氨基引起的错误掺入的影响,对非 UDG 和 UDG 半文库的每次读取末端修剪 2 bp 和 UDG 全文库修剪 1 bp 后生成的 BAM 文件进行基因分型. 通过在高质量碱基(Phred-scaled 碱基质量得分≥ 30)之间进行随机等位基因调用,与至少覆盖一次的每个 390K 或 1240K SNP 位置对齐(https:// github.com/stschiff/sequenceTools)。随后,基因分型数据与 Human Origins 面板、来自 Simons 基因组多样性项目  的 1240K 数据集以及数据集 v37 中报告的古代个体合并,可在https://reich.hms.harvard.edu,加上增加相关古种群。
亲属关系
为了避免将密切相关的个体分组到一个群体中造成的偏差,我们为每对独特的个体计算了所有常染色体 SNP 的平均配对错配率 (PMR),对于被比较的两个个体,至少覆盖一次 。因此,PMR 用于计算相关系数为 α = ((PMR 无关-PMR 对)/PMR 相同)。α > 0.2 的配对被认为是一级或二级相关的,对于每对,只有具有较高 SNP 数量的个体被保留用于群体遗传分析。通过 mtDNA 和 Y 染色体单倍群评估确认了建议的遗传亲缘关系。两对来自维图罗尼亚的样本,即VET006-VET009和VET003-VET004,被发现属于一个个体;因此,他们的数据被合并(表 S1B)。此外,我们在 Venosa 发现了多达四个个体的四个家庭集群,在 Tarquinia 发现了两个三个个体的家庭集群,以及 Casenovole 的四个成年个体之间的亲属关系(图 S2)。
群体遗传分析
主成分分析
我们使用来自 EIGENSOFT 包 (v16000)的软件 smartpca来计算西欧亚PCA,使用人类起源数据集的 50 个现代人群进行基因分型。我们使用选项 lsqproject: YES 将具有超过 15,500 个重叠 SNP 的古代个体投影到 PC1 和 PC2 上。此外,由于个体的数量远低于 SNP 的数量,估计的主要分数往往有偏差,表现出向 0 ( 28 )的回归。为了在预测 PC 分数时纠正这种收缩效应,我们在 smartpca 中选择了参数“shrinkmode: YES”(图 2A、3A、4A和5A)。
为了更精细地探索所研究的古代个体的基因组成如何与当今意大利人群的基因组变异性相关,我们将我们的数据与之前发布的意大利个体全基因组数据集。该数据集由 737 个在 Illumina(美国加州大学圣地亚哥分校)CoreExomeChip v.1.1 阵列上进行基因分型的个体组成。这些个体被选为代表 20 个意大利省(即,出生在同一省内的四个祖父母)均匀分布在整个半岛和两个主要岛屿(撒丁岛和西西里岛;图 S4)。PCA 是在现代意大利个体上计算的,包括 CoreExomeChip 和 1240K 捕获面板之间重叠的 168,649 个 SNP。然后用之前详述的相同方法将古代个体投影到这个 PCA 空间。
混合物
在删除了超过 99% 缺失数据的个体、遗传相关个体和非欧洲古代个体后,我们在人类起源数据集上以无监督模式运行聚类算法 ADMIXTURE 。此外,我们从撒丁岛  中删除了所有前 Nuragic 古代个体,以防止古代撒丁岛人在低K值下最大化组件。我们从 1000 基因组项目 (TSI.SG) 中随机选择了 20 个当今托斯卡纳人的子集,共 4118 个人。在基于连锁不平衡 (LD) 的 SNP 修剪 (--indep-pairwise 200 25 0.2) 之后,我们对 3 到 16 之间的 K 进行了五次独立运行。在图 2(B 和 C)中,我们报告 K = 11,它在 K = 13 之后具有第二低的交叉验证误差,其中伊朗新石器时代和草原相关血统在两个不同的部分被区分的可能性最低。
F-统计量
F 3 - f 4统计数据是使用 ADMIXTOOLS 套件 ( https://github.com/DReichLab ) 在 1240K 数据集上计算的。F 4统计最初用于将遗传组定义为f 4(Onge.DG、X、Cluster、Individual),其中X是西欧亚遗传变异的基石 [WHG、安纳托利亚_N、Mocor_EN、Mocoroc_Iberomaurusian、俄罗斯_颜那亚_萨马拉、Iran_Ganj_Dareh_N 和 EHG (三个 Karelia_HG、一个萨马拉_HG 和一个 Popovo)] 和集群是来自 PCA 空间中密切相关的相同时间间隔的个体(C.意大利-伊特鲁里亚、C.意大利-帝国、意大利南部、C.意大利-中世纪早期 和C.意大利-伊特鲁里亚.Afr)。个体MAS001、VEN002、ETR014 和 VET006.9 提供了至少一项与 Zscore > |3| 的比较 并且像 UDC_P 一样单独分析,这是唯一一个通过鸟枪测序而不是通过捕获产生全基因组数据的个体(表 S2A)。
C.意大利-伊特鲁里亚 与 29 个现代非洲、欧洲和近东种群或 256 个古代西欧亚和非洲种群之间的混合物的存在最初是用统计量f 3测量的(C.意大利-伊特鲁里亚,现代和古代种群;测试) 其中Test是 C.意大利-伊特鲁里亚.Ceu、C.意大利-伊特鲁里亚.Afr、C.意大利-帝国 和 C.意大利-中世纪早期(表 S4,A 和 B)。类似地,我们确定C.意大利-伊特鲁里亚和C.意大利-帝国是否与形成具有进化枝一致测试在˚F 4(Onge.DG,现今和古种群; C.意大利-伊特鲁里亚/ C.意大利-帝国,测试)(表 S2,B 到 D)。对于我们数据集中最年轻的集群(C.意大利-中世纪早期 和 意大利南部),该测试与f 4的当今种群(Onge.DG,现代种群;C.意大利-中世纪早期/意大利南部 Y ),其中Y是来自意大利和希腊的当今人口(Bergamo.DG、Tuscan.DG、Greek.DG 和 TSI.SG)(表 S2E)。
在从 安东尼奥等人的工作中描述的每个组中去除 PCA 异常值后,使用f 4统计量与来自古罗马的个体进行比较。(表S2F)。为了检查罗马的新石器时代和铜器时代的个体是否更接近罗马或托斯卡纳/拉齐奥北部的铁器时代和共和国时期的个体,我们进行了f 4 (Onge.DG, Rome_Neolithic/Rome_CopperAge; C.意大利-伊特鲁里亚_UDC_P, Rome_Iron_Republic)。此外,我们评估了来自罗马的新石器时代、铜器时代和铁器时代/共和国时期的个体是否对C.意大利-伊特鲁里亚 集群更具亲和力,该集群分为罗马共和国前和后罗马共和国(分别为 preRR 和 postRR),f 4(Onge.DG、Rome_Neolithic/Rome_CopperAge/Rome_Iron_Republic;C.意大利-伊特鲁里亚_preRR、C.意大利-伊特鲁里亚_postRR)。此外,我们测试了 C.意大利-伊特鲁里亚 集群是否更接近来自罗马的铁器时代个体,这些个体与f 4的伊特鲁里亚文化或拉丁文化相关(Onge.DG,C.意大利-伊特鲁里亚;罗马_铁器时代_拉丁语,罗马_铁器时代_伊特鲁里亚)。最后,用f 4 (Onge.DG, 罗马_铁器_共和国; C.意大利-伊特鲁里亚, 集群 ) (表 S2F)证实了 罗马_铁器_共和国 和 C.意大利-伊特鲁里亚之间的最高亲和力而不是此处鉴定的其他意大利中部遗传簇。
qpAdm 建模
在 1240K 数据集上使用 qpAdm v810 软件测试两个种群是否一致(P值高于 0.05)与一组参考组同等相关或模拟由两个源种群(分别为单向和双向混合)混合产生的一个种群。最初,所有来自铁器时代和意大利中部共和国时期新产生的基因簇(C.意大利-伊特鲁里亚、C.意大利-伊特鲁里亚.Afr、C.意大利-伊特鲁里亚.Ceu、C.意大利-伊特鲁里亚_MAS001 和 C.意大利-伊特鲁里亚.Afr_VET006.9)都被完全测试为衍生来自同时代或更古老的西欧亚人群(青铜时代和铁器时代的 145 个古代群体)与一组 15 个参考群体(Ethiopia_4500BP.SG、Ust_Ishim_HG.DG、俄罗斯_Kostenki14、Belgium_GoyetQ116_1、Czech_Vestonice16、Estate_GillasGilla_SGMA16 Iran_Ganj_Dareh_N、Jordan_PPNB、Israel_Raqefet_M_Natufian、摩洛哥_Iberomaurusian、安纳托利亚_N、德国_LBK_EN、和 俄罗斯_颜那亚_萨马拉)(表 S4A)。之后,相同的群体被建模为之前发表的来自意大利的新石器时代到青铜器时代个体与 俄罗斯_颜那亚_萨马拉 或 Germany_Bell_Beaker 之间的双向混合(表 S4B)。重复该测试,将C.意大利-伊特鲁里亚 添加到参考群体集(表 S4C)。此外,我们测试了C.意大利-伊特鲁里亚.Ceu(VET005 和 CAM002)中分组的两个个体最近使用工具 DATES(意大利-伊特鲁里亚 添加到参考人群集(表 S4C)。此外,我们测试了C.意大利-伊特鲁里亚.Ceu(VET005 和 CAM002)中分组的两个个体最近使用工具 DATES(意大利-伊特鲁里亚 添加到参考人群集(表 S4C)。此外,我们测试了C.意大利-伊特鲁里亚.Ceu(VET005 和 CAM002)中分组的两个个体最近使用工具 DATES,它研究两个来源的祖先协方差模式,以推断它们在研究个体的日期之前混合了多长时间。此外,与 C.意大利-伊特鲁里亚(即 C.意大利-伊特鲁里亚.Afr、C.意大利-伊特鲁里亚.Ceu、C.意大利-伊特鲁里亚_MAS001、C.意大利-伊特鲁里亚.Afr_VET006.9 和C.意大利-帝国 之间的同期和立即年轻的集群)作为 C.意大利-帝国混合物进行了测试意大利_伊特鲁里亚和来自青铜时代和铁器时代西欧亚大陆和北非的 158 个古代群体,使用与外群体相同的一组参考人群加上意大利_雷梅戴罗_BA.SG(表 S4D)。类似地,C.意大利-中世纪早期和C.意大利-中世纪早期_ETR014 被建模为之前的 C.意大利-帝国 集群和主要在青铜时代之后的 59 个古代西欧亚群之间的双向混合(表 S4E)。最后,我们试图将今天的意大利人口(Bergamo.DG、Tuscan.DG和TSI.SG)建模为早期意大利和意大利之间的双向混合。中世纪和46个青铜时代后的古代欧亚大陆西部群体(表S4F)。
为了在我们的时间断面的最后一个时间切片中提高辨别混合模式或连续性的分辨率,从中世纪早期到来自同一地区的当前人群,我们使用参考集中的 17 个现代人群对人类起源数据集进行了 qpAdm 分析( Ami、巴斯克、BedouinB、Biaka、楚科奇、Eskimo_Naukan、汉、伊朗、Ju_hoan_North、Karitiana、Mbuti、巴布亚、俄罗斯、撒丁岛、She、Ulchi 和约鲁巴)。我们测试了该数据集中的任何当今意大利人口(Sicilian、Italian_South、Italian_North、TSI.SG、Bergamo.DG 和 Tuscan.DG)是否一致直接(单向)从新定义的遗传簇之一(表 S4G)。
我们最后探讨了将意大利中部所有新定义的遗传群建模为最多五个远端遗传成分(表 S4H)的混合物的可能性,这些成分由 安纳托利亚_N、WHG(LaBrana1.SG、Loschbour.DG 和 KO1.SG)、俄罗斯_颜那亚_萨马拉代表、Iran_Ganj_Dareh_N 和摩洛哥_EN 与一组 10 个参考种群进行比较 [Ethiopia_4500BP.SG、Ust_Ishim_HG.DG、Czech_Vestonice16、Russian_MA1_HG.SG、Italy_Villabruna、EHG、高加索狩猎采集者 (CHG)、格鲁吉亚的狩猎采集者 (CHGs. Israel_Raqefet_M_Natufian,和Morocco_Iberomaurusian]。在这项研究中,我们开始将由一个以上个体代表的每个群体建模为五元混合体,然后确定嵌套模型,以最小化源的数量,最后,我们重新运行仅包含这些源的程序。对于C.意大利_伊特鲁里亚和C.意大利_伊特鲁里亚Ceu中,重复了安纳托利亚、WHG和俄罗斯-颜纳亚-萨马拉之间的三元混合模型,这一次,将伊朗-甘杰-达雷赫纳入参考组,以测试意大利中部新生产的铁器时代基因组中是否存在后一种组分(表S4H)。
单亲标记的单倍群分配
mtDNA 分析首先对 1240K 捕获的数据进行。选择返回的数据不足以可靠地确定 mtDNA 单倍群的样本进行 mtDNA 富集。1240K 和 mtDNA 捕获的序列如上所述用 EAGER (v1.92.59) 进行预处理,并使用 CircularMapper与线粒体参考基因组 ( rCRS ) 比对,CircularMapper 是一种考虑 mtDNA 循环性的工具 。我们用 log2fasta 程序重建了内源性线粒体共有序列作为 schmutzi 包的一部分并应用了大于或等于 q10、q20 和 q30 的质量过滤器。然后用 HaploFind 以确定相应的 mtDNA 单倍群。在 ISOGG 数据库 [v.15.64 ( www.isogg.org/tree )] 中发现的映射质量≥30 和碱基质量≥30 个重叠 Y 染色体 SNP 的读数被基因分型并手动分配到 Y 染色体单倍群(表 S1A和图S5 )。
致谢
我们要感谢位于耶拿的马克斯普朗克人类历史科学研究所的计算和实验室团队;S. Carlhoff、H. Reyes-Centeno 和 C. Feja 提供采样支持;B. Rohrlach 用于 Y 染色体调用;S. Mallick 用于数据访问;M. Feldman 和 E. Posth 的深刻评论;和 M. O'Reilly 的平面设计帮助。
资金:该研究部分得到了 PRIN2017 “1000 个古意大利基因组:来自古代生物分子的证据,用于解开过去人类种群动态 (AGED)”(编号 20177PJ9XF)至 DC 的资助,以及 MIUR 资助 PRIN2017(编号 20174BTC4R_002)至 DC 、欧洲研究委员会 (ERC) 赠款(编号 716732)给 GJK 和马克斯·普朗克学会。
作者贡献:VZ、CP、A.Mö.、LMB、LC、HF、EP、FB、GC、IM、A.Mor.、SR、AS、MAT、AR、MZ、AZ、MM、LB、ML、KIB 和 DC收集考古材料,描述考古遗址,并就历史背景和解释提出建议。VZ、MAS、CP、SV、A.Mod.、KN、Å.JV、EAN、RR、CF、ML 和 KIB 执行和监督实验室工作。CP、VZ、MAS、GAG-R.、AP、HOH、EF-D. 和 WH 策划和分析了数据。CP 根据 MAS、GAG-R.、A.Mö.、KN、LMB、HOH、GJK、MM、WH、GB、KIB、JK 和所有其他作者的意见撰写了手稿。CP、KIB、DC 和 JK 构思了调查,CP、DC 和 JK 监督了这项研究。
利益冲突:作者声明他们没有竞争利益。
数据和材料的可用性:评估论文中的结论所需的所有数据都存在于论文和/或补充材料中。新报告个体的核和线粒体 DNA 序列的比对文件可在 ENA 数据库中获得,登录号为 PRJEB42866 (www.ebi.ac.uk/ena/browser/view/PRJEB42866)。
参考文献和注释
1 M. 帕洛蒂诺, Etruscoology (Hoepli, 1984)。
2 S. Marchesini, Le lingue frammentarie dell'Italia antica: Manuale per lo studio delle lingue preromane (Hoepli, 2009)。
3 G. Barker、T. Rasmussen,伊特鲁里亚人(Wiley-Blackwell,2000 年)。
4 M. Pallottino,伊特鲁里亚人(印第安纳大学出版社,1975 年)。
5 G. Bonfante、L. Bonfante,伊特鲁里亚语言:介绍,修订版(曼彻斯特大学出版社,2002 年)。
.。。。。。145条
给科学点杯咖啡

到顶部