食用菌精准育种实验室
Laboratory of Mushroom Precision Breeding

从法医学STR鉴定标准来看农业SSR分子标记品种鉴定标准的不足

食用菌精准育种实验室·发布     更新时间:2023-02-05 06:30:01

本文为转载,若存在版权问题,请联系我们及时处理



 

杨燕宇

武汉市景肽生物科技有限公司

SSR标记检测算是最简单的分子标记技术之一:样本DNA提取——PCR扩增——聚丙烯酰胺凝胶电泳——银染显色,一套流程即可观察到SSR的PCR扩增产物,通过比对PCR产物条带大小来确定样本之间的多态性/一致性。

因为原理简单,我们因而就可能小瞧了这个技术。所谓世事洞明皆学问,表面肤浅的SSR技术,其实也可以掘一万米深。笔者从事SSR分子标记荧光毛细管电泳技术已有十年。最初就曾深受自身对SSR技术的肤浅认识之害。不堪之下,想起了法医也用这个技术,就奇怪他们是如何用痕量样本做到铁证如山?通过学习法医领域相关资料,笔者了解到了法医STR分型许多先进的理论和经验,结合笔者10年的从业经验,在这里谈谈我国农业SSR分子标记品种鉴定行业标准的一些问题和改进建议。

一、位点/基因座选择

(一) STR基因座的法医学选择标准

我国司法多个标准没有规定具体的标准基因座(位点,Locus),但《公安机关查找被拐卖儿童DNA检验技术应用规范(试行)》的第二十一条明确规定“应当检出14个以上常染色体STR基因座,并至少包含D3S1358、VWA、FGA、D21S11、D18S51、D5S818、D13S317、D7S820、D16S539、D8S1179、CSF1PO等11个核心基因座”,以及《生物学全同胞关系鉴定实施规范》规定了19个必检的常染色体基因座。

而我们农业行业标准(蕃茄采用了Indel标记),包括刚刚生效的玉米和水稻两个SSR分子标记的国家标准,都对所检测的位点进行了规定(如水稻48个、玉米40个SSR标记引物对)。严格地说,实际上是规定了基因座具体的PCR扩增引物,而不是SSR基因座,甚至还规定了引物所采用的具体的荧光标记物。

是什么原因造成这样两种极端不同的做法?

从二者的鉴定目的来看,司法鉴定目的是进行人的身份鉴定,农业标准是鉴定种子的身份,二者有类似的目的。但是人与农作物生殖方式差异导致在群体遗传学上有很大差异:人群中的许多基因座的等位基因频率是符合Hardy–Weinberg平衡定律的,即群体内一个位点上的基因型频率和基因频率将代代保持不变,处于遗传平衡状态。这使我们可以进行等位基因在人群中的分布频率统计研究。采用这些基因座作为标记进行DNA鉴定,可以直接计算出标记鉴定结果在统计学上的可靠性,即“个体识别能力”、“非父排除概率”、“亲权指数”等指数。通过规定指数的阈值即可做出对应的判定结论,不管是否采用相同的基因座,都可以进行科学的结果判定。所以亲子鉴定可以采用完全不同的基因座,得到完全一致的鉴定结论。不过,因查找拐卖儿童需要进行亲缘匹配搜索,必须建立统一的数据库,所以规定了必检核心基因座。

农作物的生殖经过强烈的人为干预,许多位点的遗传不符合Hardy–Weinberg平衡定律。因而倾向于采用基因组上平均分布采样(即标定规定位点)来进行DNA鉴定,理论上不宜直接套用司法标准进行如亲权指数这类参数计算

虽然许多司法鉴定标准不直接指定位点,但是其有明确的位点选择标准,如《亲权鉴定技术规范》(SF/Z JD0105001——2016)5.4.4.4如此规定:

1)基因座定义和具有的特征已有文献报道;

2)种属特异性、灵敏性、稳定性研究已实施;

3)已有可供使用并公开发表的群体遗传数据,群体遗传数据包括从有关人群中获得的该基因座等位基因频率或单倍型频率及突变率

4)遗传方式符合孟德尔定律

5)串联重复单位为四或五核苷酸

美国法医DNA专家John M. Butler所著《法医DNA分型专论:方法学》(Advanced Topics in FORENSIC DNA TYPING: METHODOLOGY,英文版2011年由Elsevier出版,中文版2012年由科学出版社出版)第五章“适用于法医DNA分型的STR”这一节提到STR选择如下标准:

1)较高的个人识别能力,观察杂合度>70%;

2)在染色体上的位置相距较远,确保无连锁

3)与其它遗传标记复合检测时易于得到结果,且稳定性好;

4)低Stutter产物(此现象下文将详细阐述);

5)低突变率

6)预计的等位基因长度在90~500bp,片段越小越适合降解DNA检材的分析。

(二)CODIS核心基因座

(三)农作物SSR基因座该如何选择

因为群体遗传学的差异,法医身份鉴定标准不能直接移植到农作物身份鉴定上来。但是其底层的科学逻辑是可以通用的,因而法医选择标准对农作物SSR基因座选择极具参考意义。

首先我们应该参考的是上文提到的“低Stutter产物”。

Stutter(字面意思为“口吃”)现像是SSR在高分辨率电泳下呈现的伪峰/影子带,这种伪峰来源于SSR在PCR过程中DNA呼吸作用导致的引物链和模板链之间的变性和错位复性,导致PCR扩增子1~N个基序(重复单元,motif)的滑动。下图中分别是1bp和2bp基序单元的SSR的电泳图,可以看出存在严重的Stutter伪峰现像。

基序越短,重复次数越多,Stutter伪峰越严重。几乎所有1bp基序SSR无法正常判读,且等位基因间最小差异只有1bp,故无法作为分子标记使用。2bp SSR是科研中最常使用的SSR,但是基序重复很多时,Stutter将严重到无法进行准确的等位基因型判定(如下图,左为水稻SSR标记RM232,右为RM219,无法进行杂合和纯合判定。二者均为NY/T 1433-2014 《水稻品种鉴定技术规程——SSR标记法》规定标记)。但是当基序长度达到4bp时,Stutter几乎不对分型判定造成影响,因而法医STR标准明确要求“串联重复单位为四或五核苷酸”。

相比之下,我们的农业行业标准几乎全部采用了基序长度为2bp的SSR基因座,因而在实际使用中,造成某些材料很难判定等位基因型(如上图)。

虽然说基序≥4bp的SSR是PCR技术上更好用的基因座,但是其在基因组的丰度远低于基序<4bp的SSR。我们曾经对已经发表的50多个水稻从头测序的基因组(Assembly)进行分析,试图在水稻中选择一组多态性高的基序长度≥4bp的SSR基因座,但是各种标准筛选后只获得了三十多个,且等位基因超过3个的只有十多个。因而在水稻中选出一组纯粹的基序长度≥4bp且符合其它各种条件的SSR基因座组合是不太可能的,必须辅以部分基序长度为3bp的SSR基因座。但是无论如何,我们应该彻底抛弃基序长度为2bp的SSR基因座。而如玉米这种基因组比较大的农作物,则有可能选择出大部分甚至全部基序长度≥4bp的SSR基因座组合。

其次应该参考的规则是“标记之间应该无连锁,符合孟德尔遗传规律”。

现有行业标准基本都遵循了标记在基因组内均匀分布的规则。但是笔者不太清楚有哪些标准认真分析了标记之间的连锁距离。严格的说,分子标记应该在基因组连锁图谱上均匀分布,而不是简单的在物理图谱上分布均匀。

实际上,要求标记的平均分布在基因座的遗传和表型贡献度的无法精确统计情况下的无奈之举。采用的3-4个标记的不一致判定为不同品种没有严格的统计学意义,容易惹出争议。因此:

第三可以尝试对候选基因座进行等位基因频率的统计研究,尽可能选择一些在育种中没有育种选择压力的符合Hardy–Weinberg平衡定律的基因座作为核心基因座。若能选出部分这样的基因座,则可以利用这些基因座,计算出亲权指数及个体识别能力等具有统计学意义的参数,进而进行更科学的判定。

反过来,也可以育种选择的热点进行群体遗传学分析,计算其等位基因分布和变化规律,可能可以获得一些基本参数,用于判定这些基因座对农艺性状的贡献度。华中农业大学谢为博教授2015年在PNAS发表的有关水稻“育种印迹”的论文,是这方面很好的研究基础。

二、等位基因命名及判定

法医的STR等位基因命名和判定有一套科学完善的规则,因而能够在不同实验室之间进行精确的数据比较。相比之下,农业行业标准没有对应的规则,数据的比较和判定存在很大困难。

如果不考虑PCR扩增子内的SNP突变和其它的InDel,SSR/STR基因座的变异则来自基序序列的重复次数的变化。那么,基序的重复次数即可以作为等位基因的名称。如下图等位基因按照法医STR鉴定规则应该计为(TCAT)6,命名就是“6”。

这种命名规则可以直接反应基因座的变异形式,即使是采用不同引物进行检测,一样可以用相同的名称命名同一个等位基因,若直接采用扩增子的电泳长度来命名,则会因为引物、荧光标记物(不同荧光标记物对DNA片段电泳迁移率影响差异很大,且不随长度变化而线性变化)、聚合酶类型(A族聚合酶会在PCR产物3’端加A,且添加效率随着扩增子末端序列变化差异很大,而B族酶则不额外增加碱基)、设备状态等因素变化而变化。

法医STR等位基因详细命名规则在这里笔者不再详述,值得一提的是在等位基因判定方面,法医STR鉴定标准要求检测试剂盒必须提供等位基因分型标准物(Allelic ladder),下图是公安部物证鉴定中心研制的DNATyperTM 15试剂盒的等位基因分型标准物的电泳图。

这种标准物包含了该试剂盒研发时过往报道过的所有等位基因,每次检测都需要利用其中一个泳道跑这个标准物,所有检测结果需要与标准物电泳结果进行比对,以修正仪器的微小误差,以及判定可能出现的未知突变。

如果没有这个标准物,一个常见的问题就会出现:如果一个扩增子上次的结果为100.38bp,我们计为100bp,而下一次电泳结果为100.63bp,我们是该将其计为101bp还是100bp?这在现行农业行业标准里是一个非常令人头疼的问题。

三、高效率的商业试剂盒

法医STR鉴定标准里从未出现过任何基因座的引物及荧光标记物信息,所有标准在PCR扩增、检测及原始数据分析均规定为“按照试剂盒操作说明/按照仪器操作手册进行”。

这种做法,有以下明显的好处,值得农业行业标准参考:

(一)具有很好的技术开放性

如果对引物序列、荧光标记物、技术操作步骤进行规定,会导致技术被标准锁死。任何技术的改进将会是对标准权威性的侵犯而不会被法律承认。

现在有多个供应商可以提供法医STR鉴定试剂盒,国外的有Thermo Fisher及Promega等公司,国内有基点认知技术及公安部物证鉴定中心等,每一家均有自己研发的引物序列、荧光标记物组合及PCR扩增试剂配方知识产权,且试剂盒一直在进行技术改进。如随着毛细管电泳仪的由5色荧光发展至6色荧光,对应的6色试剂盒就被开发出来。

我国现有农业标准基本都直接规定了引物序列以及所接的荧光标记物,有不少标准的荧光标记物采用了Thermo fisher目前专利仍在有效期内的荧光标记物如PET、NED,实质上丧失了标准的技术中立性。这使引物合成的成本要比无专利保护的荧光标记物高出十倍以上,不利于标准使用和技术进步。

现有STR检测都采用荧光毛细管电泳检测,理论上来说,现有法医标准是允许直接进行测序检测的,甚至现有的法医标准也没有规定只能使用STR,如《亲权鉴定技术规范》(SF/Z JD0105001——2016)5.4.1.1 规定“选用多态性基因座(如STR、SNP等类型)进行PCR扩增”。之所以没有任何一家单位采用测序检测,是因为测序法相对现有的单管二十几重STR PCR扩增加单泳道的多位点多色荧光毛细管电泳,测序的工作量和成本要高得多。不过这种技术的开放性,使技术进步不会受到现有标准的约束,加强了标准的权威性和中立性

(二)兼顾了标准中立性和试剂盒商业竞争公平性

除了刑事案件,采用各种标准进行的检测均为有偿服务,因而产生了一个检验服务以及检验试剂盒的商业市场。标准的技术开放性,带来了试剂盒研发和销售的公平竞争。

现有农业标准的部分标准引物序列及基因座组合被标准起草团队先行申请了专利,标准使用者又不能修改引物以避开专利壁垒,本质上将所有的商业路线封死,造成完全的垄断市场,不利于标准技术的发展进步。

四、总结及建议

综全文所述,相比完备的司法STR标准体系,现有农业行业品种鉴定的SSR标准体系存在许多不科学和不合理的地方,笔者在此提出以下后续标准修订建议:

(1)标准中只规定必检核心基因座以及结果的计算和结论判定规则,不要放入任何引物序列、荧光标记物及检测技术流程。

(2)根据遗传重组规律以及大样本的遗传背景分析的研究结果,采用连锁群区块划分,按照区块均匀分布选定必检基因座。

(3)SSR标准必须放弃基序长度为2bp的SSR基因座,优先选择基序长度≥4bp 的SSR基因座,如基因座不够,再加入综合能力优良的3bp SSR。

(4)对核心基因座进行系统性的序列变异研究。建立一组具有代表意义的标准样品。所有标准样品必检基因座全部采用Sanger测序法进行全序列测定,确定完备的等位基因的序列变异信息。

(5)进行育种选择热点和未受育种影响的基因座区块群体遗传学研究,尝试选择部分符合Hardy–Weinberg平衡定律的基因座作为必检基因座,并用这些位点计算遗传贡献度。选择部分现代育种中受到强烈选择的基因座,计算品种的表型贡献度,划定具有统计学意义的判定阈值。

(6)采用低密度SSR基因座和高密度SNP/SNP单倍型区块(SNP Haplotype block,即彭海老师命名的MNP)组合方式。低密度SSR组合作为低成本的快速判定标准,当低密度SSR组合鉴定结果没有明显差异且产生争议时,使用高密度SNP/SNP单倍型方式进行精细判定。低密度SSR可以兼顾我国种业企业相对较低的分子标记技术水平,方便其进行低成本内部质控,高密度SNP则负责解决低密度SSR检测后结果差异不明显时的争议。

(7)建立对全社会免费开放核心基因座数据库。人类STR经过多年的数据交换,才有如今精准的统计学意义的判定数据,农业标准不能一开始就采用数据封闭路线,这对标准的进步非常不利。更何况,几乎所有的标准都是通过国家项目经费研究完成,数据库的运行也是由国家经费支撑,将其封闭作为小集体所有,有悖于立项初心。

(8)吸纳具有分子标记核心技术研发能力的商业团队加入标准修订/制定工作,制定试剂盒技术标准(参照GA/T 815-2009《法庭科学人类荧光标记STR复合扩增检测试剂质量基本要求》),鼓励商业团队参与配套的鉴定试剂盒开发。

 

 

https://new.qq.com/rain/a/20211210A06KXO00






版权声明:

(1) 本文仅代表原作者观点,不代表本网站立场,请批判性阅读!

(2) 本文内容若存在版权问题,请联系我们及时处理。

(3) 除特别说明,原创内容版权归食用菌精准育种实验室所有,欢迎转载,转载请注明出处!



食用菌精准育种实验室  ·  Laboratory of Mushroom Precision Breeding