NWIPB OpenIR
青藏高原大麦籽粒蛋白质含量的关联分析
宋远方
学位类型硕士
导师沈裕虎
2016
学位授予单位中国科学院大学
学位授予地点北京
关键词大麦 Dart 群体结构 连锁不平衡 籽粒蛋白含量 关联分析 Hvnam1 Hvnam2
其他摘要        六棱裸大麦(即青稞)是生活在青藏高原地区的藏族人民的主要口粮,同时也是重要的饲料作物和酿造原料作物。长期以来青稞育种主要以提高产量为目标,对青稞籽粒蛋白质含量(Grain Protein Content, GPC)为主的品质性状关注较少。同时,青藏高原又蕴藏着丰富的野生大麦和青稞地方品种等具有优异品质性状的种质资源,对其籽粒蛋白质含量及其形成的基因组学基础研究匮乏。本研究以 302 份青藏高原野生大麦、青稞地方品种和育成品种及少数外引大麦栽培品种为研究群体,在获取了参试材料 2013 年和 2014 年两个年度的籽粒蛋白质含量(GPC)表型鉴定(Phenotyping)数据的同时,用 2304 个 DArT(Diversity Array Technology, DArT)标记进行了参试群体的全基因组扫描(Genome-wide Scanning)并获得了基因分型(Genotyping)数据。在进行参试材料群体 GPC 表型变异分析、群体结构和基因组连锁不平衡性估测的基础上,开展了 GPC 性状/DArT 标记间的全基因组关联分析(Genome-wide Association Analysis, GWAS)和基于 HvNAM1 和 HvNAM2 的候选基因关联分析(Candidate-gene association analysis, CGAS)研究。期望得到控制 GPC 的优异等位变异(单倍型)和分子标记,定义相关基因组区段,为今后开展青稞品质分子育种提供可用的育种元件。本研究主要得到如下结论:
        1. 参试材料群体籽粒蛋白质含量存在丰富的表型变异。302 份参试材料两年度 GPC 平均值为 13.56%,变异范围为 8.23%-22.67%。不同类型材料间 GPC 存在显著差异,野生大麦 GPC 最高为 14.49%,青稞地方品种居中(GPC =12.68%),青稞育成品种 GPC 最低为10.32%。在青稞驯化和育种过程中,随着产量的提高,GPC 有逐步降低的趋势。筛选到一批籽粒蛋白质含量极高(如野生大麦 ZYM2749,其 GPC 均值为 22.67%)和极低(如北青8 号,其 GPC 均值为 8.23%)等不同含量水平的青稞种质资源,可以在今后的育种过程中加以利用。
        2. 参试材料群体内存在较为丰富的遗传变异。在基因组水平上,所有参试材料 1396个多态性 DArT 标记的多态性信息含量(Polymorphism information content, PIC)变异范围为 0.0073-0.5000,平均值为 0.2715。不同染色体间 DArT 标记多态性存在差异,1H 和6H具有较高的多态性,2H、5H 和 7H 的多态性居中,3H 多态性较低,4H 上可用的标记数较少且多态性最低(PIC=0.2225)。
        3. 经贝叶斯、主坐标分析和聚类分析三种方法检测,参试材料群体内存在明显的群体分层,而且三种方法得到的结果高度一致、互相印证。最后确定参试群体可以划分为 3 个群体:POP1 主要是青藏高原野生大麦,POP2 主要是青稞地方品种和育成品种,POP3 包括大部分青藏高原区域外外引大麦品种和部分青藏高原大麦材料。对参试材料群体基因组连锁不平衡(Linkage disequilibrium, LD)水平的估测结果表明,参试群体在基因组水平和不同染色体内均存在一定程度的连锁不平衡性,而且这种连锁不平衡主要来自于染色体内部而非不同染色体间。参试群体 DArT 成对位点 r 2 值随着遗传距离的增加迅速衰减且遵循方程:y=aln(x)+b。当 r 2 =0.2 时,整个基因组的 LD 衰减距离为 6.34cM。
         4. 综合一般线性模型(General Linear Model, GLM)和混合线性模型(Mixed Linear
Model, MLM)的 DArT 标记/GPC 性状回归分析结果,在除 4H 以外的其余 6 条染色体上
共检测到 44 个标记、35 个位点同籽粒蛋白质含量显著关联。1H 、2H、3H、6H 和 7H 上
分布了大部分检测到的标记(位点)。本研究所检测到的 7 个标记(5 个位点)在以往的
研究中已有报道,22 个标记(18 个位点)同已有报道的标记位置相近(<10cM),有 15
个标记(12 个位点)为本研究新发现的的标记(或位点)。青稞基因组内同 GPC 相关的
标记大部分呈簇状分布,在 6 条染色体上共有 19 个染色体区段集中分布了发掘到的 39 个
标记,是 GPC 相关基因分布的热点区域。另有 5 个标记呈单个位点散布于 5 条染色体上。
        5. 参试群体在 HvNAM1 基因内共检测到 6 个 SNP 位点,分别位于+54bp、+234bp、
+544bp、+563bp、+1004bp 和+1433bp 处,全部位于 3 个外显子区且为错义突变(Missense
Mutation)。6 个 SNP 变异形成 8 种单倍型,其中 Hap4 出现频率最高(46.69%),其次
是 Hap3、Hap7 和 Hap5。Hap1、Hap2、Hap6 和 Hap8 为稀有单倍型(出现频率 F<0.01)。
野生大麦携带有 7 种单倍型,青稞地方品种和育成品种各携带有 5 种单倍型,而外引大麦
品种只携带有 2 种单倍型。携带不同单倍型材料的籽粒蛋白质含量存在差异。单倍型进化
关系结果表明,Hap4 是最为原始的单倍型,Hap2、Hap5、Hap6、Hap7 和 Hap8 有着同
Hap4 最为接近的亲缘关系。Hap1 是由 Hap4 经两次单碱基替换形成的,与 Hap4 亲缘关系
较远。Hap2 和 Hap5 发生等位基因交换进而形成了单倍型 Hap3。Hap1 和 Hap3 是在距今
最近的年代形成的;HvNAM2基因上共检测到9 个 SNPs和1 个InDel 位点,分布在HvNAM2
基因 5'UTR 区、第一内含子区、第二和第三外显子内,有 4 个错义突变和 2 个同义突变
(Synonymous Mutation),共形成了 10 种单倍型。Hap3 出现频率最高(82.45%),其后
依次是 Hap10 和 Hap9,其余均为稀有单倍型(F<0.01)。野生大麦携带有 7 种单倍型,
青稞地方品种携带有 6 种单倍型,育成品种携带有 4 种单倍型,而外引大麦品种携带有 4
种单倍型。携带不同单倍型材料的蛋白质含量存在差异。单倍型进化关系结果表明,Hap3
是最为原始的单倍型类型。Hap1、Hap2、Hap5 和 Hap8 是由 Hap3 发生单碱基突变形成的,
有着同 Hap3 最为接近的亲缘关系。Hap4 是由 Hap3 在 1474 位置发生 6 碱基的缺失形成。
Hap6 是由 Hap3 经过了 4 次单碱基突变形成,Hap8、Hap7 和 Hap9 是其中间过渡类型。
Hap7 经过连续两次单碱基突变形成 Hap10。在青稞驯化和育种过程中,存在一条
Hap3-Hap8-Hap7-Hap10 的进化支路。
        6. 采用一般线性模型和混合线性模型两种方法,对 HvNAM1 和 HvNAM2 基因的 16 个
SNP 位点、18 个单倍型与参试群体籽粒蛋白质含量(GPC)进行关联分析。两种模型在
HvNAM1 基因内均检测到有 2 个 SNP 位点同 GPC 显著关联,分别是 Exon1 中+234bp 处的
G/C 替换和 Exon3 中+1433bp 处的 G/A 替换。Exon1 中+234bp 处 G/C 替换引起编码氨基酸的色氨酸/半胱氨酸(Trp/Cys)的错义突变,两种模型下的变异解析率分别是 8.84%(GLM)
和1.39%(MLM)。Exon3中+1433bp处的G/A替换引起编码氨基酸的丙氨酸/苏氨酸(Ala/Thr)
错义突变,两种模型下的变异解析率分别是 1.58%(GLM)和 4.01%(MLM)。HvNAM1
基因单倍型Hap3 同蛋白质含量间在两种模型下均存在显著关联,其变异解析率分别是 9.11%
(GLM)和 1.30%(MLM),在一般线性模型下,Hap4 同 GPC 间存在显著关联,其变异
解析率 7.62%。在两种模型下,HvNAM2 基因内未发现与籽粒蛋白质含量显著关联的位点
或单倍型。
语种中文
文献类型学位论文
条目标识符http://210.75.249.4/handle/363003/5920
专题中国科学院西北高原生物研究所
作者单位中国科学院西北高原生物研究所
推荐引用方式
GB/T 7714
宋远方. 青藏高原大麦籽粒蛋白质含量的关联分析[D]. 北京. 中国科学院大学,2016.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
青藏高原大麦籽粒蛋白质含量的关联分析-宋(3594KB)学位论文 开放获取CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[宋远方]的文章
百度学术
百度学术中相似的文章
[宋远方]的文章
必应学术
必应学术中相似的文章
[宋远方]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。