【背景】 许多研究报道拷贝数变异(copy number variation, CNV)是一种长度在50 bp至5 Mb之间的缺失或插入,可以影响基因的表达,从而影响动物的生长发育特征,与畜禽重要经济性状有紧密的关联,是一种重要分子遗传标记之一。狮头鹅是世界体型最大鹅种之一,原产地为广东饶平,为广东卤鹅的原材料。但是,至今还没有关于狮头鹅CNV与体重体尺的全基因组关联研究报道。【目的】 通过二代基因组测序数据鉴别狮头鹅的CNV和拷贝数变异区域(copy number variation region, CNVR)在基因组上分布情况,通过CNV与体重体尺性状的关联分析,挖掘显著影响体重体尺的CNV及候选基因,为狮头鹅后续的分子育种研究提供参考。【方法】 试验共收集了来自汕头市白沙禽畜原种研究所的111只狮头鹅,其中公鹅20只,母鹅91只。所有鹅均采用统一标准饲养管理。对111只鹅进行体重体尺测定,体尺性状包括体斜长、胸深、胸宽等9个指标。本试验对111只鹅进行体重体尺测定和二代基因组测序(5×)。测序数据利用SOAPnuke进行质控,软件Speedseq中的 BWA模块进行序列比对,采用Speedseq中的LUMPY和CNVnator模块检测结构变异(structure variation,SV),从SV中筛选CNV。本试验用软件SVtools对CNV进行基因分型,然后采用单标记混合模型开展分型CNV与体重体尺的关联分析。采用染色体显著性水平(即0.05/染色体CNV数目)作为定义与性状显著关联CNV的阈值,对显著CNV位点及上下游50 kb进行基因注释,找到影响狮头鹅体重体尺关联的候选基因。用R包CNVrd2对物理距离小于1 Mb的染色体水平显著CNV和染色体水平显著SNP做连锁不平衡(linkage disequilibrium,LD)分析。【结果】 对于111只狮头鹅,共检测出 99 158个CNV,其中缺失型94 560个,重复型4 598个,CNV平均长度11 858 bp, 大部分(74.06%)CNV长度位于50—1 000 bp区间。CNVR共5 225个,包括缺失型5 029个,重复型110个和混合型86个,CNVR平均长度为7 136 bp, 大部分(81.03%)CNVR长度位于50—1 000 bp区间。功能注释发现46.92% CNVR位于基因间区域,10.30%位于基因上游,9.35%位于基因下游。准确进行基因分型的CNV有6 217个,通过10个体重体尺性状与这些CNV关联分析,共检测55个染色体显著性水平的CNV位点,注释到45个候选基因。在45个候选基因中,发现SETD2、UBR7、G2E3等10个基因同时影响两个及两个以上性状。染色体水平显著CNV独立于染色体水平显著SNP影响体重体尺性状(r2<0.02)。【结论】 通过二代基因组测序首次报道狮头鹅基因组CNV和CNVR分布及CNV和体重体尺关联的情况。本试验共发现影响体重体尺的45个候选基因,其中11个已被报道与畜禽生长信号通路有关,分别是SETD2、UBR7、ASB1和HDAC4参与肌肉的增殖、分化和代谢;G2E3、P3C2B、NOVA1和PDE1B参与脂肪生成和肥胖;ILKAP与调节生长因子有关;KIF1B参与骨代谢;ZFP37参与糖原代谢。这些为后续狮头鹅生长性能的分子遗传机制解析和分子标记挖掘奠定基础。