基因型填充已成为基因组分析中预处理的关键步骤,其准确性会直接影响下游分析。许多因素都会影响填充的准确性,其中,混合参考群体的填充倍受关注。这项研究旨在:评估填充及其影响因素之间的关系,以确保更高的填充精度;探索在参考群体中包含多个品种(系)是否有利于猪填充的准确性;选择具有良好填充效果的填充软件。在这项研究中,我们使用50K芯片数据,基于单品系(大白A系)和多品种(大白A系,大白B系,杜洛克,长白)参考群体评估了填充精度随验证群体标记密度、参考群体样本量、最小等位基因频率和参考群体组成四种影响因素的变化,并比较了Beagle 4.1、FImpute、IMPUTE2 和MaCH-Admix四种填充软件的填充准确率和运行时间。通过计算填充后SNPs和真实SNPs间的基因型一致率和皮尔森相关性获得填充精度。首先,我们通过随机缺失验证群体中20%、45%、70%、95%和99%的SNPs来模拟低密度芯片,以研究标记密度的影响。然后,我们从原参考群体中随机抽取8、86、173、434和868头猪作为新的参考群体来研究参考群体样本量对填充精度的作用。对于最小等位基因频率,SNPs按等位基因频率被分为7类,分别计算每类SNPs的填充准确性。结果显示,随着验证群体标记密度,参考群体样本量和最小等位基因频率增加,填充准确性增加。当参考群体为与验证群体品系一致的单品系群体时,填充准确性较高,其他品种(系)的添加会导致相对略差的填充结果。此外,随着参考群体中主效品系样本量的增加,填充准确性也会提高。在所有填充情景中,综合考虑填充精度和运行时间,Beagle 4.1和FImpute优于IMPUTE2 和MaCH-Admix。这项工作使从事相关研究的人员能够更直观地了解这些影响因素对填充的影响,并为实际猪育种中实施填充策略提供实践指导。