Information-entropy approach to the analysis of genetic diversity of populations (analytical review)

The application of information-entropy analysis on real data is shown: 84 bulls of Jersey (n = 10), Ayrshire (n = 10), red Danish (n = 10), red Swedish (n = 9) breeds and Holstein ecotypes of German (n = 13), Dutch (n = 17) and North American (n = 15) breeding genotyped by 11 microsatellite loci. Th...

Full description

Bibliographic Details
Published in:Agricultural Science Euro-North-East
Main Authors: V. Kuznetsov M., В. Кузнецов М.
Format: Article in Journal/Newspaper
Language:Russian
Published: FARC North-East 2022
Subjects:
Online Access:https://www.agronauka-sv.ru/jour/article/view/982
https://doi.org/10.30766/2072-9081.2022.23.2.159-173
Description
Summary:The application of information-entropy analysis on real data is shown: 84 bulls of Jersey (n = 10), Ayrshire (n = 10), red Danish (n = 10), red Swedish (n = 9) breeds and Holstein ecotypes of German (n = 13), Dutch (n = 17) and North American (n = 15) breeding genotyped by 11 microsatellite loci. The Shannon information index for the combined breed samples was 1.695, the weighted average for the samples was 1.325, the inter-sample component (SHAP) was 0.370 nits or 21.8 % (all calculations according to GenAlEx 6.502). The total absolute diversity of Shannon was 5.45, averaged by samples – 3.76 effective alleles per locus, between breeds – 1.45 effective samples. The relative estimate of the differentiation of breed samples (D'β) was 36.2 % and was close to the «traditional» estimates for Hedrick, Jost and Ciao. The influence of within samples heterozygosity on SHAP estimates has not been established, but a positive trend of D'β-estimates has been noted. The matrix of paired genetic distances by breeds (D'β) and its 2D projection had a high correspondence with those by GST(NEI)-, FST(W&C)-, G"ST(HED)-, F'ST(W&C)-, DJOST-, DCHAO-measures (RMantel ≥ 0,94). Fixation indices (GST(NEI) and FST(W&C)) should be used to study the evolutionary stories of subdivided populations. To analyze the current structure of the genetic diversity of (sub)populations with an emphasis on dominant allele measures based on heterozygosity (G'ST(HED), F'ST(W&C), DJOST and DCHAO), if necessary, take into account all alleles – the Shannon measure (D'β). In conclusion, a family of Hill power measures of order q = 0, 1, 2 is considered for constructing diversity profiles containing all information about the distribution of alleles in a population. Показано применение информационно-энтропийного анализа на реальных данных: генотипированных по 11 микросателлитным локусам 84 быках джерсейской (n = 10), айрширской (n = 10), красной датской (n = 10), красной шведской (n = 9) пород и голштинских экотипов немецкой (n = 13), нидерландской (n = 17) и североамериканской (n = 15) селекции. Информационный индекс Шеннона по объединённым породным выборкам составил 1,695, средневзвешенный по выборкам – 1,325, межвыборочная компонента ( SHAP) – 0,370 нит, или 21,8 % (все расчёты по GenAlEx 6.502). Общее абсолютное разнообразие Шеннона составило 5,45, усреднённое по выборкам – 3,76 эффективных аллелей на локус, межпородное – 1,45 эффективных выборок. Относительная оценка дифференциации породных выборок (D'β) составила 36,2 % и была близка к «традиционным» оценкам по Хедрику, Джосту и Чао. На SHAP-оценки влияния внутривыборочной гетерозиготности не установлено, но отмечена положительная тенденция D'β-оценок. Матрица парных по породам генетических дистанций (D'β) и её двумерная проекция имели высокое соответствие с таковыми по GST(NEI)-, FST(W&C)-, G′′ST(HED)-, F′ST(W&C)-, DJOST-, DCHAO-мерам (RMantel ≥ 0,94). Индексы фиксации (GST(NEI) и FST(W&C)) следует использовать для изучения эволюционных историй подразделённых популяций. Для анализа современной структуры генетического разнообразия (суб)популяций с акцентом на доминирующие аллели – меры на базе гетерозиготности (G′′ST(HED), F′ST(W&C), DJOST и DCHAO), при необходимости учитывать все аллели – меру Шеннона (D′β). В заключение рассматривается семейство степенных мер Хилла порядка q = 0, 1, 2 для построения профилей разнообразия, содержащих всю информацию о распределении аллелей в популяции.