Перейти к содержимому

 

Фото

Маленькие Истории Рода Т


  • Чтобы отвечать, сперва войдите на форум
449 ответов в теме

#221 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 01 Сентябрь 2015 - 21:23

Есть! И это интересно! Но надо выяснять причину.



#222 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 06 Февраль 2016 - 17:42

По данным из статьи "Калькулятор Килина-Клёсова для расчета времен до общих предков (TMRCA): Новое издание. А.А. Клёсов, В.В. Килин" (Вестник №3, 2015) составил таблицу:

979264ea3b08.jpg

 

Дополнительно была добавлена колонка со средними значениями TMRCA для каждого субклада (гаплогруппы).

Теперь у нас есть масив данных, который можно анализировать разными средствами.



#223 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 06 Февраль 2016 - 18:42

Для начала опишу суть этой таблицы на примере гаплогруппы Т (для остальной 21 группы аналогично).

1. Сто шестьдесят четыре человека определили свои 111-ти маркерные гаплотипы, которые оказались

из гаплогруппы Т.

2. Парадигма ДНК-генеалогии гласит, что все эти 164 человека имеют общего предка.

3. Время жизни этого предка рассчитано линейным методом (ЛМ-111) и равно 7198 лет назад.

4. Учитывая, что из 111-маркерного гаплотипа можно сформировать гаплотип любой меньшей длины и применить не только линейный метод, но и квадратичный, то TMRCA предка этих 164 человек может быть расчитано ещё, например, девятью методами. Итого получаем 10 разных цифр - от 6273 до 11282 лет назад.

5. Учитывая, что скорости мутации для гаплотипов разной длины высчитывались по одним и тем же реальным генеалогическим линиям, то закономерно возникает вопрос -  чем обусловлен такой разброс? Ведь цифры в идеале должны быть одинаковыми?



#224 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 06 Февраль 2016 - 19:01

А.А.Клёсов решает эту проблему так:

"Для людей, не слишком разбирающихся в ДНК-генеалогии, покажется
странным разброс данных по разным форматам гаплотипов, но это –
отражение реальности. На самом деле очень хорошо, что такой разброс
сразу демонстрируется, чтобы лишить некоторых ложных иллюзий о
точности расчетов. Точности в расчетах быть не может именно из-за
статистического характера мутаций и из-за неоднородностей в сериях
гаплотипах.."

На мой взгляд, ключевое слово здесь - СТАТИСТИЧЕСКИЙ ХАРАКТЕР МУТАЦИЙ.

Поэтому интересно изучить таблицу статистическими методами.



#225 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 06 Февраль 2016 - 21:17

Любопытный материал. Но, навскидку, некорректно сравнивать между собой 22-маркерные гаплотипы со всеми остальными. Там погрешность принципиально выше.

 

Обращает на себя внимание разброс между линейным методом и калькулятором Килина-Клёсова на 111 маркерах. Было бы интересно проверить пары на однородность выборки и ещё посчитать разницу между другими панелями.



#226 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 06 Февраль 2016 - 23:30

Ещё раз обращаю внимание, что цифры 10 способами получены для одной и той  же группы людей в 22 случаях. Всё что мешало правильным расчётам -  А.А.Клёсов убрал и получил то, что получилось. А меня интересует, что может вызвать этот разброс.



#227 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 07 Февраль 2016 - 10:12

По сути мы имеем физический процесс - постепенное накопление мутаций в Y-гаплотипах мужского населения. Наши наблюдения проявляются в измерении TMRCA группы однородных по наличию SNP гаплотипов. Таких наблюдений в таблице - 22 (первый столбец). Каждое наблюдение описано 12 переменными (верхняя строка 2-12 столбца). Таким образом, одно наблюдение описывается 12-ти мерным вектором. Наблюдение - случайная величина и зависит от качества выборки гаплотипов. Статистика физического процесса (в общем случае) -  это правило, которое будет проявляться от наблюдения к наблюдению и, в идеале, улучшать результат предсказания.

Попробуем найти эти правила, сокрытые в таблице.



#228 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 07 Февраль 2016 - 10:29

Ранее отмечалось, что в идеале в наблюдении все рассчитанные разными методами TMRCA должны быть равны между собой и равны своему среднему значению. Однако в силу неизвестных причин такое равенство не проявляется и разброс от среднего значения не такой уж и большой. Опираясь на этот факт преобразуем таблицу:

8e5d17e80075.jpg

 

Здесь убрана первая и двенадцатая переменная, а значения TMRCA были поделены на своё среднее значение. Таким образом, вектор наблюдения стал десятимерным, а переменные отражают отклонение TMRCA от своего среднего значения.



#229 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 07 Февраль 2016 - 10:49

Новая таблица позволяет создать дерево, которое описывает наибольшее приближение результатов одного из десяти методов к среднему значению. Это дерево выглядит следующим образом:

ba16bb9c4d1b.jpg



#230 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 07 Февраль 2016 - 11:17

Глядя на это дерево можно сделать ряд выводов:

1. Линейный метод имеет преимущество перед квадратичным.

1. Наиболее предпочтительным является линейный метод для 111 и 67 маркерных гаплотипов.

2. Увеличение гаплотипа с 67 до 111 маркеров существенных преимуществ не даёт.

3. 17 маркерный гаплотип по своему потенциалу близок к 67-маркерному.

4.Возможно маркеры DYS: 458,459а,459в,455,454  серьёзно влияют на сходимость чисел.

5. 22-маркерные гаплотипы надо применять с большой осторожностью.



#231 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 07 Февраль 2016 - 14:47

Очень наглядно. А с панелями, вернее, с наиболее стабильными и дающими наименьшую ошибку маркерами надо работать. Предложите свою панель, Александр Анатольевич.



#232 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 07 Февраль 2016 - 15:31

Это вряд ли, Валерий Павлович. Как по мне, то и 67-маркеров достаточно. А вот со скоростями картина получается необычная.



#233 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 12 Февраль 2016 - 09:50

Парадигма скоростей мутации в ДНК-генеалогии подробно изложена здесь:

http://pereformat.ru...na-calibration/

Два кита на которых она держится - это:,

1. Постоянство во времени - скорость мутации одинакова и в каменном веке, и в веке металлов и в эпоху чипсов и пэпси. Она не зависит от климатических, экологических и социальных катаклизмов и зависит только от длины гаплотипа.

2. Родовое постоянство - скорость мутации одинакова у всех мужчин рода Homo Sapiens.

И самое важное - скорость откалибрована по 13 генеалогическим мужским линиям:

calibration.jpg



#234 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 12 Февраль 2016 - 13:22

Это постоянство во времени и родовое постоянство определяется механизмом копирования ДНК ферментом полимераза. Ни радиация, ни питание, ни экология, ни продолжительность жизни, etc. на скорость мутации не влияют. Если какой-либо из этих факторов повреждает "копировальную машинку", она перестаёт нормально работать и потомства уже не будет. Только и всего.



#235 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 13 Февраль 2016 - 12:46

Как по мне, то углубляться в дебри не стоит. Всегда говорю, что ДНК-генеалогия не генетика. Выходя на поле генетики, всегда можно ошибиться в сущностях этой науки.

Для нас важно не то, что существует какой-то биологический механизм, который исправляет, а то, что он даёт сбои и появляются мутации. При этом нас интересуют мутации не всего генома, а несколько сотен мутаций из очень узкой области (не более 3% от генома) - нерекомбинирующего участка Y-хромосомы (NRY).

По своей сути гаплотипы, о которых мы говорили ранее, это выборки из мутаций NRY.

Изначально гаплотипы создавались как рабочий инструмент для филогеографических исследований. Далее процитирую:

"Филогеорграфический подход к картированию уровня гаплотипического разнообразия  в пределах гаплогрупп позволяет выявлять места происхождения и пути распространения линий, проводить реконструкцию древних миграций населения. Гаплотипы Y-хромосомы, построенные с помощью набора из 15-17 информативных YSTR-локусов, позволяет выявлять тонкие различия структуры генофондов популяций и эффективно дифференцировать даже относительно однородные по составу этносы" (Харьков В.Н., 2007).

 

Попгенетики слепо верят, что где на карте проявляется максимальное разнообразие гаплотипов одной гаплогруппы, там и ее родина. И как следствие - если в одной точке географической области чаще встречается какая-то гаплогруппа,то она претендует на автохтонность.

ДНК - генеалогия делает упор на временной параметр (TMRCA). Здесь отсылаю к работам А.А.Клёсова и И.Л.Рожанского.

Главное, что существуют мутации. Если их не будет, то и ДНК-генеалогии не будет тоже.

При помощи статистических методов, я определил, что данные, полученные А.А.Клёсовым, подтверждают мнение, что наиболее предпочтительными являются 111 или 67 маркерные гаплотипы или, на худой конец, 17-маркерные для бюджетных исследований. Теперь остаётся вопрос - можно ли сравнивать между собой результаты, полученные для разных гаплогрупп (субкладов)?



#236 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 14 Февраль 2016 - 09:54

И так, у нас есть 22 выборки гаплотипов из 9 гаплогрупп. Для каждой выборки десятью методами были определены времена жизни общего предка этой выборки. Соответственно, в десяти методах применялись константы 8-ми скоростей ( для 111,67,37,25,22,17,12 и 5-маркерных гаплотипов). Все результаты в рамках одной выборки получились разными. Статистический анализ показал, что зависит это от:

1. Метода подсчета ( например, ЛМ111 и КК111).

2. От длины гаплотипа и косвенно от свойств маркеров (например ЛМ111 и ЛМ17).

3. И опосредованно от постоянной скорости мутации.

Лучший результат по критерию сходимости к среднему дали методы ЛМ111 и ЛМ67. Для бюджетных исследований -ЛМ17.

Теперь посмотрим, как работают методы в отношении каждой гаплогруппы (субклада). Если постоянная скорости работает в них одинаково, то следует ожидать, что все наблюдения будут объединены в один кластер. Однако, это не так.

d762201ec483.jpg



#237 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 14 Февраль 2016 - 10:27

Лучший результат показывает ветвь из десяти наблюдений от N1c1 до I1 c преобладанием R1a и R1b. Это можно объяснить, если взглянуть на таблицу 13 генеалогических ветвей, по которым усреднялись скорости мутации:

http://dna-genealogy...ge-12#entry2414

Видно, что там не присутствуют Т,Е1b,I2,I1 и хорошо представлены R1a и R1b.

Такая картина может наблюдаться только при разных скоростях в генеалогических ветвях. И если эти скорости не усреднять по всем гаплогрупам, то неизбежен разброс.

Таким образом, статистическое исследование подтверждает выводы А.А.Клёсова и мне только остаётся согласиться с его словами:

"Точности в расчетах быть не может именно из-за статистического характера мутаций и из-за неоднородностей в сериях гаплотипах, но даже при столь заметных погрешностях расчетов они
очень часто являются исключительно ценным инструментом в исторических и лингвистических исследованиях."

Закладываться на голые цифры нельзя. Всё должно подтверждаться фактами из других дисциплин.



#238 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 15 Февраль 2016 - 01:20

Если постоянная скорости работает в них одинаково, то следует ожидать, что все наблюдения будут объединены в один кластер. Однако, это не так.

Не факт, потому что древо некорректно. Вот если бы у Вас все гаплотипы были одной длины, тогда другое дело.

 

Лучший результат показывает ветвь из десяти наблюдений от N1c1 до I1 c преобладанием R1a и R1b. Это можно объяснить, если взглянуть на таблицу 13 генеалогических ветвей, по которым усреднялись скорости мутации:

http://dna-genealogy...ge-12#entry2414

Видно, что там не присутствуют Т,Е1b,I2,I1 и хорошо представлены R1a и R1b.

Такая картина может наблюдаться только при разных скоростях в генеалогических ветвях. И если эти скорости не усреднять по всем гаплогрупам, то неизбежен разброс..

Прежде чем делать такой вывод, надо исключить все остальные причины. Например, разную длину гаплотипов, (не)представительность выборки и, как следствие, её возможную неоднородность .



#239 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 15 Февраль 2016 - 06:57

Обращаю внимание на то, что гаплотипы в выборке одинаковые - 111-маркеров. Остальные результаты получены из калькулятора Килина-Клёсова автоматически.

Таким образом каждая переменная (выборка гаплотипов одной гаплогруппы(субклада) описывается 10 способами и 8 гаплотипами разной длины, но принадлежащие одним и тем же мужчинам.

Корректности выше крыши. Если говорить о представительности, то здесь может быть зарыта другая собака - неравномерность скорости мутации внутри одной гаплогруппы (субклада).

Но в целом, погрешность для ЛМ111 не превышает 16%,а для ЛМ67 -17%. Вполне презентабельно. Кошмар скрывается за порогом >30%.

Цифры в ДНК-генеалогии не жупел, а информация к размышлению.



#240 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 16 Февраль 2016 - 09:07

Впрочем, с одним я согласен - термин "неоднородная выборка" требует конкретизации. Ранее (для коротких гаплотипов) под ним понималась несогласованность цифр, полученных линейным и логарифмическим методом. Чем больше расхождение, тем больше неоднородность. Для такой проверки требовалось наличие в выборке одинаковых гаплотипов. Для 67-ми и 111-ти маркерных гаплотипов - это теряет смысл. Они могут совпасть только у очень близких родственников. Получается, что остаётся только качественная сторона - вид дерева гаплотипов.

В таком случае стоит:

1.Построить дерево гаплотипов гаплогруппы.

2. Разделить гаплотипы на ветви.

3. Подсчитать калькулятором Килина-Клёсова TMRCA для каждой ветви.

4. Провести статистическую проверку полученных результатов.

5. Сравнить результаты с предыдущими.

Попробую сделать это для гаплогруппы Т и сравнить с результатами R1a и  R1b.

Жаль, что калькулятор КК не считает автоматом логарифмическую TMRCA для коротких гаплотипов.






0 пользователей читают эту тему

0 пользователей, 0 гостей, 0 скрытых

Copyright © 2024 Академия ДНК-генеалогии. Климатический филиал