Перейти к содержимому

 

Фото

Маленькие Истории Рода Т


  • Чтобы отвечать, сперва войдите на форум
449 ответов в теме

#281 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 05 Март 2016 - 10:29

Совершенно верно!

В богатых странах арабского мира  пробудился интерес к проектам FTDNA. Аравийский п-ов стал основным поставщиком гаплотипов в базу гаплогруппы Т.  Например, в 2011 году в базе было примерно 150 67-m гаплотипов, а сейчас их количество  переваливает за третий десяток пятой сотни. И в основном - арабские.



#282 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 05 Март 2016 - 12:26

Стало быть, методология ДНК-генеалогии, разработанная уважаемым Анатолием Алексеевичем Клёсовым сотоварищи, в деталях подтверждена на примере маленьких историй рода Т, не так ли? Ревизия отменяется, уважаемый Александр Анатольевич?



#283 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 08 Март 2016 - 17:35

Вы хотите ревизии, Валерий Павлович? :)

У  меня вопросы только по скоростям мутации, но это требует длительной проверки. И то, только для гаплогрупп, по которым калибровка не проводилась. Возможно для них принятые константы будут давать приемлемый результат. Но это дело хлопотное и потребует значительного времени.

Сейчас я предлагаю подумать вот над чем.

Есть 532 гаплотипа гаплогруппы Т. Это случайная выборка из генеральной совокупности (т.е. из всех ныне существующих гаплотипов). Неукорененное дерево имеет вид:

696167f7a718t.jpg

Это тоже самое дерево, что и здесь:

http://dna-genealogy...ge-14#entry2469, но в другом, более наглядном виде.

Видно что в секторе между 6 и 9 "часами"  большой выброс. По сути это и есть несогласованность выборки. Эта выборка даёт TMRCA 6616+-664.

Два вопроса:

1. Если появятся ещё 500 гаполотипов, какое время они покажут?

2. Время 1000 гаплотипов будет больше или меньше чем у 532?



#284 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 08 Март 2016 - 19:40

Гаплогруппа - это только буква на Филогенетическом древе Y-хромосомы. Как от неё что-то может зависеть?

 

Что Вы называете "несогласованностью" выборки? Это что-то новое?

 

1. Новые 500 гаплотипов дадут новую интересную информацию о возрасте и путях миграций гаплогруппы Т, думаю.

2. Вопрос поставлен некорректно. Если считать правильно - с разбивкой по ветвям, ничего не изменится, кроме точности.



#285 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 08 Март 2016 - 22:30

Скорее всего, следующие 500 гаплотипов дадут, примерно, 6,5 т.л.н., если они будут собраны из разных мест. 1000 гаплотипов покажет тоже самое.

Проверим это на существующей выборке из 532 гаплотипов. Я ее разделил случайным образом на две равные части по 266 гаплотипов.



#286 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 08 Март 2016 - 22:40

Первая выборка:

15f2a3935ecet.jpg

 

ТMRCA = 6468+-652



#287 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 08 Март 2016 - 22:50

Вторая выборка:

5f915b5c2823t.jpg

 

ТMRCA =6834+-688



#288 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 08 Март 2016 - 23:01

Теперь ещё один эксперимент. Из выборки беру каждый третий гаплотип. Причем половина входит в первую выборку, а вторая половина - во вторую. Всего 178 гаплотипов:

72d4dab7f4e1t.jpg

 

TMRCA=6456+-653



#289 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 08 Март 2016 - 23:28

Случайные выборки дают результат между 5800 и 7500 годами. Среднее 6500.

Можно предположить, что при дальнейшем увеличении числа гаплотипов сохранится та же тенденция.

Через пару лет посмотрим.



#290 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 08 Март 2016 - 23:51

Какой смысл в этих выборках? Счёт идёт поперёк ветвей, в итоге получается средняя температура по больнице. Полагаю, никакого смысла в этих упражнениях нет. И через пару лет в них будет ровно столько же смысла.



#291 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 09 Март 2016 - 09:18

Эти выборки мне нужны для других целей. Но об этом позже.

А диапазон указывает на то, что древнее 7500 лет общего предка для отдельных ветвей , скорее всего, не будет.

Такая грубая оценка. Но проверить стоит.



#292 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 09 Март 2016 - 15:45

...

А диапазон указывает на то, что древнее 7500 лет общего предка для отдельных ветвей , скорее всего, не будет.

...

Чего проще, Александр Анатольевич - посчитайте возраст между крайними ветвями, а не случайную выборку, и получите не "скорее всего", а точный результат. Вам что-то мешает это сделать?



#293 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 10 Март 2016 - 07:46

Так не интересно, Валерий Павлович!

Филогенетические деревья гаплотипов обычно строятся при помощи программы PHYLIP

(См.http://dna-genealogy...e-11#entry2099)

Обычно я использую метод neighbour-joining.

Вот как его описывают специалисты:

"Метод связывания ближайших соседей (neighbour-joining) не накладывает требования ультраметричности исходных данных и позволяет строить адекватные деревья для данных с различной скоростью эволюции ... Метод работает следующим образом. Первоначально предполагается полностью неразрешенное дерево (структура типа звезда – каждый таксон связан с общей центральной точкой). Выбирается одна из последовательностей и сравнивается поочередно со всеми остальными и определяется наиближайшая к ней последовательность. После этого данные последовательности объединяются, на строящемся дереве появляется новый узел, и пересчитываются расстояния от него до остальных последовательностей. Объединенные последовательности далее не участвуют в построении дерева, и процесс повторятся для других последовательностей до момента исчерпания всех данных. При этом строится неукорененное дерево. Преимущества метода: высокая скорость и, следовательно, возможность обработки больших объемов данных (например, полученных при bootstrap анализе), возможность построения де-
рева при различной скорости мутаций, возможность коррекции для множественных замещений (multiple
substitutions), простота алгоритма.
Недостатки метода заключаются в том, что строится только одно из возможных деревьев (определяется первой выбранной последовательностью), имеется сильная зависимость от используемой модели эволюции и исключается возможность применения принципа «молекулярных часов», то есть нельзя рассчитать примерное время дивергенции между сравниваемыми последовательностями".(Ю.П.Волков, Г.А.Ерошенко, 2009г.)

Исходя из сущности метода я предлагаю разделить выборку из 532 гаплотипов другим способом. Вот часть дерева этих гаплотипов ( представлена топология):

e99622cd43dat.jpg.

Видно, что "листья" (т.е. конечные точки) дерева образуют либо "вилку" ( 85389 и 85555), либо "побег" (59037, 125618).

В одну корзину я сложу "вилки", а в другую "побеги". На это уйдёт некоторое время.



#294 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 11 Март 2016 - 05:40

Сортировка дала следующий результат. Первая выборка состоит из 368 гаплотипов (это "вилки"). Из них получилось вот такое дерево:

38206678f720t.jpg

Выглядит весьма коряво, а значит с ним ещё надо будет поработать.

TMRCA= 6552+-659 лн.

 

Вторая выборка состоит из 164 гаплотипов (это "побеги").  Дерево "выросло" такое:

b633e3dc8195t.jpg

TMRCA= 6755+-683 лн

 

Что мы видим?

1.Структура деревьев для любых выборок примерно одинакова.

2. TMRCA выборок "упорно" колеблется вокруг цифры 6500 лн.

3. На данном этапе вполне уместно предположить, что самое древнее TMRCA следует поискать в выборке из 164 гаплотипов. Выборка будет сортироваться тем же методом - "вилки" в одну сторону, "побеги" в другую.

 

Дело. конечно, хлопотное, займет некоторое время, но посмотрим, что получится.



#295 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 11 Март 2016 - 12:18

Какой физический смысл имеет древо побегов, например? Или вилок?



#296 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 12 Март 2016 - 12:58

При построении дерева идет последовательное объединение "родственных" элементов. "Вилки" это наиболее, с точки зрения алгоритма, близкие элементы (т.е. ближайшие соседи). Они задают структуру дерева. Соответственно можно предположить, что совокупность "вилок" даст TMRCA меньше, чем дерево "побегов". Что мы и увидели на первом этапе.

Т.о. физический смысл в том, что при такой сортировке, получаем две выборки. Одна - "ближайшие родственники" (соседство через один узел); вторая - все остальные.



#297 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 12 Март 2016 - 13:23

В выборке из 164 гаплотипов, "побегов" нашлось ровно 60. Соответственно "вилок"  - 52 (т.е.104 гаплотипа).

Дерево из 104 гаплотипов имеет вид:

94c28852d7a4t.jpg

TMRCA =6413+-653 лн.

Над этой выборкой надо ещё поработать.

А вот дерево из 60 гаплотипов:

cd0bfad7d0b9t.jpg

Идеальная подборка. TMRCA = 7397+-761 лн.



#298 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 13 Март 2016 - 12:58

В вилках, я так понимаю, обрезаются верхи, а в листьях низы филогении. Смысла в этом не вижу, даже "прививку" продуктов гомоплазии на чужую ветвь не сделать - снипы не дадут.



#299 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 14 Март 2016 - 11:21

Верх и низ понятие условное. На филогенетическом дереве родственными таксонами считаются те, между которомыми не более одного узла. Таксоны из одного гаплотипа и есть "листья". "Побег" - это лист, к которому через узел присоединен таксон из двух и более гаплотипов.

Я сомневаюсь, что кто-то будет отрицать, что любая выборка гаплотипов это дело случая. Её, например, могли собрать в конкретном месте в конкретное время. Её могли собирать из одного места в течении длительного времени или из многих мест в течении короткого времени. И цель могла быть разная.

База FTDNA представляет собой "свалку", куда собираются гаплотипы из разных мест в течении длительного времени. Общее, что их объединяет - это наличие интереса и свободных денег  у клиентов FTDNA.

 У любого здравомыслящего человека сразу возникнет вопрос, а что отражают эти выборки? Кто интересовался антропологией, то наверняка в наукообразных статьях натыкался на фотографии "среднего русского" или "среднего немца". Десятки фотонегативов мужчин или женщин из одной местности совмещались по зрачкам и этот пакетный негатив давал отпечаток лица с размытыми чертами - вот он "средний" земеля. Какой прок от такой фотки? Наверное с трудом можно найти, но измерения черепов дают неизмиримо больше пользы, например для местной шляпной фабрики. Но и их интересуют не все возможные размеры, а те, минимум которых при минимуме затрат на фабричную оснастку даст максимальную выгоду.

Я понимаю ваш скепсис, Валерий Павлович, но предлагаю задачку:

Представим, что база FTDNA это лотерейный ящик, откуда случайным образом можем вынуть N-ое количество гаплотипов (например, 67-маркерных).

Какова вероятность (чисто логическая, считать ничего не надо), что полученная выборка соответствует действительному распределению гаплогрупп среди мужского населения Земли?



#300 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 14 Март 2016 - 11:43

Скепсиса нет, есть знание. Да и Вам наверняка известна эта таблица, Александр Анатольевич:

 

aak-tabl-r1a.jpg

Ссылка - http://pereformat.ru...giya-voprosy-3/

 

Что касается предложенной Вами выборки, то вероятность попадания в действительное распределение равна, грубо, отношению количества выбранных гаплотипов к числу протестировавшихся.






0 пользователей читают эту тему

0 пользователей, 0 гостей, 0 скрытых

Copyright © 2024 Академия ДНК-генеалогии. Климатический филиал