Перейти к содержимому

 

Фото

Маленькие Истории Рода Т


  • Чтобы отвечать, сперва войдите на форум
449 ответов в теме

#201 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 14 Июль 2015 - 21:22

Можно и там. Однако гаплогруппа Т пока единственная гаплогруппа, которая территориально и по возрасту претендует на прямых наследников строителей мегалитических сооружений Баальбека, Италии и Северной Африки. Поэтому данное обсуждение, которое касается не только Большого сфинкса, здесь более уместно, на мой взгляд. Но решать Вам, Александр Анатольевич!

Будем иметь это ввиду и пользоваться ;) ! Но у меня есть общие вопросы и есть специальная тема. А здесь , я думаю, будут отражаться мысли по поводу гаплогруппы Т и её места среди других гаплогрупп с перекрёстными ссылками.



#202 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 15 Июль 2015 - 12:23

Хорошо, Александр Анатольевич. Сейчас сделаю ссылку и перенесём разговор о мегалитах и катастрофах туда.



#203 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 15 Июль 2015 - 15:43

Хорошо, Александр Анатольевич. Сейчас сделаю ссылку и перенесём разговор о мегалитах и катастрофах туда.

Спасибо



#204 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 26 Июль 2015 - 00:05

К июлю 2015 года в базах данных FTDNA скопилось 503 67-маркерных гаплотипа. Они сведены в таблицу Excel:

https://docs.google....dit?usp=sharing

Для удобства работы с программой PHYLIP номера гаплотипов дополнены до десяти знаков.

Эти 503 гаплотипа дают TMRCA=7000+-1100 лет назад. Интересно, что в 12-маркерном формате эти 503 гаплотипа дают TMRCA=7100+-1100 лн. Казалось бы, полное совпадение и можно на этом закончить. Но однородность выборки требует проверки. Сделать это можно построив филогенетическое дерево этих гаплотипов при помощи программы PHYLIP.



#205 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 26 Июль 2015 - 13:45

Но прежде всего надо зайти по адресу:

http://www.mymcgee.c...mode=ftdna_mode

и подготовить входные данные для PHYLIP.

Перед нами открывается утилита "Y-Utility: Y-DNA Comparison Utility, FTDNA Mode".

Для начала необходимо её настроить ( поставить или отключить соответствующие галочки):

Exists - оставляем всё как есть.

Enable - оставляем необходимые 67 маркеров в порядке как в исходной таблице гаплотипов, для чего отключаем DYS19b, DYS464(e,f,g) и все с DYS461 по DXYS156-Y.

Остальное должно быть отключено за исключением:

Genetic Distance "Hibrid mutation model"

Highlight Reference "None"

ID Column ''1''

1st Data Column ''2''.

Теперь копируем 503 гаплотипа с их номерами и вставляем в окно утилиты "Paste haplotypes rows here..."

Нажимаем кнопку "Execute'' и ждём когда в новом окне сформируется таблица.



#206 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 26 Июль 2015 - 14:07

Таблица будет иметь вид как на рисунке:

f53037d5e402t.jpg

Здесь показан левый верхний угол, так как таблица или, точнее, матрица состоит из 503 колонок и 503 строчек на пересечении которых указана дистанция между гаплотипами.

Дистанция - это количество мутаций на которое отличаются два гаплотипа по всем 67 маркерам. Если гаплотип сравнивается с самим собой, то на пересечении стоит прочерк, означающий отсутствие мутаций. Чем меньше дистанция, тем ближе по структуре два гаплотипа, а значит теснее родственные узы людей, которым принадлежат эти гаплотипы.

Цветовой код помогает быстро определить степень родства двух гаплотипов:

зелёный - от 1 до 6 мутаций - высокая степень ( общий предок жил от 100 лет назад до 630)

желтый - 7 мутаций - средняя степень ( общий предок жил примерно 730 лет назад)

розовый - от 8 до 9 мутаций - малая степень (общий предок жил от 830 лет назад до 930 лет)

Отсутствие цвета - от 10 мутаций и выше - очень дальняя (общий предок жил от 1000 лет назад и выше)

Такой подход весьма поверхностный, но для первичной прикидки может быть использован. По матрице уже видно, что большинство гаплотипов разошлись во времени и однородностью здесь не пахнет.



#207 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 26 Июль 2015 - 16:29

Теперь надо открыть новую книгу Excel и на лист 1 скопировать матрицу. Операция зависит от производительности компьютера и может занять много времени. Если операция прошла удачно, то утилита нам больше не нужна. Дальнейшая работа будет продолжаться в Excel :

https://docs.google....dit?usp=sharing



#208 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 26 Июль 2015 - 21:38

Дополнительная проверка выявила два дубликата среди гаплотипов. Их количество уменьшилось до 501.

https://docs.google....dit?usp=sharing

На первой вкладке "Дистанция" скопирована матрица из утилиты.

На второй вкладке "Заготовка" скопирован только 501 гаплотип с названием.

На третьей вкладке "Пересчет" данные со второго листа пересчитаны с учетом возвратных мутаций по формуле =IF('Заготовка'!B1="-";0;ROUND('Заготовка'!B1*(1+EXP('Заготовка'!B1/67))/2;0)). Одновременно знак "-" в диагонали заменен на 0.

Данные третьей вкладки скопированы на четвертый лист "Файл" в виде специальной вставки "значение" (без формул).

Затем надо открыть программу "Блокнот" и скопировать в неё данные листа "Файл".

В первую строчку текстового файла записывается число 501, означающее количество гаплотипов в выборке. Вcё это будет выглядеть так:

https://docs.google....dit?usp=sharing

Файл сохраняется под именем infile.txt. Он будет использован для запуска программы PHYLIP.



#209 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 30 Июль 2015 - 02:37

Программа PHYLIP доступна здесь:

http://evolution.gen...edu/phylip.html

Каждый может выбрать вариант под свою вычислительную платформу. В результате вы окажетесь владельцем папки с именем "phylip-3.695", набитой многими интересными вещами:

53bce5da6587t.jpg

Но для построения дерева гаплотипов нужны не все файлы.

В удобном месте лучше создать отдельную папку с именем , например,  "Tree". Скопировать туда из папки "exe" ( смотри рисунок) два файла:

1) font1 (это шрифт, всего доступно шесть вариантов)

2) neighbor.exe ( это алгоритм кластеризации данных, всего доступно три-обозначены оранжевым прямоугольным треугольником)

Теперь можно начать расчёты.



#210 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 01 Август 2015 - 14:04

В папку "Tree" копируем файл "infile.txt" и переименовываем в "infile". Запускаем файл "neighbor.exe". Должно появиться окно:

bf7e22ab7201t.jpg

Вводим в него ключ "Y" и жмём "Enter".

Если имена гаплотипов сформированы корректно ( десять цифр и латинских букв, включая пробелы), то происходит расчёт и в папке появляется ещё два файла - "outtree" и "outfile". Для построения дерева необходим файл "outtree". Делаем его копию и переименовываем в "intree".



#211 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 01 Август 2015 - 14:21

В пакете PHYLIP есть средства, которые используют файл "intree'' для отрисовки филогенетического дерева. Я же пользуюсь программой Mega 5.05.

Загрузив в неё файл ''intree'', получаем дерево:

bc0f770f9c1dt.jpg

Это дерево сохраняется под расширением ''.nwk'', например ''Tree.nwk''.

Теперь в программе Mega5.05 можно это дерево представить в любом виде:

aa293ba59343t.jpg

 

a08c36fc7ee1t.jpg

и так далее.



#212 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 30 Август 2015 - 10:59

В последнем сообщении изображено дерево из 501  гаплотипа 67-ми маркерного формата.

Всё собирался обработать 111-ти маркерные гаплотипы, но руки не доходили. И вот удача,за меня это сделали другие  - в Вестнике №3 за 2015г. Появилась статья "Калькулятор Килина-Клёсова для расчета времен до общих предков (TMRCA): Новое издание. А.А. Клёсов, В.В. Килин".

В ней приведено дерево гаплогруппы Т из 164 гаплотипов в 111-маркерном формате:

20052e170608t.jpg

Линейный метод калькулятора Килин-Клёсов по 111 маркерам показал TMRCA= 7198±725 лет.

Как всегда, отмечена неоднородность гаплотипов этого дерева.

 

Так как калькулятор Килин-Клёсов, судя по описанию, превратился в весьма интересный инструмент, то захотелось его опробовать и просчитать на нем 501 гаплотип моего дерева.



#213 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 30 Август 2015 - 12:32

При 797 МГц процессоре и 1,37 ГБ ОЗУ файл калькулятора открывается за 9 минут. Явно, для комфортной работы, требуется более мощное железо.

Сам расчет для 501 гаплотипа прошел за минуту.

Почему-то не прошел расчет по ККК22. Для остальных:

353ec232f11ct.jpg

Для 67 маркерного формата TMRCA=6619+-664 л.н.

Видим хорошее совпадение между 12 маркерным и 67 маркерным форматом- ~4%

Мой калькулятор, которым я обычно пользуюсь, даёт TMRCA67=7000+-1100 лн и TMRCA12=7100+-1100 лн. Расхождение с КК не более 6%.

Дальнейшие расчеты будут проводится на моём калькуляторе.



#214 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 30 Август 2015 - 13:24

В статье есть такие слова:

"Для людей, не слишком разбирающихся в ДНК-генеалогии, покажется странным разброс данных по разным форматам гаплотипов, но это –
отражение реальности. На самом деле очень хорошо, что такой разброс сразу демонстрируется, чтобы лишить некоторых ложных иллюзий о
точности расчетов. Точности в расчетах быть не может именно из-за статистического характера мутаций и из-за неоднородностей в сериях
гаплотипах, но даже при столь заметных погрешностях расчетов они очень часто являются исключительно ценным инструментом в
исторических и лингвистических исследованиях".
С этим трудно не согласиться.

Но, вообще-то, статья Клёсова затрагивает, на мой взгляд, более глубокую проблему, чем точность расчетов при разных форматах гаплотипов.

Она заставляет опять задуматься над вопросом скорости мутации в разных организмах. Здравый смысл подсказывает, что эта скорость разная у разных видов, подвидов и вплоть до индивида. Нет и не может быть единой скорости мутации для всех гаплогрупп или субкладов. Но, к счастью, статья даёт надежду, что разброс не выходит за те пределы, когда статистика превращается в мираж.



#215 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 30 Август 2015 - 23:05

На мой взгляд, неверное обобщение. От разных форматов гаплотипов через неоднородности выборок к разным организмам. А что мы сравниваем в разных организмах, если они разные? Устройство "копировальной машины"?

 

Если мы сравниваем гаплотипы людей, то там скорости статистически одинаковые для всех гаплогрупп, а погрешность объясняется случайным характером мутаций. Чем больше выборка, тем больше точность и нет там никаких выскоков за пределы установленных статистических констант/закономерностей. Если что-то ускакало очень далеко, то и вероятность такого события стремится к нулю. А уже в исторических, лингвистических исследованиях эти выскоки вообще никакой роли не играют. Ну не узнаем мы никогда прямых потомков "человека с Маркиной горы", как нам это помешает выстраивать картину миграций древнего человека?



#216 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 31 Август 2015 - 08:33

На мой взгляд, неверное обобщение. От разных форматов гаплотипов через неоднородности выборок к разным организмам. А что мы сравниваем в разных организмах, если они разные? Устройство "копировальной машины"?

Дело не в разных форматах, а в разной картине для разных гаплогрупп. Посмотрите фрагмент таблицы:

 

   111-марк 67-марк 37-марк

E1b 9801 9241 8258 (отношение 1.19 и 1.12)
I1 3686 3618 3469 (1.06 и 1.04)
I2 9575 9324 6895 (1.39 и 1.35)
I2, branch 3542 3517 2999 (1.18 и 1.17)
I2, branch 5066 5098 5168 (0.98 и 0.99)
I2, branch 7285 6986 4920 (1.48 и 1.42)
J1 3245 3355 3369 (0.96 и 0.996)
J1, branch 8469 8114 8274 (1.02 и 0.98)
J2 9914 8993 8219 (1.21 и 1.09)
J2, branch 8993 7980 7493 (1.20 и 1.06)
J2, branch 7362 7226 6579 (1.12 и 1.10)
N1c1 3233 3287 3461 (0.93 и 0.95)
R1a 3946 4386 4578 (0.86 и 0.96)

 

Разброс от -14% до +48%. Итого 62%.

Разброс от -4% до +42%. Итого 46%.

Чем сложнее модель сравнения, тем больше разброс.

Напомню: TMRCA зависит от количества накопленных мутаций и от ПОСТОЯННОЙ скорости их накопления. Количество мутаций зависит от выборки, а константа от модели человека (формата гаплотипа).



#217 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 31 Август 2015 - 13:50

СТАТИСТИЧЕСКИ постоянной.

 

Что касается перекоса в сторону "плюса", то здесь Вы, возможно, нашли то же самое, что постоянно выскакивает у меня при сравнении возрастов TMRCA с палеоклиматическими данными. По моим данным, вычисленный возраст образования новой ветви всегда не дотягивает до климатического события, ставшего причиной прохождения популяцией бутылочного горлышка. Несколько лет назад у нас с Анатолием Алексеевичем и Игорем Львовичем состоялось обсуждение этого вопроса. Тогда из-за трений с Павлом мне пришлось уйти с форума, обсуждение состоялось по почте и поэтому не получило развития. Но пару строк об этом я написал в "... и снова открытие Китая" - т. 4, № 3, стр. 596.

 

Если учесть "область тени", то погрешности, возможно, примут статистически корректный характер и увеличение погрешности с уменьшением протяжённости гаплотипов не потребует изобретения "новых сущностей" в виде "модели человека". Тем не менее, усложнение расчётной части ничего принципиально нового не даст - эта область и так накрывается погрешностью, которая тем выше, чем короче гаплотипы и временнАя дистанция.



#218 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 31 Август 2015 - 21:16

... не потребует изобретения "новых сущностей" в виде "модели человека"...

Гаплотип это и есть "модель" конкретного человека и об этом забывать не надо. Эта модель отражает пройденный путь от первопредка до конкретной личности. Можно вспомнить статью А.Клёсова "СЕ-ЧЕЛОВЕК", с которой, кстати, начался мой интерес к ДНК-генеалогии.

 

Тем не менее, усложнение расчётной части ничего принципиально нового не даст - эта область и так накрывается погрешностью, которая тем выше, чем короче гаплотипы и временнАя дистанция.

Вот об этом я и говорю в сообщении #214:

"Но, к счастью, статья даёт надежду, что разброс не выходит за те пределы, когда статистика превращается в мираж".

 

 



#219 Лабай А.А.

Лабай А.А.

    Advanced Member

  • Members
  • PipPipPip
  • 794 сообщений

Опубликовано 31 Август 2015 - 21:40

СТАТИСТИЧЕСКИ постоянной.

 

Что касается перекоса в сторону "плюса", то здесь Вы, возможно, нашли то же самое, что постоянно выскакивает у меня при сравнении возрастов TMRCA с палеоклиматическими данными.

Это не я нашел, а Клёсов.  И статистика говорит, что скорость мутации в большинстве  субкладов более высокая, чем эталонная. Но в некоторых она меньше. Да и эталонная скорость это, по сути, усредненная по нескольким родословным.



#220 В.Юрковец

В.Юрковец

    Advanced Member

  • Administrators
  • 1 417 сообщений

Опубликовано 01 Сентябрь 2015 - 14:18

Но перекос таки имеет место быть, замечу.






0 пользователей читают эту тему

0 пользователей, 0 гостей, 0 скрытых

Copyright © 2024 Академия ДНК-генеалогии. Климатический филиал