Assembly ASM291031v2 (Genbank: GCA_002910315.2) identified as assembly of the Northern Dolly Varden (Salvelinus malma malma) genome, and not the Arctic char (S. alpinus) genome
1 ASSEMBLY ASM291031v2 (GENBANK: GCA_002910315.2) IDENTIFIED AS ASSEMBLY OF THE NORTHERN DOLLY VARDEN (
Salvelinus malma malma ) GENOME, AND NOT THE ARCTIC CHAR ( S . alpinus ) GENOME S.V. Shedko Federal Scientific Center of the East Asia Terrestrial Biodiversity, Far Eastern Branch of the Russian Academy of Sciences, Vladivostok, 690022 Russia e-mail: [email protected]
To date, twelve complete genomes representing eleven species belonging to six genera have been sequenced in salmonids. For the genus
Salvelinus , it was supposed to sequence the genome of Arctic char, one of the most variable species of vertebrate animals. Sequencing was carried out (Christensen et al., 2018) using the tissues of the female IW2-2015 obtained from the company engaged in industrial aquaculture of chars – Icy Waters Ltd. The company exploits two of its own broodstocks – NL and TR, originating from the chars from the Nauyuk Lake and the Tree River (Nunavut, Canada). Since the complete mitochondrial genome of the female IW2-2015 was absent in the published assembly ASM291031v2, we determined its type and complete sequence from the sequence read archives taken from Genbank. It was found that the female's mitogenome belongs to the BERING haplogroup, which is characteristic of Northern Dolly Varden
S. malma malma . Analysis of other unlinked diagnostic loci encoded by nuclear DNA (ITS1, RAG1, SFO-12, SFO-18, SMM-21) also revealed distinctive characters of Northern Dolly Varden in female IW2-2015. It was concluded that the genomic assembly ASM291031v2 was obtained not from an individual of Arctic char
S. alpinus , but from an individual of a related species – Northern Dolly Varden
S. malma malma . The identical to the IW2-2015 female characteristics of diagnostic loci were found in other individuals from the broodstock TR. Apparently, the broodstock TR is entirely a strain derived from Northern Dolly Varden. The choice of a specific specimen for sequencing and assembling the genome of a species is no less important than the choice of a species, since both of these choices determine the directions for subsequent data use. Assembly ASM291031v2, of course, is important for the study of the genomic architecture of the aquaculture strain TR. However, since it was obtained from a specimen originated from the marginal population (Tree River) isolated from the main range of the species and with some traces of introgressive hybridization, this assembly can hardly be considered as a description of a typical genome of Northern Dolly Varden. Supplementary Data: https://github.com/svshedko/CHARgenome
Keywords: nuclear genome, mitochondrial genome, assembly, Salmonidae УДК
СБОРКА
ASM291031v2 (GENBANK: GCA_002910315.2)
ИДЕНТИФИЦИРОВАНА
КАК
СБОРКА
ГЕНОМА
СЕВЕРНОЙ
МАЛЬМЫ ( Salvelinus malma malma ), А НЕ ГЕНОМА
АРКТИЧЕСКОГО
ГОЛЬЦА ( S. alpinus ) С . В . Шедько
Федеральный научный центр
Биоразнообразия наземной биоты
Восточной
Азии
Дальневосточного отделения
Российской академии наук , Владивосток , 690022 e-mail: [email protected]
АННОТАЦИЯ У лососевых рыб к настоящему моменту секвенировано двенадцать полных геномов , представляющих одиннадцать видов , принадлежащим шести родам . В роде Salvelinus предполагалось секвенировать геном арктического гольца – одного из самых изменчивых видов позвоночных животных . Секвенирование проведено (Christensen et al., 2018) с использованием тканей самки IW2-2015, полученной от компании Icy Waters Ltd, занимающейся промышленной аквакультурой гольцов . Icy Waters Ltd в производстве эксплуатирует два собственных маточных стада NL и TR, ведущих свое начало от гольцов из оз . Нуаяк и р . Три ( провинция Нунавут , Канада ) соответственно . Поскольку в опубликованной сборке ASM291031v2 полный митохондриальный геном самки
IW2-2015 отсутствовал , то его тип и полная последовательность были установлены нами из архивов прочтений , взятых из Genbank. В результате оказалось , что митогеном самки IW2-2015 относится к гаплогруппе BERING, характерной для северной мальмы
S. malma malma . Анализ других несцепленных диагностических локусов , кодируемых ядерной ДНК (ITS1, RAG1, SFO-12, SFO-18, SMM-21), также выявил у самки IW2-2015 отличительные черты северной мальмы . Сделан вывод , что геномная сборка ASM291031v2 получена не от особи арктического гольца S. alpinus , а от особи близкого вида – северной мальмы S. malma malma . Такие же , как у самки IW2-2015, состояния характеристик диагностических локусов были найдены и у других особей из маточного стада TR. По - видимому , маточное стадо TR целиком является линией , производной от северной мальмы . Выбор конкретной особи для секвенирования и сборки генома какого - либо вида не менее важен , чем выбор вида , поскольку оба этих выбора определяют направления последующего использования данных . Сборка
ASM291031v2, безусловно , имеет важное значение для исследования геномной архитектуры аквакультурной линии TR.
Однако , поскольку она была получена от особи , происходящей из краевой популяции , изолированной от основного ареала вида и с некоторыми следами произошедшей интрогрессивной гибридизации , эта сборка вряд ли может рассматриваться как описание типичного генома северной мальмы . Ключевые слова : ядерный геном , митохондриальный геном , сборка , Salmonidae. Гольцы рода
Salvelinus – одна из эволюционных линий лососевых рыб сем . Salmonidae, распространенная в Северном полушарии , преимущественно в его высоких широтах . Многие из видов гольцов издавна привлекали внимание исследователей своим исключительным морфологическим разнообразием , проявляющимся не только при сравнении географически изолированных популяций , но и при рассмотрении их внутри одной и той же водной системы . Гольцы – одни из доминантов в бедных видами северных ихтиоценозах . Ведя в основном проходной образ жизни , гольцы , тем не менее , не способны переносить низкую зимнюю температуру вод с морской соленостью . Поэтому большую часть года они проводят в пресных водах , оказываясь при этом доступными местному населению как источник ценной деликатесной пищи . Арктический голец
S. alpinus – циркумполярно распространенный вид , в котором отличительные черты гольцов проявляются наиболее ярко . Арктический голец по праву может считаться одним из самых изменчивых видов позвоночных животных (Klemetsen et al., 2003; Klemetsen, 2010, 2013). Его ареал ближе к северному полюсу , чем ареал любого из видов пресноводных или проходных рыб . Арктический голец имеет важное значение как объект спортивного рыболовства , промысла и аквакультуры (Johnston, 2006). Поэтому не удивительно , что среди всех видов Salvelinus первым в очереди на секвенирование и аннотацию полного генома оказался именно арктический голец . Для секвенирования генома арктического гольца , его сборки и аннотации (Christensen et al., 2018) была использована небольшая (20 см ) самка ( её идентификатор – IW2-2015), полученная от компании Icy Waters Ltd, занимающейся промышленной аквакультурой гольцов . Компания является одним из крупнейших производителей продукции ( мясо - филе , икры ) из искусственно выращенных гольцов для реализации на рынках Северной
Америки . В своем производстве Icy Waters Ltd использует два маточных стада гольцов – NL и TR, ведущих свое начало от особей , взятых соответственно из природных популяций гольцов оз . Нуаяк и р . Три , расположенных на арктическом побережье Канады в зал . Коронации , регион Китикмеот , провинция Нунавут (Goel, 2004; Johnston, 2006; McGowan et al., 2009).
При ознакомлении со сборкой генома арктического гольца ASM291031v2 и сопровождающей её публикацией (Christensen et al., 2018) обратило на себя внимание следующее противоречие . В статье на второй странице указано , что гольцы из оз . Нуаяк и р . Три имеют митохондриальную
ДНК ( мтДНК ), относящуюся к гаплогруппе ARCTIC.
Однако , в Genbank в качестве сборки неядерного генома арктического гольца (RefSeq: GCF_002923155.1) приведен митогеном из гаплогруппы ACADIA (GenBank: AF154851.1=NC_000861.1), полученный ранее в другом исследовании (Doiron et al., 2002) и для других гольцов c северо - востока Квебека ( Канада ). Проведенное нами в попытке прояснить эту ситуацию картирование прочтений геномной ДНК (Genbank: SRX3776048–SRX3776052), а также прочтений РНК - секвенирования (Genbank: SRX2635048, SRX2635052) на диагностические гаплотипы мтДНК гольцов показало , что митогеном самки IW2-2015 однозначно принадлежит к мтДНК - гаплогруппе BERING, характерной , как известно , не для арктического гольца , а для северной мальмы – S. malma malma (Brunner et al., 2001).
Другие привлеченные диагностические маркеры также свидетельствовали о том , что самка IW2-2015 скорее всего является представителем северной мальмы , а не арктического гольца . Результаты этого анализа изложены ниже . МАТЕРИАЛ И МЕТОДИКА В качестве материала была использована сборка генома самки IW2-2015 ASM291031v2 (GenBank: GCA_002910315.2), а также архивы прочтений её ДНК (GenBank: SRX3776048–SRX3776052) и РНК из тканей печени и предпочки (GenBank: SRX2635048, SRX2635052). Кроме того , анализировались архивы прочтений геномной ДНК , полученные для двух особей гольцов из маточного стада TR компании Icy Waters Ltd – SRX5282523, SRX5282524 и нескольких комбинаций гибридов племенных линий TR и NL: TR ♂ × NL ♀ – SRX5282528, SRX5282529; (TR ♂ × NL ♀ ) ♂ × NL ♀ – SRX5282525; TR ♂ × ((TR ♂ × NL ♀ ) ♂ × TR ♀ ) ♀ – SRX5282526. Идентификация принадлежности особей , послуживших источником геномных данных , осуществлялась с использованием шести маркеров : мтДНК и пяти локусов ядерной ДНК – ITS1, RAG1, SFO-12, SFO-18, SMM-21. У альпиноидных ( арктический голец и близкие или производные от него формы ) и мальмоидных ( северная мальма S. malma malma и близкие или производные от неё формы ) гольцов по структуре контролирующего региона мтДНК ранее было выделено шесть гаплогрупп – ATLANTIC, SIBERIA, ACADIA, ARCTIC, BERING (Bruner et al., 2001) и OKHOTSKIA (Shedko et al., 2007). У арктического гольца Северо - Западных
Территорий и провинции Нунавут распространена гаплогруппа
ARCTIC при абсолютном доминировании в выборках гаплотипа ARC19 (Moore et al., 2015). У северной мальмы на Аляске и Северо - Западных
Территориях , как и в азиатской части ареала , господствует гаплогруппа BERING.
Доля гаплотипа
BER12 из этой гаплогруппы в выборках часто доходит до и более процентов , как , например , в выборках мальмы с Командорских о - вов или Камчатки [(Soshnina et al., 2016): гаплотип под номером
KT962126].
Гаплотипы
ARC19 (Genbank: EU310899) и BER12 (Genbank: JX261984) различаются по девяти из нуклеотидных позиций маркерного участка контролирующего региона мтДНК ( восемь из них – диагностические для гаплогрупп в целом ). Эти два гаплотипа выступили в качестве референсных при экспресс - диагностике типа мтДНК - гаплогрупп в геномных данных . Для сборки митогеномов целиком прочтения картировали на соответствующие варианты полных митогеномов : ARC19 – MF621741 (Genbank) и BER12 – KJ746618 (Genbank).
Первый внутренний транскрибируемый спейсер (ITS1) является составной частью тандемных повторов рибосомальной
ДНК ( рДНК ), располагающейся у альпиноидных и мальмоидных гольцов на одной или нескольких парах хромосом (Phillips et al., 1999). Альпиноидным и мальмоидным ( исключая южную американскую мальму S. malma lordi ) гольцам присущи разные варианты ITS1, отличающиеся недвусмысленными замещениями в позициях
92 (C/T), 285 (T/A), 448 (C/A), 449 (T/A), 450 (G/C) и
453 (A/C) (Phillips et al., 1999).
Координаты приведены относительно последовательности
AF059893 (Genbank), выбранной как маркерная для альпиноидного варианта . Для идентификации мальмоидного варианта
ITS1 в этом качестве выступила последовательность AF059900 (Genbank). В геномах лососевых рыб ген RAG1 ( ген активирующий рекомбинацию присутствует в виде одной копии . Этот ген у лососевых имеет сравнительно низкую скорость эволюции , но несет в себе ясный филогенетический сигнал (Shedko et al., 2012a). Альпиноидным и мальмоидным гольцам свойственны разные варианты гена RAG1 ( а именно – фрагмента второго экзона , длиной пн ), отличающиеся недвусмысленными замещениями в позициях
285 (G/A) и Координаты даны относительно последовательности гена
RAG1 северной мальмы
S. malma malma
GQ871481 (Genbank), выбранной в качестве референсной . Исследование состава аллелей в микросателлитном локусе SFO-12 у разных видов гольцов из их различных популяций показало (Angers, Bernatchez, 1997; Wilson, Bernatchez, 1998), что арктическому гольцу ( подчеркнем , что в первой из указанных работ имелись образцы непосредственно из оз . Нуаяк ) свойственен аллель SFO-12(225), а северной мальме S. malma malma и её сателлитным формам ( белому гольцу р . Камчатки , например ) аллель SFO-12(223).
Различие этих аллелей определяется разным числом
TG- повторов по обе стороны от GG- димера : (TG) GG(TG) и (TG) GG(TG) соответственно . Из - за этого идентификация этих двух аллелей получается вполне однозначной , несмотря на минимальную разницу в их длине . Последовательности этих аллелей вместе с фланкирующими их участками были восстановлены исходя из рис . 1–2 работы (Angers, Bernatchez, 1997). Их длина в результате оказалась равной
221 ( для аллеля , обозначенного в цитированной работе как и
223 ( для аллеля под кодом
Такие же их длины получены при анализе геномных данных . Аллели микросателлитного локуса
SFO-18 (155–157, с одной стороны , и с другой ) дифференцируют мальму и арктического гольца с Аляски и востока арктического побережья Канады (Angers, Bernatchez, 1996; Crane et al., 2014; Ditlecadet et al., 2006; Hart et al., 2015; Taylor, May-McMally, 2015).
Аллели различаются числом повторов
CA- мотива у базовых вариантов – 7 у мальмы против у арктического гольца (Genbank: MN530967, MN530968). Популяции арктического гольца провинции
Нунавут необычны тем , что в них примерно с равной частотой встречаются оба этих аллеля (Harris et al., 2016). Микросателлитный локус
SMM-21 считается еще одним диагностическим маркером для арктического гольца и северной мальмы . Для арктического гольца и близких к нему форм характерны аллели длиной пн (Crane et al., 2014; Гордеева и др ., 2010; Сенчукова , 2014; Hart et al., 2015; Taylor, May-McMally, 2015), а для северной мальмы – 115–158 пн (Crane et al., 2005, 2014; Салменкова и др ., 2009; Сенчукова , 2014; Harris et al., 2015; Hart et al., 2015; Taylor, May-McMally, 2015).
Различия в длинах вызваны вариацией числа повторов ТС - мотива (Genbank: AY327128, MN530969–MN530972). Установление вариантов аллелей шести диагностических локусов в геномных данных производилось следующим образом . Последовательности гаплотипов контролирующего региона
ARC19 и BER12, двух вариантов
ITS1 (AF059893 и AF059900), аллелей и локуса SFO-12, а также гена RAG1 были объединены в один файл , который выступал в качестве составного референса . Для локусов
SFO-18 и SMM-21 референсы были индивидуальными . Прочтения из того или иного архива выравнивались на референс с помощью программы blastn, доступной на сайте https://blast.ncbi.nlm.nih.gov. Выравнивание выполнялось в режиме "megablast" ( поиск последовательностей с высоким уровнем сходства ) (Zhang et al., 2000) с ограничением максимального числа целевых последовательностей в шт . Данный метод прост в использовании и имеет подходящую для нашего случая чувствительность и необходимый уровень избирательности . Полученный на выходе программы blastn SAM- файл затем анализировался с помощью программы Tablet v.1.19.05.28 (Milne et al., 2013), и по характеру покрытия и типу нуклеотидов в диагностических позициях устанавливался вариант аллелей маркерных локусов . Для уточнения megablast- выравнивания по локусу SMM-21 выровненные прочтения извлекались и картировались на референс вновь , но уже с помощью программы Bowtie 2 v2.3.2 (Langmead, Salzberg, 2012). В тех случаях , когда требовалось максимально полно использовать архивные прочтения ( для проверки megablast- выравнивания , оценки покрытия или последующей сборки последовательности целевого локуса ), первичные данные загружались из в виде FASTQ- файлов , содержащих разбитые по направлениям прочтения . Затем с помощью утилиты bbduk из пакета BBMap производилась фильтрация данных на предмет остаточного присутствия адаптеров , использованных при секвенировании . Далее осуществлялось выравнивание с помощью утилиты bbmap из пакета BBMap v.38.00 (Bushnell, 2014) с ключами "local" и "vslow" или программы Bowtie 2 в режиме "local" или "end-to-end". При необходимости , выровненные прочтения в формате FASTQ или
FASTA служили вводными данными для сборки целевых последовательностей с помощью программы SPAdes v3.11.1 (Nurk et al., 2013) или idba_ud v1.0.9 (Peng et al., 2012).
Для ресурсоёмких операций и расчетов использовали возможности многопроцессорного вычислительного комплекса IRUS17
Центра коллективного пользования " Дальневосточный вычислительный ресурс " ДВО
РАН ( г . Владивосток ). РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Результаты анализа геномных данных по всему использованному набору маркерных локусов представлены в таблице . Как указано во введении , аутентичная для самки IW2-2015 полная последовательность мтДНК в сборке ASM291031v2 отсутствует . Blastn- анализ не выявил также в этой сборке корректно собранных участков рибосомальной ДНК . Наибольшее сходство с референсной последовательностью ITS1 демонстрировал участок
NC_036862.1:28683274–28682712 (Genbank). Но уровень этого сходства был относительно невелик (95–96%). Если к этому референсу добавляли фланкирующие его участки и РНК , то уровень его сходства с выровненным участком (Genbank: NC_036862.1:28683274–28682712) падал до В тоже время , последовательности ITS1, полученные при анализе архивов прочтений геномной
ДНК или
РНК ( все три найденных варианта ITS1 вместе с прилегающими участками генов и РНК были депонированы в Genbank: MN530964–MN530966), имели ное сходство с уже известными для гольцов ( таблица ). Отсюда можно понять , что в сборке ASM291031v2 качественно собранные участки рДНК , по существу , отсутствуют . Варианты последовательностей четырех других маркерных локусов (RAG1, SFO-12, SFO-18 и SMM-21), установленные в результате blastn- анализа сборки ASM291031v2, в каждом случае идентифицированы как аллели , свойственные северной мальме . Анализ архивов прочтений геномной
ДНК самки
IW2-2015, взятых из Genbank, выявил следующую картину . Самка
IW2-2015 имеет мтДНК из гаплогруппы BERING ( гаплотип – BER12).
Последовательности
RAG1, SFO-18 и SMM-21, в полном согласии с результатами анализа сборки ASM291031v2, относятся к варианту северной мальмы . К варианту северной мальмы относится и подавляющее большинство прочтений для локуса ITS1. В качестве минорного компонента среди последних выступил альпиноидный вариант A2.
Стоит подчеркнуть , что , судя по результатам анализа прочтений , полученных в ходе РНК - секвенирования (Genbank: SRX2635048, SRX2635052), экспрессируется из них лишь один вариант – мальмоидный . По локусу SFO-12 у самки IW2-2015 найдены оба варианта аллелей ( и альпиноидный , и мальмоидный ). В двух экспериментах (Genbank: SRX3776048–SRX3776049) преобладает вариант мальмоидных гольцов , в других (Genbank: SRX3776050–SRX3776052) – их соотношение примерно равное . Анализ архивов прочтений , полученных для двух особей из маточного стада TR (Genbank: SRX5282523–SRX5282524), привел к результатам , полностью идентичным результатам анализа самки IW2-2015. То есть , судя по ним , самка IW2-2015 безусловно относится к линии TR. Из архивов прочтений SRX3776048 и SRX5282523 были собраны два варианта полных митохондриальных геномов (Genbank: MN530959, MN530961), характеризующих линию
TR.
Эти митогеномы отличались друг от друга по двум нуклеотидным позициям , а от митогеномов мальмоидных гольцов Камчатки (Genbank: KJ746618, KU674351, KU674352, KT266871, KT266870) – по позициям . У гибридов TR ♂ × NL ♀ (Genbank: SRX5282528–SRX5282529) найден гаплотип мтДНК из гаплогруппы ARCTIC, а по ядерным локусам – альтернативные варианты аллелей примерно в равной пропорции . Характеристики одного из вариантов возвратных скрещиваний (Genbank: SRX5282526) оказались близки к характеристикам линии TR ( к слову , полный митогеном этой особи был полностью идентичен митогеному , восстановленному из архива SRX5282523), а другого (Genbank: SRX5282525) – к характеристикам актического гольца . Отметим , что в последнем случае , как и у гибридов TR ♂ × NL ♀ , был найден особый вариант ITS1 – альпиноидный вариант
A3. Из архивов прочтений SRX5282525 и SRX5282528 были восстановлены два варианта полных митогеномов из гаплогруппы ARCTIC (Genbank: MN530963, MN530962), различавшихся двумя нуклеотидными позициями . Варианты этих митогеномов , а также аллелей ядерных локусов , полученные для архива SRX5282525, по всей видимости , могут рассматриваться как характеристики , близкие к характеристикам ( если не идентичные им ) особей из маточного стада NL. По результатам проведенного анализа , видно , что характеристики племенных линий TR и NL повторяют характеристики северной мальмы и арктического гольца соответственно . Другими словами , эти линии , по всей видимости , происходят от особей , принадлежавшим двум разным видам гольцов . В связи с этим , можно утверждать , что опубликованная сборка генома самки IW2-2015 (ASM291031v2, Genbank: GCA_002910315.2) является сборкой генома северной мальмы
S. malma malma . Река
Три в зал . Коронации , откуда получены особи - основатели линии TR, одно из известных [ особенно среди любителей спортивной гольцовой рыбалки из - за возможности отметиться крупным трофеем весом до кг (Moshenko et al., 1984)] местообитаний мальмы в регионе Китикмеот провинции
Нунавут (Alfonso et al., 2018).
Для мальмы этот район является пределом её распространения на восток по арктическому побережью Северной
Америки . Заметим , что здесь проходит восточная граница ареалов многих других видов тихоокеанских морских или анадромных рыб (Alfonso et al., 2018): тихоокеанской сельди Clupea pallasii , кеты Oncorhynchus keta , нерки O. nerka , чавычи O. tshawytscha , азиатской зубастой корюшки Osmerus dentex , тихоокеанской наваги Eleginus gracilis , звездчатой камбалы Platichthys stellatus , дальневосточной зубатки Anarhichas orientalis . Таким образом , следует иметь ввиду то , что сборка ASM291031v2 характеризует геном особи , происходящей из краевой популяции , изолированной от основного ареала вида , заканчивающегося бассейном р . Маккензи . Краевые популяции часто малочисленны и из - за этого могут быть подвержены гибридизации с популяциями близких видов . Весьма вероятно , что присутствие альпиноидного варианта A2 ITS1, а также аллеля SFO-12(223) в геномах особей из линии TR является следами произошедшей гибридизации северной мальмы и арктического гольца в регионе Китикмеот . Широкое присутствие аллеля
SFO-18(156) у арктического гольца из этого региона (Harris et al., 2016) также может быть следствием такой гибридизации . Поэтому геном самки
IW2-2015 не может рассматриваться как описание типичного генома северной мальмы . С другой стороны , этот геном не является показательным и для арктического гольца , поскольку предковые линии мальмоидных и альпиноидных гольцов разошлись довольно давно – 3.03 (1.18–5.00) млн лет назад (Shedko et al., 2012b). В тоже время , полученные в работе (Christensen et al., 2018) данные , безусловно , имеют важное значение для исследований геномной архитектуры аквакультурных TR- и NL- линий этих видов гольцов . Подчеркнем , что полноту и качество существующей сборки ASM291031v2 пока , к сожалению , нельзя признать высокими . Об этом свидетельствует , во - первых , то , что в работе (Christensen et al., 2018) не был собран митохондриальный геном и , во - вторых , то , что в сборке ASM291031v2 отсутствуют корректные последовательности рибосомальной
ДНК . Наличие адекватного референсного генома – базовое условие всех проводимых на геномном уровне исследований в той или иной группе организмов (Elmer, 2016). Здесь , безусловно , важен не только выбор вида в качестве типичного представителя этой группы , но и выбор конкретного индивидуума , представляющего сам вид . В идеале эта особь должна происходить из популяции , типичной для этого вида , и располагающейся в центральной части его ареала . Хочется надеяться , что в будущих попытках секвенирования геномов гольцов ( мальмы , арктического гольца или других ) этому обстоятельству будет уделено особое внимание . БЛАГОДАРНОСТИ
Результаты получены с использованием оборудования ЦКП " Дальневосточный вычислительный ресурс " ИАПУ
ДВО
РАН
КОНФЛИКТ
ИНТЕРЕСОВ
Автор заявляет , что у него нет конфликта интересов . ФИНАНСИРОВАНИЕ
Исследование проводилось в рамках темы НИР № АААА - А Часть работ ( картирование и сборка последовательностей ) выполнена при финансовой поддержке Программы " Приоритетные научные исследования в интересах комплексного развития Дальневосточного отделения
РАН " ( грант № ПРИЛОЖЕНИЯ
Все значимые нуклеотидные последовательности , восстановленные из архивов прочтений , депонированы в Genbank под номерами доступа
MN530959–MN530972.
Основные исходные данные , использованные для построения таблицы , а также другие материалы можно найти в репозитории , доступном по ссылке https://github.com/svshedko/CHARgenome. СПИСОК
ЛИТЕРАТУРЫ
Гордеева Н . В ., Осинов А . Г ., Алексеев С . С . и др . Генетическая дифференциация арктических гольцов
Salvelinus alpinus complex
Забайкалья , выявленная по микросателлитным маркёрам // Вопр . ихтиологии . 2010. Т . 50. № С . 293–304. Сенчукова А . Л . Генетическая дифференциация гольцов ( род Salvelinus ) озерно - речной системы Кроноцкая ( Камчатка ). Диссертация ... канд . биол . наук . М .: МГУ . 2014. 106 с . Салменкова Е . А ., Омельченко В . Т ., Афанасьев К . И . и др . Генетическая дивергенция популяций белого гольца
Salvelinus albus , северной и южной форм мальмы S. malma (Salmonidae) по микросателлитным локусам ДНК // Вопр . ихтиологии . 2009. Т . 49. № С . 752–762. Alfonso N.R., Coad B.W., Sawatzky C.D., Reist J.D . Distributional records for marine fishes of Arctic Canada // Can. Data Rep. Fish. Aquat. Sci. 2018. № Angers B., Bernatchez L.
Usefulness of heterologous microsatellites obtained from brook charr,
Salvelinus fontinalis
Mitchill, in other
Salvelinus species // Mol. Ecol. 1996. V. 5. №
2. P. 317–319.
Angers B., Bernatchez L.
Complex evolution of a salmonid microsatellite locus and its consequences in inferring allelic divergence from size information // Mol. Biol. Evol. 1997. V. 14. №
3. P. 230–238.
Brunner P.C., Douglas M.R., Osinov A. et al.
Holarctic phylogeography of Arctic Charr (
Salvelinus alpinus
L.) inferred from mitochondrial DNA sequences // Evolution. 2001. V. 55. №
3. P. 573.
Bushnell B. Christensen K.A., Rondeau E.B., Minkley D.R. et al . The arctic charr (
Salvelinus alpinus ) genome and transcriptome assembly // PLoS One. 2018. V. 13. №
9. P. 1–30.
Crane P., Viavant T., Wenburg J . Overwintering patterns of Dolly Varden
Salvelinus malma in the Sagavanirktok River in the Alaskan North Slope inferred using mixed-stock analysis // Alaska Fish. Tech. Rep. 2005. №
84. P. 1–22.
Crane P.A., Lisac M.J., Lewis C.J., Wenburg J.K.
Genetic baseline development for Dolly Varden in southwestern Alaska // Alaska Fisheries Data Series Number 2014-2. 2014. 40 p.
Ditlecadet D., Dufresne F., Le François N.R., Blier P.U.
Applying microsatellites in two commercial strains of Arctic charr (
Salvelinus alpinus ): Potential for a selective breeding program // Aquaculture. 2006. V. 257. № Doiron S., Bernatchez L., Blier P.U.
A Comparative mitogenomic analysis of the potential adaptive value of Arctic charr mtDNA introgression in Brook charr populations (
Salvelinus fontinalis
Mitchill) // Mol. Biol. Evol. 2002. V. 19. №
11. P. 1902–1909.
Elmer K.R.
Genomic tools for new insights to variation, adaptation, and evolution in the salmonid fishes: a perspective for charr // Hydrobiologia. 2016. V. 783. №
1. P. 191–208.
Goel A.K.
Developing broodstock of Arctic charr (
Salvelinus alpinus
L.). M.Sc. Thesis. Simon Fraser Univ. 2004. 186 p.
Harris L.N., Bajno R., Gallagher C.P. et al.
Life-history characteristics and landscape attributes as drivers of genetic variation, gene flow, and fine-scale population structure in Northern Dolly Varden (
Salvelinus malma malma ) in Canada // Can. J. Fish. Aquat. Sci. 2015. V. 72. №
10. P. 1477–1493.
Harris L.N., Moore J.-S., Bajno R., Tallman R.F.
Genetic stock structure of anadromous Arctic char in Canada’s central Arctic: Potential implications for the management of Canada’s largest Arctic char commercial fishery // North Am. J. Fish. Manag. 2016. V. 36. №
6. P. 1473–1488.
Hart L.M., Bond M.H., May-McNally S.L. et al.
Use of otolith microchemistry and stable isotopes to investigate the ecology and anadromous migrations of Northern Dolly Varden from the Egegik River, Bristol Bay, Alaska // Environ. Biol. Fishes. 2015. V. 98. №
6. P. 1633–1643.
Johnston G.
Arctic charr aquaculture. Oxford, UK: Blackwell Publishing. 2006. 274 p.
Klemetsen A.
The charr problem revisited: Exceptional phenotypic plasticity promotes ecological speciation in postglacial lakes // Freshw. Rev. 2010. V. 3. №
1. P. 49–74. Klemetsen A . The most variable vertebrate on Earth // J. Ichthyol. 2013. V. 53. №
10. P. 781–791.
Klemetsen A., Amundsen P.A., Dempson J.B. et al.
Atlantic salmon
Salmo salar
L., brown trout
Salmo trutta
L. and Arctic charr
Salvelinus alpinus (L.): A review of aspects of their life histories // Ecol. Freshw. Fish. 2003. V. 12. №
1. P. 1–59.
Langmead B., Salzberg S.L.
Fast gapped-read alignment with Bowtie 2 // Nat. Methods. 2012. V. 9. №
4. P. 357–359.
McGowan C.R., Lucas J.J., Keddie E. et al.
Application of salmonid genomic research in a mid-sized commercial broodstock facility: The Icy Waters Arctic charr experience // Bull. Aquacul. Assoc. Canada. 2009. V. 107-3. P. 31–43.
Milne I., Stephen G., Bayer M. et al . Using Tablet for visual exploration of second-generation sequencing data. // Brief. Bioinform. 2013. V. 14. №
2. P. 193–202.
Moore J.-S., Bajno R., Reist J.D., Taylor E.B.
Post-glacial recolonization of the North American Arctic by Arctic char (
Salvelinus alpinus ): genetic evidence of multiple northern refugia and hybridization between glacial lineages // J. Biogeogr. 2015. V. 42. №
11. P. 2089–2100.
Moshenko R.W., Peet R.F., Dahlke L.W., Dowler D.H.
The Arctic charr sport fishery at the Tree River, Northwest Territories, Canada // Biology of the Arctic charr. Proceedings of the international symposium on Arctic charr (Eds Johnson L., Burns B.L.). Winnipeg: University of Manitoba Press. 1984. P. 1964–1978.
Nurk S., Bankevich A., Antipov D. et al.
Assembling genomes and mini-metagenomes from highly chimeric reads // Lecture Notes in Computer Science (Eds. Deng M., Jiang R., Sun F.Z.X.) Berlin: Springer. 2013. P. 158–170.
Peng Y., Leung H.C.M., Yiu S.M., Chin F.Y.L.
IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth // Bioinformatics. 2012. V. 28. №
11. P. 1420–1428.
Phillips R.B., Gudex L.I., Westrich K.M., DeCicco A . Combined phylogenetic analysis of ribosomal ITS1 sequences and new chromosome data supports three subgroups of Dolly Varden char (
Salvelinus malma ) // Can. J. Fish. Aquat. Sci. 1999. V. 56. №
8. P. 1504–1511.
Shedko S.V., Ginatulina L.K., Miroshnichenko I.L., Nemkova G.A.
Phylogeography of mitochondrial DNA in South Asian Dolly Varden char
Salvelinus curilus
Pallas, 1814 (Salmoniformes, Salmonidae): Mediated gene introgression? // Russ. J. Genet. 2007. V. 43. №
2. P. 165–176. Shedko S.V., Miroshnichenko I.L., Nemkova G.A.
Phylogeny of salmonids (Salmoniformes: Salmonidae) and its molecular dating: Analysis of nuclear RAG1 gene // Russ. J. Genet. 2012a. V. 48. №
5. P. 575–579.
Shedko S.V., Miroshnichenko I.L., Nemkova G.A.
Data from: Phylogeny of salmonids (Salmoniformes: Salmonidae) and its molecular dating: analysis of nuclear RAG1 gene. Dryad Digital Repository. 2012b. https://doi.org/10.5061/dryad.ph602
Soshina V.A., Pavlov S.D., Zelenina D.A.
Genetic diversity of charrs of the Commander Islands based on the analysis of mitochondrial DNA // Russ. J. Genet. 2016. V. 52. №
11. P. 1208–1213.
Taylor E.B., May-McNally S.L.
Genetic analysis of Dolly Varden (
Salvelinus malma ) across its North American range: evidence for a contact zone in southcentral Alaska // Can. J. Fish. Aquat. Sci. 2015. V. 72. №
7. P. 1048–1057.
Wilson C.C., Bernatchez L.
The ghost of hybrids past: fixation of arctic charr (
Salvelinus alpinus ) mitochondrial DNA in an introgressed population of lake trout (
S. namaycush ) // Mol. Ecol. 1998. V. 7. №
1. P. 127–132.
Zhang Z., Schwartz S., Wagner L., Miller W.A.
Greedy algorithm for aligning DNA sequences // J. Comput. Biol. 2000. V. 7. № Таблица . Варианты аллелей маркерных локусов , характерные для арктического гольца и северной мальмы и установленные для самки IW2-2015 ( в фигурных скобках – соотношение альтернативных вариантов прочтений в случае полиморфизма ), двух особей из маточного стада TR, а также четырёх гибридных особей , полученных в нескольких вариантах скрещивания племенных линий TR и NL.
Table . Alleles of diagnostic loci characteristic for Arctic char and Northern Dolly Varden, revealed in female IW2-2015 (in curly brackets is the ratio of alternative reads in the case of polymorphism), two individuals from broodstock TR, as well as four variants of hybrids.
Таксон / образец / данные ( номера доступа Genbank) мтДНК
ITS1 RAG1 SFO-12 SFO-18 SMM-21
S. alpinus
ARCTIC alpinus alpinus 223 162–164 105–111 (alpinus)
S. malma malma
BERING malma malma 221 156 115–158 (malma)
IW2-2015
GCA_002910315.2 – – malma malma SRX3776048
BER12 A2/malma {~1:55} malma malma
BER12 malma malma – – – TR SRX5282523 BER12 A2/malma {~1:30} malma 221/223 {~1:1} 156 malma SRX5282524 BER12 A2/malma {~1:30} malma
Гибриды
SRX5282528 TR ♂ × NL ♀ ARC19 A3/malma {~1:2} alpinus /malma {~1:3} 221/223 {~2:1} 156/162 {~2:1} alpinus/malma {~2:1} SRX5282529 TR ♂ × NL ♀ ARC19 A3/malma {~1:2} alpinus /malma {~1:1} 221/223 {~2:1} 156/162 {~1.4:1} alpinus/malma {~4:1} SRX5282525 (TR ♂ × NL ♀ ) ♂ × NL ♀ ARC19 A3/malma {~5:1} alpinus
223 156/162 {~2:1} alpinus SRX5282526 TR ♂ × ((TR ♂ × NL ♀ ) ♂ × TR ♀ ) ♀ BER12 A2/malma {~1:33} malma 221/223 {~1.5:1} 156/162 {~2:1} alpinus/malma {~3:1}
Примечания . A2 – альпиноидный вариант (Genbank: AF059899); A3 – альпиноидный вариант (Genbank: AF059897), найден у арктического гольца из оз . Нуаяк (Philllips et al., 1999), отличается уникальной для гольцов нуклеотидной заменой С > Т в позиции NC_036842.1:69870375–69871898 (Genbank), LG4q.1:29. NC_036863.1:41094706–41094926 (Genbank), LG23. NC_036875.1:27971989–27972144 (Genbank), LG36. NC_036838.1:46248006–46248134 (Genbank), LG1. Редкий для альпиноидных гольцов вариант
RAG1 (Genbank: GQ871484), до сих пор был найден только у боганидской палии из оз . Эльгыгытгын на Чукотке (Shedko et al., 2012a).
Notes . A2 – alpinoid variant (Genbank: AF059899); A3 – alpinoid variant (Genbank: AF059897), found in Arctic char from N auyuk Lake (Philllips et al., 1999), is distinguished by a unique for alpinoid chars C>T nucleotide substitution in position 298. NC_036842.1:69870375–69871898 (Genbank), LG4q.1:29. NC_036863.1:41094706–41094926 (Genbank), LG23. NC_036875.1:27971989–27972144 (Genbank), LG36. NC_036838.1:46248006–46248134 (Genbank), LG1.6