Accepted_test
Работа посвящена идентификации сильнодивергировавших дисперсных повторов в геномной последовательности Cyanidioschyzon merolae методом IP. Ранее данный метод применялся к бактериальным геномам, что позволило выявить многочисленные повторы, не обнаруженные такими популярными программными средствами как RepeatMasker, RED, RECON. Поэтому было крайне интересно использовать его для исследования эукариотических геномов. В качестве объекта изучения нами был выбран геном примитивного организма - красной водоросли C.merolae, содержащий всего 16 млн н.п. Геном был ранее аннотирован, и, согласно имеющейся аннотации, повторы покрывают чуть более 28% генома.
Метод IP позволил нам обнаружить в геноме C.merolae около 34 тыс. дисперсных повторов, которые включены в 20 семейств. Повторы покрывают 72% генома. Средняя длина повторов составляет 523 н.п. Также изучалось пересечение идентифицированных нами повторов с повторами, обнаруженными другими методами. В ряде случаев удалось выявить корреляцию между нашими семействами и классами аннотированных ранее повторов. В целом популярные методы поиска повторов позволяют выявлять более короткие и консервативные повторы. Поэтому для всестороннего исследования генома на наличие повторов целесообразно использовать совокупность различных биоинформационных подходов.
Было найдено пересечение повторов с кодирующими участками генома. Оказалось, что 86% генов содержат дисперсные повторы.
Поскольку обнаруженные в работе повторы покрывают значительную часть генома, более правильно было бы назвать их структурными элементами или некоторой разметкой, которая накладывается на весь геном, включая как кодирующие, так и некодирующие участки. Мы предполагаем, что подробная структурная организация может быть связана с компактизацией хроматина и процессом образования нуклеосом. Альтернативы в расположении нуклеосом дают шанс молекуле ДНК переключиться на транскрипцию других генов, и, таким образом, адаптироваться к изменению внешних условий или обеспечить тканеспецифичность.