Поиск публикаций  |  Научные конференции и семинары  |  Новости науки  |  Научная сеть
Новости науки - Комментарии ученых и экспертов, мнения, научные блоги
Реклама на проекте

О повторах в геноме человека

Wednesday, 08 September, 00:09, galicarnax.livejournal.com
То, что в геноме человека существует достаточно много повторов - участков ДНК, разбросанных по геному во множественных копиях - было известно еще лет 40 назад. Но весь масштаб происходящего был понят после полного секвенирования генома в 2000-х гг., когда выяснилось, что не менее чем на половину он состоит из повторов разного типа. Это, конечно, был сюрприз. Весь геном человека и без того весит 750 Мбайт - аккурат на одну CD-болванку. А тут еще оказывается, что его информация так избыточна...Впрочем, обнаруженное количество генов тоже порадовало. Думали, что в геноме более сотни тысяч генов, а оказалось всего-то около 24 тысяч. Примерно столько же, сколько у червяка-нематоды (20 тыс.) и даже меньше, чем у травки арабидопсиса (26 тыс.). Ситуацию немного спасает альтернативный сплайсинг - примерно каждый второй ген человека кодирует не один белок, а сразу несколько (обычно родственных по функциям). Получается это комбинированием разных экзонов одного гена при сооружении мРНК. У червяка альтернативный сплайсинг тоже имеется, но используется реже, чем у человека. В итоге, при одном и том же числе генов количество разных типов белков у человека все же больше, чем у червяка. И это радует. Но вернемся к повторам.Повторы есть практически во всех геномах. Особенно они изобильны у некоторых растений. Геном пшеницы состоит вообще на 90% из повторов.Повторяющиеся последовательности можно поделить на:Транспозоны - участки ДНК, которые могут передвигаться по геному. Передвигаются они с помощью специальных белков - транспозаз, которые в большинстве случаев закодированы в самих транспозонах. Длина транспозонов - от сотен до нескольких тысяч нуклеотидов.Сегментные дупликации. Это большие блоки хромосом, длиной от десятков тысяч до десятков миллионов нуклеотидов, которые присутствуют в двух-трех копиях в геноме. Их последовательности идентичны между собой на 80-100%. Например, в геноме человека имеется кусок длиной около 1.5 млн. оснований, повторяющийся один-в-один в хромосомах X и Y.Тандемные повторы. Это участки, в которых небольшая последовательность-шаблон (от двух до десятков оснований) повторяется тандемно, одна за другой, сотни и тысячи раз. Например: ...ATTGATTGATTGATTGATTGATTG... Особенно изобильны тандемные повторы в центромерах хромосом, где они несут структурную функцию.Вот из чего состоит наш геном:0004hhkf Дальше немного подробнее о транспозонах.Передвижение транспозонов не следует понимать как постоянно происходящий в клетках процесс. В плане отдельных особей это редкое явление. Например, у человека каждая новая вставка Alu-повтора происходит примерно один раз на двести рождений. Однако в плане эволюции популяции распространение транспозонов может быть почти молниеносным, как показывает пример P-элементов у дрозофил. Эти транспозоны расплодились в геноме несчастных мух, по всей видимости, где-то в середине 20 века.Транспозоны можно разделить на два класса: ДНК-транспозоны и ретротранспозоны. ДНК-транспозоны вырезаются прямо из ДНК и вставляются в другое место. Таким образом, они передвигаются по принципу cut-and-paste. Сейчас, по всей видимости, они неактивны. Ретротранспозоны размножаются через РНК-посредник. Сначала с ДНК снимается копия в виде РНК, потом с РНК идет обратная транскрипция (отсюда "ретро") - создается копия ДНК в другом месте генома. Т.е. они передвигаются по принципу copy-and-paste.Сами ретротранспозоны можно далее разделить на два класса - содержащие длинные концевые повторы (LTR - long terminal repeats) и те, что без них. LTR-транспозоны имеют большое сходство с некоторыми ретровирусами, составляют около 8% генома человека и также сейчас почти не проявляют активности. Произошли ли они от вирусов, или вирусы от них - вопрос нерешенный. Вирусы, помимо белков-помощников, кодируют еще как минимум белки для своей оболочки.Особенно интересны ретротранспозоны без LTR - именно они наиболее многочисленны. К тому же имеются однозначные данные о том, что они не только активны, но и могут приводить к генетическим заболеваниям, включая рак. У человека два основных типа таких транспозонов - L1 и Alu.L1-элементы имеют длину около 6 тыс. оснований и кодируют два белка, с помощью которых они распространяются. Число их в геноме - около полмиллиона штук. Хотя активно из них менее ста (остальные инактивированы мутациями).Alu-повторы имеют длину 280 оснований, а число их копий в геноме составляет около 1,1 миллиона. Alu-повторы имеются только в линии приматов. Предполагается, что они появились в результате дупликации гена 7SL RNA (он кодирует РНК, входящую в состав молекулярного комплекса SRP, который распознает определенные белки и доставляет их в нужное место в клете - в общем, делает полезное дело), т.к. последовательности нуклеотидов достаточно схожи. Alu не кодируют белки и для передвижения по геному используют, как предполагается, белки элементов L1.По малым вариациям в нуклеотидной последовательности L1- и Alu-повторы разделяют на кучу подсемейств. Необычной находкой является то, что эти подсемейства не образуют типичные филогенетические связи с разветвлениями, как гены или виды, когда два новых подсемейства происходят от одного предкового. Вместо этого они образуют линейную иерархию, в которой каждое подсемейство представляет собой единственное промежуточное звено между дочерним и родительским. Одно из таких подсемейств - Alu Yb - распространилось до 2000 копий исключительно в геноме человека за последние несколько миллионов лет, т.к. в геномах всех остальных приматов оно отсутствует. Но как именно повлияли Alu- и L1-элементы на эволюцию человека, и связаны ли они вообще с "очеловечиванием" - вопрос открытый.Напоследок еще одно интересное наблюдение. Полгода назад я написал про универсальный, но малоизвестный феномен второго правила Чаргаффа. Согласно этому правилу, любой олигонуклеотид представлен примерно в одинаковых количествах в обеих цепочках ДНК. Так вот, любой транспозон - это тоже олигонуклеотид. Поэтому их тоже должно быть примерно одиаковое количество на обеих цепочках. И действительно, например, в первой хромосоме прямых Alu-повторов у меня насчиталось 41421, комплементарных - 41441. Т.е. разница составляет всего 20 штучек, при общем числе в десятки тысяч. Для других хромосом разница также составляет 0.01-0.1% (разумеется, все Alu-повторы идентифицировать трудно, т.к. они могу содержать уже значительные отличия от канонической последовательности). Но это тот случай, когда не совсем понятно - это статистическая тривиальность или какая-то закономерность. Если бы не существовало второго правила Чаргаффа, это была бы, скорее всего, статистическая тривиальность. Но правило есть и оно само по себе нетривиально. При этом по наиболее распространенной гипотезе это правило объясняется случайными инверсиями. Но тогда непонятно - что заставляет транспозоны распределяться между цепочками ДНК настолько равномерно, чтобы не нарушать это правило?А вот так выглядит наш геном если его представить не линейно, а в виде развертки, как в телевизоре или текстовом редакторе - строка заканчивается и ДНК-овый текст продолжается со следующей строки и т.п. На кликабельном рисунке показано примерно 2% первой хромосомы. Каждая точка - это одно основание. T - зеленые точки, C - желтые, А - красные, G - синие. Черная полоса - несеквенированная область. Число оснований в каждой строке - 1405. Над черной полосой видны в виде столбиков тандемные повторы. s320x240А это тот же самый участок, на котором обозначено положение Alu-повторов (зеленые линии) и кодирующих экзонов (желтые). Каждая зеленая линия имеет длину 280 оснований.s320x240
Читать полную новость с источника 

Комментарии (0)