Введение
Появление широкомасштабного геномного анализа глубоко изменило понимание функциональной организации генома. В частности, недавние исследования показали, что по крайней мере 70% человеческого генома может быть транскрибировано [1]. В результате в настоящее время принято считать, что сложность транскриптома выходит далеко за рамки транскриптов, кодирующих белки, поскольку он также включает в себя множество некодирующих РНК, имеющих сложные профили экспрессии и регуляции. Эти некодирующие РНК включают типы регуляторных РНК, функции и механизмы действия которых относительно четко определены, такие как miRNAs (микроРНК) и piRNAs (piwi-взаимодействующие РНК), и менее хорошо охарактеризованные классы РНК (такие как длинные некодирующие РНК — lncRNAs). Хотя функция подавляющего большинства lncRNAs остается в значительной степени неисследованной, представляется, что эти транскрипты играют важную роль во многих клеточных процессах, таких как гибель клеток, рост, дифференциация, апоптоз, эпигенетическая регуляция и т.д. [2—6].
Цель настоящего обзора — рассмотреть типы lncRNAs и их функции в норме при патологиях человека.
LncRNAs
LncRNAs являются транскриптами из более чем 200 нуклеотидов, которые не кодируют белки. Хотя это определение дано произвольно, оно позволяет отличить lncRNAs от небольших регуляторных РНК, таких как miRNAs, piRNAs и других малых ядерных РНК. LncRNAs, обычно транскрибируемые РНК-полимеразой II, составляют группу очень гетерогенного размера, некоторые из них могут простираться на несколько десятков килобайт. Гены IncRNA имеют несколько общих характеристик с генами, кодирующими белки, такие как эпигенетические профили, наличие сигналов сплайсинга и полиаденилирования, а также размер экзонов и интронов [3]. Однако по сравнению с мРНК lncRNAs более обогащены в ядре и демонстрируют наиболее низкую консервацию последовательности, хотя некоторые из них являются высоко консервативными [3]. Кроме того, гены lncRNAs экспрессируют себя слабее, чем кодирующие гены, и их экспрессия особенно специфична для определенных тканей.
В зависимости от их положения относительно кодирующих генов lncRNAs можно разделить на две широкие категории: межгенные lncRNAs и интрагенные lncRNAs. Межгенные, локализованные по определению в неаннотированных областях генома, обычно называют lincRNAs. В настоящее время они представляют собой наиболее изученный класс lncRNAs [3]. С другой стороны, внутригенные IncRNAs можно подразделить в зависимости от того, как они перекрывают кодирующие гены, или от их ориентации по отношению к ним (антисмысловые, интронные и тд). Следует отметить, что многие из lincRNAs имеют сайт инициации транскрипции, близкий к сайту кодирующего гена, причем транскрипция находится на противоположной цепи (дивергентная транскрипция). Недавно было показано, что гены, связанные с этими расходящимися транскриптами, часто кодируют регуляторы транскрипции, участвующие в развитии и дифференцировке клеток [7]. Наконец, некоторые lncRNAs перекрываются с небольшими РНК, такими как малые ядерные РНК (snRNA) или miRNAs, с потенциальными функциональными связями, как в случае областей с импринтируемым геномом [6]. Многие из lncRNAs содержат повторяющиеся элементы, такие как длинные вкрапленные ядерные элементы (LINE) или короткие вкрапленные ядерные элементы (SINE), с потенциальными функциональными последствиями [8, 9]. Однако lncRNAs не имеют консервативной последовательности или структуры, которая может указывать на определенную функцию [3]. В результате большинство исследований, нацеленных на выявление потенциально релевантных lncRNAs в данном физиологическом или патологическом контексте, основаны на коэкспрессии или совместном регуляционном анализе. Функцию соседних генов, имеющих профиль, сходный с lncRNAs (функцию которого необходимо определить), затем транспонируют [10].
Масштабное исследование lncRNAs
За последние два десятилетия систематическое секвенирование кДНК привело к идентификации различных транскриптов, некоторые из которых в настоящее время считаются lncRNAs. Аналогичным образом новаторские исследования, основанные на микрочипах или эпигенетическом профилировании, выявили присутствие транскрибируемых областей, продуцирующих ряд lincRNAs [3]. В частности, анализы, основанные на комбинации определенных марок хроматина, позволили определить первые высокопроизводительные характеристики lincRNAs [11]. Однако только в результате широко распространенного высокопроизводительного секвенирования РНК (RNA-sequencing, RNA-seq) систематический анализ транскриптома выявил существование lncRNAs и позволил оценить их сложность у млекопитающих [12, 13]. Поскольку большинство lncRNAs слабо экспрессируются или имеют очень сложную структуру экзон/интрон, иногда трудно идентифицировать различные транскрипты, полученные из гена lncRNAs. Затем необходимо объединить традиционный подход RNA-seq с другими методами, такими как эпигенетический анализ, чтобы можно было однозначно определить структуру различных вариантов, возникающих в результате транскрипции гена lncRNAs [12].
Эти различные подходы в сочетании с передовым биоинформационным анализом позволили идентифицировать очень большое количество lncRNAs, экспрессируемых во множестве тканей и клеточных линий. В частности, проект ENCODE (энциклопедия элементов ДНК) через базу данных GENCODE поддерживает наиболее полный список lncRNAs, экспрессируемых у людей [14]. В настоящее время версия GENCODE V19 содержит 13 870 lncRNAs, обнаруженных у людей, из которых 7114 —lincRNAs. Кроме того, известные lncRNAs сгруппированы в несколько общедоступных каталогов, таких как lncrnadb и noncode, которые включают подробное описание их геномных структур.
Функции lncRNAs в физиологических процессах
Как упоминалось выше, в отличие от белков, которые часто имеют четко определенные функциональные домены, в настоящее время невозможно предсказать функцию lncRNAs по их последовательности. Похоже, что lncRNAs в основном действуют путем модуляции экспрессии генов [15]. Эта функция может выполняться локально, когда lncRNAs действуют в цис-положении на соседние гены, или дистально, когда их функции выполняются независимо от расположения генов-мишеней. В частности, существует класс lncRNAs с энхансероподобной активностью, которые могут транскрипционно активировать соседние гены [16]. В более общем плане исследования функций lncRNAs показали, что они потенциально вовлечены в различные биологические процессы у млекопитающих [2, 15]. Эти процессы включают, например, поддержание плюрипотентности эмбриональных стволовых клеток, дифференцировку клеток, регуляцию клеточного цикла и иммунный ответ. LncRNAs регулируют экспрессию генов с помощью различных механизмов. Молекулярные аспекты этих механизмов были подробно описаны в недавних обзорах [2, 4, 15]. Кроме того, LncRNAs могут потенциально связывать ДНК, белки или другие РНК, образуя сети и, таким образом, обеспечивать взаимодействие между различными функциональными молекулами. Некоторые lncRNAs способны изменять контекст хроматина вблизи своих генов-мишеней путем набора факторов транскрипции, факторов модификации гистонов или перестройки хроматина, тем самым стимулируя или подавляя транскрипцию генов-мишеней в зависимости от контекста. Среди lncRNAs, которые были функционально охарактеризованы, — XIST (X-неактивный специфический транскрипт), транскрипт размером 19 кбайт, ген которого расположен на Х-хромосоме [17]. XIST принимает непосредственное участие в инактивации Х-хромосомы у женщин. После транскрибирования XIST сохраняется в ядре и покрывает неактивную Х-хромосому. Кроме того, он взаимодействует с ингибиторным комплексом Polycomb 2 (PRC2), что позволяет целенаправленно рекрутировать этот комплекс и тем самым способствует поддержанию инактивации Х-хромосомы [17]. Интересно, что XIST, в свою очередь, регулируется другими lncRNAs, такими как TSIX и XITE (X-inactivation intergenic transcription element) [17]. Другие типы lncRNAs, расположенные в геномных областях, подвергнутых родительскому импринту, такие как AIRN, H19 и KCNQ1OT1, также участвуют в инактивации экспрессии генов посредством их ассоциации с ингибиторными комплексами, связанными с хроматином [6]. HOTAIR lncRNAs, ген которой расположен в локусе HOXC, будет служить каркасом для комплексов PRC2 и LSD1 (лизин-специфическая деметилаза 1) — двух комплексов, связанных с ингибированием транскрипции, — и способствовать их набору в пределах локуса HOXD [18, 19]. Напротив, lncRNAs Mistral и HOTTIP будут способствовать экспрессии генов HOXA путем набора эпигенетического комплекса WD5/MLL [20, 21].
LncRNAs также в значительной степени участвуют в посттранскрипционных процессах, связанных с биогенезом мРНК, таких как сплайсинг, транспорт, трансляция и деградация мРНК. Например, UCHL1-as, антисмысловая lncRNA, которая частично перекрывает 5’ гена UCHL1, способствует трансляции мРНК гена UCHL1 [22]. Кроме того, lncRNAs могут действовать как «губки» для предотвращения связывания miRNAs с их мРНК-мишенями. CDR1-as/ciRS-7 (губка для miR-7), круговая lncRNA, экспрессируемая у людей, которая имеет 70 сайтов связывания для miR-7 [23, 24], а также некоторые некодирующие РНК, называемые энхансерными РНК (eRNA), образуются из дистальных цис-регуляторных элементов [16]. В настоящее время роль этих eRNAs в транскрипционной активности гена-мишени еще не определена, поскольку они также могут быть просто побочными продуктами активных регуляторных элементов. В этом смысле недавно было продемонстрировано, что дивергентно транскрибируемые пары lncRNA/mRNA отражают специализированный механизм регуляции транскрипции с участием двунаправленных промоторов [7].
Роль lncRNAs в развитии заболеваний
Учитывая вклад lncRNAs в физиологические процессы, изменение их уровня экспрессии может привести к развитию патологий, таких как рак. Действительно, многие исследования, демонстрирующие отсутствие регуляции lncRNAs в различных типах раковых клеток, позволяют предположить, что lncRNAs могут действовать как супрессоры опухолей или потенциальные онкогены [4]. Среди примеров IncRNAs, связанных с раком, роль HOTAIR была наиболее изученной. В нескольких публикациях сообщается о сверхэкспрессии HOTAIR при различных формах рака, где он иногда участвует в образовании метастазов [25, 26].
MALAT1 является еще одной хорошо изученной lncRNA: его избыточная экспрессия связана с метастатическим состоянием опухолей. Было предложено его использование в качестве прогностического маркера при раке легкого [4]. Точно так же онкогенные функции были предложены для некоторых других lncRNAs, например, рака печени (HULC), рака простаты (PCA3) и почки (MVIH) [27—30]. Наконец, некоторые lncRNAs, такие как lincRNA-p21 и MEG3, были вовлечены в модуляцию ответа р53 [31, 32]. Участие lncRNAs в развитии патологий не ограничивается раком. Количество исследований, предполагающих участие lncRNAs в развитии различных заболеваний, продолжает увеличиваться [4]. CDKN2B-as1 (ANRIL), lncRNA, вовлеченная в несколько видов рака [33], также связана с атеросклерозом [34, 35]. Аналогичным образом развитие различных патологий, таких как болезнь Альцгеймера, неонатальный диабет и др., может быть результатом дерегуляции экспрессии lncRNAs. Наконец, в дополнение к дерегуляции экспрессии lncRNAs несколько генетических исследований выявили наличие мутаций в их первичных последовательностях [1, 4].
LncRNAs как терапевтические мишени и биомаркеры
LncRNAs с учетом их ключевой роли в регуляции экспрессии генов представляют потенциальные терапевтические мишени. Клинические испытания с использованием терапевтических средств на основе РНК уже находятся в стадии становления [15]. Большинство из них включают небольшие интерферирующие РНК (siRNA) или антисмысловые олигонуклеотиды (АСО), которые приводят к деградации их РНК-мишеней. Например, использование in vivo у мышей АСО, направленного против lncRNA Bdnf-as, устраняет репрессию Bdnf и позволяет пролиферацию нейронов [36]. Альтернативно АСО могут действовать как блокирующие агенты, предотвращая связывание lncRNA с белком, ДНК или РНК. Однако следует отметить, что распределение и доставка АСО в многоклеточных организмах остается до сих пор основным препятствием для разработки этих терапевтических агентов [15]. Поскольку многие из этих lncRNAs были связаны с развитием метастазов или прогрессированием опухоли, они могут служить потенциальными биомаркерами для скрининга и прогноза рака. Некоторые из них, такие как PCA3 и HULC, уже используются для диагностики рака простаты и гепатоцеллюлярной карциномы соответственно [27, 28]. Интересно, что очень стабильные нуклеиновые кислоты (РНК и ДНК) могут быть обнаружены в жидкостях организма, таких как кровь, плазма и моча [37]. По-видимому, существует хорошая корреляция между уровнем циркулирующей нуклеиновой кислоты и геномными, эпигенетическими или транскрипционными изменениями, связанными с опухолями. Эти нуклеиновые кислоты будут секретироваться или высвобождаться в кровь раковыми клетками при апоптозе или некрозе.
Заключение
LncRNAs выступают в качестве ключевых регуляторов экспрессии генов. Множество исследований ясно демонстрируют их роль в нескольких фундаментальных физиологических процессах. Точно так же доказательства их причастности ко многим патологиям, включая рак, продолжают расти. Потенциальное использование lncRNAs в качестве биомаркеров и терапевтических мишеней является многообещающим. Основной проблемой в настоящее время остается функциональная характеристика подавляющего большинства lncRNAs. Однако идентификация и картирование всех lncRNAs, присутствующих в геноме человека, должны ускорить достижение этой цели. Это предполагает совместные усилия функциональной геномики, эпигеномики и биоинформатики. Создание международных консорциумов, таких как проект ENCODE и европейский проект A BLUEPRINT of Haematopoietic Epigenomes, партнера IHEC (International Human Epigenome Consortium), играет решающую роль в этом контексте [38].
Данная работа была выполнена при финансовой поддержке гранта Республики Башкортостан молодым ученым от 7 февраля 2020 № УГ-43.
Авторы заявляют об отсутствии конфликта интересов.