Сегодня мы собираемся изучить свежую статью о MR и посмотреть, можно ли использовать ее идеи и методы в наших целях~
Рассеянный склероз — сложное аутоиммунное заболевание, для лечения которого разработано и широко применяется множество методов лечения.
Однако,Существующие лекарства не могут остановить рецидив или облегчить прогрессирование заболевания.,Эффект далек от удовлетворительного.
Таким образом, для предотвращения рассеянного склероза по-прежнему необходимы новые лекарственные средства.
Мы использовали Международный консорциум по генетике рассеянного склероза (nCase = 47 429,nControl = 68 374) и в Биобанке Великобритании (nCase = 1356,nControl = 395 209) и финская геномная когорта (nCase = 1326,nControl = 359 815) для дальнейшей проверки,руководить ПонятноМенделевская рандомизация,исследоватьрассеянный склероз Потенциальные мишени для лекарств.
Генетические варианты 734 белков плазмы и 154 белков спинномозговой жидкости были получены в результате недавно опубликованных полногеномных ассоциативных исследований.
В целях дальнейшего закрепления результата менделевского случайного анализа,использовать双向Менделевская рандомизацияанализироватьи Steiger Фильтрация, байесовская колокализация и фенотипическое сканирование [phenotype scanning] руководить ПонятноПредположение об обратной причинно-следственной связи,Найти ранее сообщаемые ассоциации между генетическими вариантами и признаками.
также,возвращатьсяруководить Понятновзаимодействие белков сетевойанализировать,выявить белки и/или существующий рассеянный Возможные ассоциации между наркотиками.
Белки плазмы и спинномозговой жидкости (общий белок спинномозговой жидкости) как потенциальные терапевтические мишени при рассеянном склерозе.
первый,Мы используем международный рассеянный Консорциум склероз-генетики (IMSGC) из GWAS Дейта, Чжэн плазма в исследованиях pQTL данные и Yang в стадии исследования CSF pQTL данные, использовать MR для выявления потенциально патогенной плазмы и CSF Белковый состав.
Во-вторых,Используя обнаружение обратной причинно-следственной связи, Байесовский анализ Основные выводы были дополнительно подтверждены тестом колокализации и фенотипа.
третий,мы рисуем Понятно Признанныйбелокмежду、На основе плазмы и CSF Сети взаимодействий между белками, а также между идентифицированными белками и текущими мишенями лекарств от рассеянного склероза.
наконец,Мы использовали Биобанк Великобритании и когорту генома Финляндии. GWAS данные и два новых релиза изплазма в исследованиях pQTL Данные неоднократно анализировались в качестве внешней проверки для подтверждения наших выводов.
Вот краткое введение в GWAS & Разница между QTL~
Полногеномные исследования ассоциаций (Genome-Wide Association Учиться, короче GWAS),находится ввесь геномв пределах досягаемости,Обнаружение разнообразия генетических вариаций у нескольких людей,Получить каждую особь в группе, а затем статистически соотнести ее с признаком (то есть, как мы часто говорим, из Фенотипа) руководитьанализировать;,По статистике (в основном относится к P значение) для отсеивания вариантов сайтов и генов-кандидатов.
Локусы количественных признаков Trait Locus картографирование, аббревиатура QTL позиция),обратитесь кизколичественный признак, который контролируетизгены в геномеиз Расположение。QTLможно разделить наcis-QTLиtrans-QTL。Принцип состоит в том, чтобы измерить группу людей.изкто-тоКоличественные характеристики(Фенотип),и ониизгенотип(то естьНекоторые генетические маркеры генома,например, СНП),тогда ищигенотипиФенотипиз Переписка。 eQTL eQTL(expression QTL (уровень экспрессии генов), то есть те сайты, которые контролируют уровень экспрессии м РНК генов количественных признаков. 【например,cis-eQTLобратитесь киздакто-то ГенизeQTLнайдите Генрасположениеиз Генгрупповая зона,показыватьвозможныйдаРазличия в самом гене вызывают изменения уровней м РНК.; trans-eQTLобратитесь киздакто-то ГенизeQTLТаргетинг на других Генгрупповая зона,показыватьРазличия в других генах контролируют различия в уровнях м РНК этого гена.。】 В большинстве случаев нас волнует «взаимосвязь между этим сайтом SNP и уровнем экспрессии близлежащей м РНК», поэтому мы обычно проводим анализ цис-eQTL. pQTL pQTL(protein QTL, уровень экспрессии белка), то есть те локусы, которые контролируют уровень экспрессии белка генов количественных признаков. sQTL sQTL(splicing QTL, альтернативный сплайсинг), то есть сплайсинг локусов количественных признаков, влияющих на регуляцию сплайсинга. meQTL meQTL(methylation QTL, метилирование ДНК), локусы количественных признаков метилирования ДНК, связанные с эпигенетической регуляцией.
Далее приведены конкретные материалы и методы——
блок-схема
Исходные данные о pQTL CSF взяты из: Yang et al. (274 pQTL из 184 белков CSF).
Какие данные pQTL можно включить:
(i) Сильная общегеномная корреляция (P < 5 × 10-8); (ii) Расположен в области главного комплекса гистосовместимости (MHC) (chr6, 26-34). Мб); (iii) Неравновесие по сцеплению (LD) r2 < 0.001; (iv) представляет собой цис-pQTL.
Наконец, для 154 белок идентифицирован 154 Цис-pQTL.
Данные о pQTL в плазме были получены от Zheng et al., объединив общедоступные данные пяти GWAS.
Согласно вышеизложенному CSF pQTL данныенаборизКритерии фильтра,Всего включено Понятно 734 белок 738 цис-действующий SNPs。
Кроме того, из двух недавно опубликованных исследований [Pietzner et al (4775 белков плазмы, измеренных у 10 708 участников) и Ferkingstad et al (4907 белков плазмы, измеренных у 35 559 участников) были получены данные о pQTL в плазме для последующей внешней проверки.
пс: для QTL GWAS Любая недостающая информация в данных, например, частота аллелей эффекта (эффект allele frequency),Мы используем совпадения при построении генома человека в качестве ссылки.,Завершить обработку данных.
Данные были взяты из крупнейшего набора данных GWAS в IMSGC, который включает 115 803 человека европейского происхождения (nCase = 47 429, nControl = 68 374).
Наборы данных для валидации были получены из Биобанка Великобритании (nCase = 1356, nControl = 395 209 по состоянию на 2017 год) 13 и исследования FinnGen (nCase = 1326, nControl = 359 815, версия R6).
Примечание. В данных, полученных в общедоступном наборе данных, должно быть указано конкретное время получения данных и номер версии базы данных, поскольку эти две базы данных постоянно обновляются.
Мы провели МР-анализ с использованием «TwoSampleMR» (https://github.com/MRCIEU/TwoSampleMR), используя белки плазмы и спинномозговой жидкости в качестве субъектов воздействия и рассеянный склероз в качестве результата.
Если для белка имеется только один pQTL, используется коэффициент Вальда. Когда белок имеет два или более генетических варианта, используется взвешенный магнитный резонанс с обратной дисперсией (MR-IVW) с последующим анализом гетерогенности.
Отношения шансов (ОШ) для повышенного риска рассеянного склероза выражаются на одно стандартное отклонение (SD) увеличения уровней белка в плазме и на 10-кратное увеличение уровней белка в спинномозговой жидкости.
использовать Bonferroni Исправление для корректировки многократного тестирования и использования. 0.05/888 критический P Значение(П < 5.63 × 10-5), чтобы расставить приоритеты результатов для дальнейшего анализа.
Задайте вопрос: Откуда взялось число 888? Зачем делить 888 на 0,05?
Внешняя проверка MR проводилась только для предварительно идентифицированных белков с пороговым значением P, установленным на уровне 0,05.
Мы приняли ту же стратегию мутаций, что и стратегию значимых мутаций: первая — такая же, как и предварительный анализ. SNP В качестве инструмента генетической изменчивости последние используютвесь. геномзначимый SNP в качестве генетических вариантов для подтверждения первоначальных результатов.
Следуя тем же критериям скрининга, что и pQTL, 134 генетических инструмента рассеянного склероза были проверены на основе данных IMSGC GWAS для двустороннего MR-анализа для выявления потенциальной обратной причинно-следственной связи.
Полная сводная статистика по белкам взята из трех предыдущих исследований:
Yang C, Farias FHG, Ibanez L, et al. Genomic atlas of the proteome from brain, CSF and plasma prioritizes proteins implicated in neurological disorders. Nat Neurosci. 2021;24:1302-1312. Ferkingstad E, Sulem P, Atlason BA, et al. Large-scale integration of the plasma proteome with genetics and disease. Nat Genet. 2021;53:1712-1721. Sun BB, Maranville JC, Peters JE, et al. Genomic atlas of the human plasma proteome. Nature. 2018;558:73-79.
использовать MR-IVW, MR-Egger, взвешенная медиана (взвешенная медиана), простой режим и взвешенный режим (простой mode and weighted режим), чтобы оценить эффект. Мы также провели Steiger Методы фильтрации для обеспечения направленности связей между белками и рассеянным склерозом.
когда P < 0.05 , результаты статистически значимы.
Байесовский анализ колокализациииспользовать "coloc " (https://github.com/chr1swallace/coloc) и параметры по умолчанию для оценки вероятности того, что две черты имеют один и тот же причинный вариант.
Байесовская колокализация обеспечивает апостериорные вероятности для пяти гипотез о том, имеют ли два признака общий вариант.
Мы проверили апостериорные вероятности гипотезы 3 (PPH3) и гипотезы 4 (PPH4):
В гипотезе 3 и белок, и МС связаны с этой областью разными вариантами;
В гипотезе 4 и белок, и MS связаны с этой областью через общие варианты.
Мы получили это одновременно coloc.abf
и coloc.susie
алгоритм и основанный на генах PPH4 > 80% свидетельства колокализации для определения генов.
Мы также провели фенотипическое сканирование, просматривая предыдущие данные GWAS, чтобы выявить ассоциации идентифицированного pQTL с другими признаками.
Фенотип Сканирование пройденоphenoscanner
и Ferkingstad Плазменный протеом et al. GWAS Исследования проводятся.
Плейотропными считаются SNP, отвечающие следующим условиям:
(i) Ассоциация значима для всего генома (P < 5 × 10-8); (ii)GWAS Проводится у людей европейского происхождения; (iii)SNP Связан с любым известным фактором риска рассеянного склероза, включая метаболические, белковые или клинические особенности.
Целью этого шага является устранение влияния мешающих факторов и обеспечение корреляции между инструментальными переменными и мешающими факторами.
Кроме того, мы рассчитали LD r2 между pQTL белков, чтобы выявить потенциальные связи между ними.
[PhenoScanner (cam.ac.uk http://www.phenoscanner.medschl.cam.ac.uk/)
Установите «порог» в соответствии с вашими потребностями ~
# install.packages("devtools")
library(devtools)
# install_github("phenoscanner/phenoscanner")
library(phenoscanner)
# For example, to query multiple SNPs:
res <- Phenoscanner(snpquery=c("rs10840293","rs10"))##Запрос существенно связан с признаками нашего инструмента. Если эти признаки могут повлиять на результат, то соответствующие SNP являются плейотропными. из, быть удаленным.
head(res$results)
res$snps
Мы предполагаем,В связи с наличием гематоэнцефалического барьера,плазма и CSF идентифицированный pQTL Корреляции почти нет.
поэтому,мы проходимКорреляционный анализ СпирменаИсследовать Понятноиспользовать МР-анализполучатьиз Оценка эффекта CSF блестящий идентифицированный обмен pQTL корреляция между и множество различных P порог значения, чтобы выяснить, меняется ли корреляция по мере увеличения уровня значимости.
Мы проанализировали белки в спинномозговой жидкости или плазме, которые были связаны с риском рассеянного склероза ( MR анализировать P <0.05)избелок-белоквзаимодействие(PPI)сетьруководить Понятноисследовать。
Мы стремились изучить взаимодействие между приоритетными белками и то, взаимодействуют ли белки, идентифицированные с использованием данных плазмы, с белками, идентифицированными с использованием данных спинномозговой жидкости.
Кроме того, чтобы изучить взаимодействие между этими генами, связанными с рассеянным склерозом, и рыночными мишенями для лекарств, мы получили 13 лекарств для лечения рассеянного склероза из недавнего обзора и на основе базы данных Drugbank (https: //www.drugbank.ca), полученной соответствующие мишени для лекарств.
McGinley MP, Goldschmidt CH, Rae-Grant AD. Diagnosis and treatment of multiple sclerosis: A review. JAMA. 2021;325: 765-779.
Мы также провели поиск существующих лекарств, нацеленных на идентифицированные белки, потенциально вызывающие заболевания.
все PPI анализироватьиспользовать Поиск взаимодействующих генов из базы Поиск инструмента (STRING) данных 11.5 версии (https://string-db.org/), минимальная необходимая оценка взаимодействия равна 0.4。
также,насвозвращатьсяиспользовать Wald Был использован метод отношений MR анализировать,ииспользовать coloc.abf алгоритмруководить Понятно Байесовский анализ колокализации,Отдавайте приоритет белкам как белкам воздействия, так и белкам результата.。мы будем MR из P значение меньше, чем 0.05 рассматривается как потенциал взаимодействия, PPH4 >0.8 рассматривается как потенциальная из Совместная локализация。
Сожаление,В этом документе не указан код,Но как новичок,Сначала изучите идеида Очень хорошийизвыбирать。 Менделевская Сбор рандомизации только начался. Редактор также продолжает обновлять информацию о своем прогрессе в учебе и планах Менделевской на будущее. Содержание рандомизации в основном основано на совместном использовании документов и практике написания кода.,Перемежается с некоторыми методами анализа, связанными с MR, и обменом данными.,Если у вас есть другие предложения,Вы также можете оставлять сообщения в фоновом режиме~