Сегодня исследования микробного сообщества полностью перешли на стадию анализа секвенирования, а нынешнее основное направление исследований находится в переходном периоде между ампликонами второго поколения и ампликонами третьего поколения. Анализ состава бактериального разнообразия на основе секвенирования третьего поколения может значительно повысить точность и полноту классификации и идентификации видов, а также более точно восстановить состав микробных сообществ в образцах. Одновременно с достижением обнаружения «высокого разрешения» он также обеспечивает. будущее Это заложило основу для углубленного изучения метаболических функций бактериальной флоры.
16S рибосомальная РНК (16S рибосомальная РНК), называемая 16S п РНК, является компонентом 30S рибосомальной субъединицы прокариот. Ген 16С р РНК присутствует во всех геномах бактерий.,Длина ок.1542 б.п., в том числе 10 Заповедная территория регион) и 9 Переменная площадь (Переменная регион), консервативный регион отражает генетическое родство между видами, а вариабельный регион отражает различия между видами. (Рисунок 1). 16S Ген р РНК с его умеренным молекулярным размером и низкой частотой мутаций является наиболее полезным и часто используемым молекулярным маркером в исследованиях по классификации бактерий. Обнаружение 16S посредством высокопроизводительного секвенирования ампликонов 16S Вариация последовательности и численность вариабельных областей р ДНК могут предоставить информацию о разнообразии и численности микробных сообществ в образцах и играть важную роль в классификации и идентификации микробов, микроэкологических исследованиях и т. д.
В 1990 году ученые впервые обнаружили последовательность 16S р РНК, присутствующую в образцах окружающей среды (1), и раскрыли ее исследовательский потенциал. С тех пор началась великолепная эра исследований микробного сообщества. Секвенирование 16S второго поколения имеет ограниченную длину амплифицированного фрагмента, составляющую всего 500-600 п.н. (двустороннее перекрытие), поэтому подбор вариабельных областей для ампликонов второго поколения представляет собой большую проблему. Отбор означает компромисс и потерю информации, как показано на рисунке. статью (3), с высокой долей неопознанных видов на уровне рода и вида (рис. 2). Секвенирование ампликона 16S третьего поколения использует праймеры 27F и 1492R для амплификации полноразмерного фрагмента (охватывающего область V1-V9), который может легко покрыть общую длину 16S около 1500 пар оснований и в общей сложности 9 вариабельных областей, что максимально увеличивает возможность разделения видов. идентификация (рисунок 3).
Каждый раунд технологических инноваций приводил к изменениям в исследовательских идеях. Технология ампликонов второго поколения принесла исследовательские идеи, которые фокусируются на изменениях в общем разнообразии сообществ и микробном составе на уровне типа/рода. Технология ампликонов третьего поколения идет на шаг дальше и уделяет больше внимания корреляции между различными группами. Она не только фокусируется на численности видов на уровне типа/рода, но также может исследовать отношения сотрудничества/конкуренции видов внутри рода. Благодаря таким характеристикам высокого разрешения исследование уровня деформации, естественно, стало центром исследований. В отличие от предыдущих исследований 16S второго поколения на уровне семейства и рода, полноразмерное 16S третьего поколения может обеспечить более полное и детальное определение уровня деформации. Приближение всех результатов исследования к экологическим функциям имеет большое значение для мультиомических корреляций и последующего экспериментального руководства и проверки. То же самое верно и с точки зрения мультиомической корреляции. Мультиомная корреляция данных более тонкого уровня часто может выявить более четкие локальные закономерности, включая многие детали, которые игнорировались или были недоступны в прошлом.
PacBio полная длина 16S секвенирование гена р РНКиспользовать27F、1492RПраймеры амплифицируют полноразмерные фрагменты(крышкаV1-V9округ),использоватьPacBio Платформа секвенирования SMRT CCS (Circular Consensus Режим секвенирования) для анализа секвенирования. Пак Био Секвенирование SMRT имеет множество явных преимуществ:
HiFi Full-length 16S nextflow
анализироватьпроцесспредназначен для прохожденияDADA2
иQIIME2
Воля Полная длина 16S Кластеризация последовательности Hi-Fi в высококачественный Amplicon Sequence Variants (ASV) для завершения последующего анализа 。этотпроцессна основеQIIME2
,Поэтому он может сделать анализ,Такие как альфа-разнообразие и бета-разнообразие.,Аннотация видов и визуализация,HiFi Full-length 16Sанализироватьпроцесс Всего можно достичь (картина5)。КромеASVsкластеризация,анализироватьпроцесс Все еще доступноvsearch
руководитьOTUкластеризация。
HiFi полноразмерный процесс 16S: https://github.com/PacificBiosciences/HiFi-16S-workflow
pb-16S-nt
документпапка:$ git clone https://github.com/PacificBiosciences/pb-16S-nf.git
pb-16S-nt
издокументпапка。Если это кампусная сеть,Столкнулся с ситуацией, когда загрузка не может произойти,можно пойтиpb-16S-ntизgithubДомашнее руководствоскачать,Затем загрузите на сервер.pb-16S
анализироватьпроцессдо,Требуется установкаnextflow
и conda
,альтернативаsingularity
илиdocker
。$ nextflow run main.nf --download_db
databases
издокументпапка。databases
издокументпапка,Поместите в него скачатьдокумент.# Создайте образец документа TSV, чтобы указать путь к образцу.
$ echo -e "sample-id\tabsolute-filepath\ntest_data\t$(readlink -f test_data/test_1000_reads.fastq.gz)" > test_data/test_sample.tsv
# Тестовые данные, используйте conda для создания среды
$ nextflow run main.nf --input test_data/test_sample.tsv \
--metadata test_data/test_metadata.tsv -profile conda \
--outdir results
# Если conda не может быть создана, вы можете попробовать dockerилиsingularity.
$ nextflow run main.nf --input test_data/test_sample.tsv \
--metadata test_data/test_metadata.tsv -profile singularity \
--outdir results
conda
создавать Если вы не знаете окружающую среду, вы можете обратиться к моему сайтуgithubначальствопредлагатьизрешение:https://github.com/PacificBiosciences/HiFi-16S-workflow/issues/2。conda
создавать Экология все еще не очень хорошая,могу попробовать -profile docker
или -profile singularity
。docker
или singularity
, При первом запуске тестового образца данных вам необходимо загрузить образ, что займет много времени.Обязательным условием является необходимость установки SMRTlink.
На официальном сайте PacBio Multiplexing Page Скачать здесь barcode из Fasta
документ (Рисунок 7).
Sequel_16S_barcodes_for_192-Plex.fasta
документначальствоперейти на службу,надеватьopt/barcodes/
по пути,Если у вас нет этого пути, вы можете создать его самостоятельно.Data Management - Import Data - Select Barcodes (FASTA)
документимпортироватьSMRTlinkпрограммное обеспечение,Штрих-код будет разделен позже для использования (рис. 8).CCS
процесс。Barcoded Sample File
,Цель состоит в том, чтобы сопоставить штрих-код и названия образцов.Demultiplex Barcodes
процесс Волясмешанная выборка(hifi reads)Расколоть,SMRT Analysis - Creat New Analysis - Demultiplex Barcodes
и установите согласно рисунку 9.демультиплекс.barcodecombination.hifi_reads.fastq.gz
имя (Рисунок 10).$ cat rename.txt
демультиплекс.barcodecombination.hifi_reads.fastq.gz newname1.fastq.gz
демультиплекс.barcodecombination.hifi_reads.fastq.gz newname2.fastq.gz
$ cat rename.txt | while read i j
>do
>mv $i $j
>done
Сделано по запросуmetadata.tsv
и sample.tsv
двадокумент,Просто следуйте примеруруководитьPacBio полная длина 16S проанализировал процесс.
$ nohup nextflow run main.nf --input 16S_project/sample.tsv \
--metadata 16S_project/metadata.tsv -profile conda \
--outdir 16S_project_results &
# После получения кривой разрежения можно указать глубину разрежения и повторно запустить программу.
$ nohup nextflow run main.nf --input 16S_project/sample.tsv \
--metadata 16S_project/metadata.tsv -profile conda \
--outdir 16S_project_results \
-resume --rarefaction_depth 5000 &
специфическийиз Для интерпретации результатов см.:https://github.com/PacificBiosciences/HiFi-16S-workflow/blob/main/pipeline_overview.md。
1. Если SMRTlink не установлен,barcodeиз Расколоть也可以использоватьlima。
#HiFi run from BAM with symmetric barcodes:
$ lima <movie>.hifi_reads.bam barcodes.fasta <movie>.demux.bam --hifi-preset SYMMETRIC
2. Если данные получены от поставщика услуг секвенирования,Выборочные данные должны быть хорошо разделены.,Используйте HiFi напрямую Full-length Просто проанализируйте процесс анализа 16S.
NextflowОфициальный сайт: https://www.nextflow.io/
#Убедитесь, что Java11 установлен
$ java -version
#Если Java не установлена, выполните следующую команду, чтобы установить ее
#Установить OpenJDK 11 JDK, серверная система centOS7
$ yum install java-11-openjdk-devel
#Установить следующий поток
$ curl -s https://get.nextflow.io | bash
#nextflow Пробный пуск
./nextflow run hello
#Вы можете добавить следующий поток в системный путь