Linux - grep
Linux - grep

Заметки по изучению дерева навыков бионавыков

grep

Инструмент поиска текста, который может искать текст, используя шаблон сопоставления обычных фраз.

image.png
image.png
image.png
image.png
Язык кода:{r setup, include=FALSE}
копировать
>grep -nr 'TATATT' Data/  ##Показать номер строки
>less Data/example.gtf | grep -w 'gene' ## Искать в текстовом формате
>cat Data/example.gtf | grep -w -e 'gene' -e 'exon' ## несколько ключевых слов

>cat file
gene
UTR
start_codon
stop_codon
>cat Data/example.gtf | grep -w -f file ##Читать из файла

регулярное выражение

image.png
image.png
Язык кода:{r setup, include=FALSE}
копировать
cat readme.txt | grep '^T' ##Узнаем, что начало строки — T
cat Data/example.fa | grep -n '^TATA' ##Узнаем, что начало строки — TATA,И отметьте номер строки
cat Data/example.fa | grep -n 'TATA$' ## заканчивается на ТАТА

cat Data/example.fa | grep -n '^TATA$' ##Эта строка содержит только TATA

cat readme.txt | grep 'f.ee' ## . Заменить любой символ, кроме символов новой строки
cat readme.txt | grep 'f\?ee'  ## xee или fee f появляется один или ноль раз
cat readme.txt | grep -E 'f?ee' ## Если вы напишете -E, вам не нужно писать обратную косую черту.
cat readme.txt | grep 'f\\?ee' ## Находясь в поиске f\?ee

cat readme.txt | grep [bB] ## bилиB
cat readme.txt | grep [^Tt] ##Исключить Т и т
cat Data/example.gtf | grep -E 'UTR|exon'

### Рекомендуется для всех регулярных выражение Приведи их всех -E
image.png
image.png
Язык кода:{r setup, include=FALSE}
копировать
cat Data/example.gtf | grep -wc 'gene'

cat Data/example.gtf | grep -vc 'exon'

cat Data/example.gtf | grep -wE 'CDS|UTR'
cat Data/example.gtf | grep -w -e 'CDS' -e 'UTR'

cat Data/example.fq | grep -c '@'

cat Data/example.fq | grep -c '^@'

grep -r -E -n 'TATA[AT]A[AT][ATCG]' Data/
Язык кода:{r setup, include=FALSE}
копировать
cat Data/example.fq | grep -c '^@'
>1006

wc -l Data/example.fq
>4000

## Их больше, начиная с 6@, потому что некоторые качественные строки могут начинаться с @.

cat Data/example.fq | grep -c '^@ERR'
>1000
cat Data/example.fq | grep '^@' | grep -vn '^@ERR'
267:@;;@=BBBBBB??=?DD==8CBB@=>BBA=8=@@;DBDBBBEEBEGGGDBEEBBEGDGG@4.+?88BB<?
272:@HHHFHGHEHHGHHD;@EDFBDBBGGGDG?GGEBEGEGGGGGEBE<F8F<>A>A>GGAGA??>A######
429:@E<?GGGGBGGBGBDEED<DE<DEBDG@GE>>B;;BEEB=??2>CACAC?>B??????CE??E8?G@DD#
620:@BGDGBGEGEFGGHHHGHGH=GGGGHHHHHHDHFHHGDGHHHHHHHHHHHHDGDHHGHHHHHHHFHGHGH
633:@@;@=BDDBDDGE4GG?FGGG<GBDEEDEEHGHHFHHHHHHHFHHGGGGGHHHFHHHGHHHEHHHEGEGG
831:@GBGG?CEEDEB:E8ED>:EBD=@D6=5=<AA>A1CC>E###############################

Дополнительные вопросы

Язык кода:{r setup, include=FALSE}
копировать
## Сколько генов содержится в Y-хромосоме человека?
$ zless Data/Homo_sapiens.GRCh38.102.chromosome.Y.gff3.gz | cut -f 3 | grep -v '#' | grep -w 'gene' -c
> 47
## Какие типы указаны в третьем столбце файла аннотаций Y-хромосомы?
zless Data/Homo_sapiens.GRCh38.102.chromosome.Y.gff3.gz | cut -f 3 | grep -v '#' | sort |uniq -c | sort -n
      1 chromosome
      3 snoRNA
      7 ncRNA
     17 snRNA
     47 gene
     92 ncRNA_gene
    149 mRNA
    196 three_prime_UTR
    222 five_prime_UTR
    258 lnc_RNA
    290 biological_region
    382 pseudogene
    382 pseudogenic_transcript
   1568 CDS
   4285 exon
boy illustration
Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Прочитайте нейросетевую модель Трансформера в одной статье
boy illustration
.ART Теплые зимние предложения уже открыты
boy illustration
Сравнительная таблица описания кодов ошибок Amap
boy illustration
Уведомление о последних правилах Points Mall в декабре 2022 года.
boy illustration
Даже новички могут быстро приступить к работе с легким сервером приложений.
boy illustration
Взгляд на RSAC 2024|Защита конфиденциальности в эпоху больших моделей
boy illustration
Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.
boy illustration
Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)
boy illustration
Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов
boy illustration
[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста
boy illustration
Обзор Cloud-init и этапы создания в рамках PVE
boy illustration
Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)
boy illustration
Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.
boy illustration
Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!
boy illustration
[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !
boy illustration
[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз
boy illustration
Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.
boy illustration
Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?
boy illustration
Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента
boy illustration
Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.
boy illustration
Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)
boy illustration
[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши
boy illustration
Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)
boy illustration
Кодирование Base64 в MultipartFile
boy illustration
5 точек расширения SpringBoot, супер практично!
boy illustration
Глубокое понимание сопоставления индексов Elasticsearch.
boy illustration
15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.
boy illustration
Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.