фон
Если вы хотите создать собственную вычислительную платформу, вам необходимо сначала приобрести сервер. В этом разделе мы представим контент, связанный с серверным оборудованием. Как упоминалось ранее, верхнего предела вычислительных ресурсов не существует, необходимо соблюдать минимальные требования. Более того, сервер обладает отличной масштабируемостью и может быть расширен в зависимости от реальной ситуации. Более того, все серверы модульные, поэтому вы можете выбрать оборудование, подходящее вам по вашему бюджету.
Согласно нашему реальному опыту, наиболее важным выбором среди этих компонентов является ЦП. ЦП — это мозг компьютера, отвечающий за вычисления. Поэтому выбор процессора является наиболее важным. Для обычного сервера бывают одноканальные, двухканальные или четырехканальные сервера. Проще говоря, можно установить несколько процессоров. Поскольку память, диски и видеокарты являются модульными, их можно добавить в любое время. Например, вначале вы можете выбрать только память 128 ГБ (32 ГБ*4), но позже памяти будет недостаточно. Вы можете купить сразу 4 штуки одной и той же памяти, подключить ее к машине после выключения питания и завершения обновления. Диски и видеокарты похожи и требуют небольшой обработки внутри системы. Но процессоры, как правило, сложно обновить позже. Поэтому при покупке сервера самое важное — выбрать хороший процессор, потому что его потом сложно обновить. С одной стороны, ЦП напрямую определяет скорость вычислений. С другой стороны, ЦП нелегко обновить. Если бюджет ограничен, купите процессор получше и обновите память и диск, когда появятся средства позже.
1. Тип сервера
Существует множество типов серверов, которые можно использовать в разных условиях.
Различные типы серверов
1.1 Башенный сервер
Преимущества: Башенный сервер похож на большой компьютер, а хост-корпус больше стандартного. Башенный сервер имеет высокую степень интеграции, занимает мало места, прост в управлении и обладает высокой масштабируемостью. Последние серверы имеют достаточную память. может быть расширен до более чем 320G, уже может выполнить большую часть работы по анализу биологической информации. Этот тип сервера особенно подходит для общих исследовательских групп.
Недостатки: Серийный тип плохой, подходит для одноразового использования, цена относительно дорогая.
1.2 Стойочный сервер
Преимущества: Серверы, монтируемые в стойку, также называемые блейд-серверами. Так называемый блейд-сервер представляет собой монтируемое в стойке шасси стандартной высоты, которое можно подключать к нескольким серверным модулям карточного типа для достижения высокой доступности и высокой плотности. Это недорогая серверная платформа. Ее основная структура представляет собой большое основное шасси, в которое можно вставить множество «блейдов». Каждый «блейд» на самом деле представляет собой системную плату. Блейд-серверы более компактны, чем серверы, монтируемые в стойку.
Недостатки: Проблема с отводом тепла довольно заметна. В корпусе часто устанавливают большой и мощный вентилятор для отвода тепла. Машина работает громко, поэтому лучше всего разместить ее в отдельном помещении.
1.3 Модульная инфраструктура
Преимущества: Решения модульной инфраструктуры (MI) позволяют оптимизировать вашу ИТ-инфраструктуру для традиционных, новых и возникающих рабочих нагрузок и открывают путь к современному программно-определяемому центру обработки данных. Вычислительные модули, модули хранения и сетевые модули созданы специально для ваших нужд и могут масштабироваться с течением времени.
Недостатки: дороже и занимает больше места.
1.4 Вычислительный кластер
Преимущества: Компьютерный кластер, называемый кластером, представляет собой компьютерную систему, которая соединена через набор слабо интегрированного компьютерного программного обеспечения или оборудования для тесного сотрудничества для выполнения вычислительной работы. В некотором смысле их можно рассматривать как компьютер. Кластер — это параллельная или распределенная система, состоящая из компьютеров, подключенных друг к другу. Эти компьютеры работают вместе и запускают общий набор приложений, обеспечивая при этом единую системную схему для пользователей и приложений. Внешне они представляют собой просто систему, предоставляющую унифицированные услуги внешнему миру. Компьютеры в кластере соединены физически с помощью кабелей и программно с помощью программного обеспечения кластера. Эти подключения позволяют компьютерам использовать функции аварийного переключения и балансировки нагрузки, которые недоступны на автономном компьютере.
Недостатки: Требуется отдельный компьютерный зал, система охлаждения, отдельный управленческий персонал, дорого в эксплуатации.
2.Процессор
2.1 Как выбрать процессор?
Процессор — это мозг компьютера. Компьютерные вычисления в основном выполняются процессором. Поэтому скорость процессора очень важна. Это верхняя часть дерева с эффектом ведра. Например, сплайсинг последовательностей требует разрезания секвенированных ридов на более мелкие фрагменты, а затем соединения этих небольших фрагментов в более длинные на основе взаимосвязи между последовательностями. Тогда количество этих фрагментов составляет от миллионов до десятков миллионов, и это требует больших усилий. Большой объем расчета. Если данные сложные, объем вычислений будет больше.
Кроме того, материнские платы для отдельных серверов обычно поддерживают только 1–4 ЦП. После приобретения ЦП впоследствии его будет сложно обновить. Если ваш бюджет ограничен, купите процессор получше, и позже вам будет легче обновить память и диск.
Кроме того, если процессор сервера выбран неправильно, а память и диск выбраны большими, весь сервер будет легким и тяжелым, а общая производительность не будет полностью задействована.
2.2 АМД или Интел?
В серверах используются в основном процессоры Intel и AMD. Обратите внимание, что материнские платы разных платформ соответствуют друг другу. Например, материнская плата, поддерживающая AMD, не поддерживает Intel. Потому что биологические вычисления часто требуют большего количества потоков. Здесь рекомендуется покупать процессор AMD, поскольку по той же цене у AMD может быть больше потоков.
Сравнение некоторых продуктов AMD
Кроме того, если какое-то специальное программное обеспечение, такое как GATK и т. д., имеет версии, совместимые с Intel, то вы можете выбрать только процессор Intel.
3. Память
Память — это среда обмена данными между ЦП и жестким диском. Компьютеру необходимо считывать данные, хранящиеся на жестком диске, в память, чтобы ЦП мог использовать их для вычислений. ЦП не может напрямую считывать данные с жесткого диска. диск и должен пройти через буфер памяти, например, ЦП — это мозг, память — это шея, а жесткий диск — ниже шеи. Память часто является «узким местом».
Важная роль памяти
Предположим, что данные секвенирования всего генома человека используют метод секвенирования второго поколения. Геном человека составляет 3G, а 10-кратные данные - 30G. Затем эти основания 30G разрезаются на более мелкие кмеры. не в счет. Чтобы сохранить некоторую другую информацию о последовательности, все данные должны быть сохранены в памяти одновременно при сращивании последовательности. Если объем памяти не достигает 100 ГБ, сращивание вообще не может быть завершено.
Поскольку на размер памяти для анализа данных влияет множество факторов, таких как объем данных, конкретные алгоритмы, содержание анализа и т. д., трудно подсчитать, сколько памяти потребуется для сращивания генома. ? Бактерии, грибы, люди, животные и растения? Секвенирование второго поколения, секвенирование третьего поколения, глубина секвенирования, распределение частоты ошибок? Какое программное обеспечение использовать? Каждое состояние будет отличаться. Даже если заданы все условия, невозможно смоделировать и оценить объем памяти.
4. Жесткий диск
Жесткий диск на самом деле является очень важной частью аппаратной конфигурации компьютера, но его часто игнорируют. Ошибочно думать, что жесткий диск используется для хранения данных, если он должен быть достаточно большим. .
Прежде всего, необходима большая емкость хранилища, поскольку биологические данные часто называют биологическими большими данными, которые занимают много места для хранения, включая хранение исходных данных, промежуточных результатов анализа, окончательных результатов, резервного копирования данных и т. д., особенно когда образец размер большой. Он займет много места для хранения, обычно в формате T.
Во-вторых, скорость чтения и записи жесткого диска также является очень важным фактором, поскольку текущая скорость вычислений процессора и объем памяти уже достаточно велики. В таких условиях жесткий диск становится фактором, ограничивающим общую производительность компьютера. Таким образом, использование жесткого диска SSD значительно улучшит производительность компьютера. Поскольку SSD в настоящее время слишком дорог, вы можете выбрать решение SSD+механический жесткий диск. Жесткий диск должен быть настроен как RAID для повышения скорости чтения и записи и безопасности данных.
Итак, какова скорость чтения и записи механических жестких дисков, твердотельных накопителей и памяти? Согласно запросу общедоступной информации, мы получили следующие данные. Однако обратите внимание, что это всего лишь среднее значение. между разными брендами и разными моделями продуктов.
1. Жесткий диск ноутбука со скоростью 5400 об/мин: 50-90 МБ в секунду.
2. Жесткий диск для настольных ПК со скоростью 7200 об/мин: 90–190 МБ в секунду.
3. Скорость чтения и записи твердотельного жесткого диска может достигать 500 МБ/с.
4. Теоретический предел скорости чтения и записи двухканальной памяти DDR4 2400 МГц составляет 2400 МГц*128 бит/8 = 38 400 МБ/с.
Пять, графический процессор
Графический процессор (GPU) также называют ядром графического дисплея, визуальным процессором и чипом дисплея. Это микропроцессор, который специализируется на обработке изображений на персональных компьютерах, рабочих станциях, игровых консолях и некоторых мобильных устройствах. В прошлом графические процессоры в основном использовались для графических вычислений. Теперь они используются для вычислений с графическим процессором и центральными процессорами для ускорения научных, аналитических, инженерных, потребительских и корпоративных процессов. приложения. Ускоритель графического процессора был впервые запущен компанией NVIDIA® в 2007 году. В настоящее время многие программы для биоинформатики поддерживают ускорение графического процессора. Например, гуппи, медака и ракон, используемые при анализе данных нанопор, а также GATK, используемый при обнаружении мутаций, поддерживают ускорение графического процессора.
6. Источник бесперебойного питания ИБП.
UPS означает источник бесперебойного питания, который представляет собой источник бесперебойного питания, содержащий устройство хранения энергии. В основном он используется для обеспечения бесперебойного питания некоторых устройств, требующих высокой стабильности электропитания. ИБП эквивалентен большому мобильному источнику питания и позволяет предотвратить внезапное отключение электроэнергии, приводящее к потере данных. ИБП по-прежнему очень важен. Некоторые биологические расчеты должны длиться в течение длительного времени, например, сращивание большого генома, построение большого филогенетического дерева и т. д., что может занять десятки дней. После отключения электроэнергии потери будут очень большими.
Источник бесперебойного питания ИБП
7. Тестовый сервер и рабочий сервер?
Серверы можно разделить на производственные и тестовые. Так называемые производственные серверы используются для реальной работы, например, для анализа биологических информационных данных. Тестовый сервер, как следует из названия, в основном используется для тестирования. Стабильность производственной среды очень важна, поскольку изменение среды может привести к сбою системы. Например, если обновить glibc, он может оказаться несовместимым со многими программами из-за проблем с версией. Поэтому лучше сначала приобрести тестовый сервер и поработать на нем. Если проблем нет, то запустить его в производственной среде.
В реальном процессе биоинформатики часто встречаются многие проблемы. Например, определенное программное обеспечение зависит от среды. Если оно обрабатывается непосредственно в соответствии с требованиями, оно может повлиять на системную среду, особенно на пользователя root. На данный момент лучше всего найти машину той же версии, что и сервер сборки, и ту же базовую среду для тестирования.
Или, если вы разрабатываете какое-то программное обеспечение, лучше всего делать это и на тестовом сервере. Фактически, основная цель тестового сервера — предоставить среду, в которой можно повозиться. Потому что в системе Linux нелегко установить программное обеспечение и удалить его. Поэтому окружающую среду нелегко нарушить.
В конце написано: Постараемся обновить, когда будет время. Если вы хотите взаимодействовать и общаться, вы можете зайти на форум. Адрес указан ниже. Скопируйте его и зайдите в браузер, чтобы получить к нему доступ. Это компенсирует отсутствие функции сообщения в публичном аккаунте. Исходный адрес еще не активирован (bioinfoer.com).
sx.voiceclouds.cn
Некоторые разделы также можно настроить для обмена ежедневными интересными вещами и т. д. Каждый может вносить предложения.