[Поделиться] Набор данных о сети высокоскоростных железных дорог:
[Поделиться] Набор данных о сети высокоскоростных железных дорог:

Сегодня я хотел бы порекомендовать вам набор данных: данные о работе поездов по разным направлениям с 2019Год10луна8 по 2020Год1луна27.,Набор данных сети высокоскоростных железных дорог, включающий 727 станций, 3399 поездов и 2751713 эксплуатационных данных.

Для поддержки исследований крупномасштабных сложных сетей, сложных динамических систем и интеллектуального транспорта.,Исследователи разрабатывают набор данных высокоскоростной железнодорожной сети,Содержит данные о движении поездов по разным направлениям с 2019Год10луна8 по 2020Год1луна27.,Задержки поездов, данные железнодорожных станций, данные узловых станций и данные о пробеге соседних станций. в наборе данных,погода、температура、Ветровые условия и крупные праздники считаются факторами, влияющими на работу поездов.

URL-адрес загрузки данных:

Язык кода:javascript
копировать
https://figshare.com/articles/dataset/A_high-speed_railway_network_dataset_from_train_operation_records_and_weather_data/15087882/4

1. Получите блок-схему метода.

Чтобы получить набор данных высокоскоростной железнодорожной сети,Сначала мы собираем записи о работе поездов, информацию о пробеге и географическом положении железнодорожной станции. Собирайте исторические данные о погоде в зависимости от географического местоположения.,Узнайте даты основных праздников с 8-го 10-го года 2019 года по 27-го 1-го года 2020 года. Во-вторых,Рассчитываем станцию ​​прибытия и время задержки отправления поезда.,Посчитайте количество опоздавших поездов в разных направлениях на станции в час. третий,Рассчитайте пробег соседних станций. Четвертое — собрать статистику по работе поездов в первой десятке узлов Китая. 5. В зависимости от географического положения и временной метки.,Сложные факторы, такие как направление поезда, тип станции, погода и праздничные дни, расширяют доступ к данным о работе высокоскоростных железных дорог и данным о задержках на вокзалах. наконец,Мы проверяем и проверяем наш набор данных.

2. Процесс сбора данных

Сбор исходных данных:Записи о работе высокоскоростных поездов состоят из исторических расписаний и фактической информации о работе.。мы используемpython28Метод извлечения веб-страниц из системы продажи пассажирских железнодорожных билетов Китая(https://www.12306.cn)Получил2019Год10луна8Солнцестояние2020Год1луна27Япония-коммунист16Еженедельно3399тренироваться2751713эксплуатационные данные。一тренироваться运行记录包括停靠站、Запланированное время отправления и прибытия、Фактическое время выезда и прибытия приезжать и т.д. картина 2 показана сеть высокоскоростных железных дорог Китая, включающая 727 станций и действующие линии с 3399 поездами.

Сбор данных о пробеге высокоскоростных поездов:По данным учета движения поездов,Мы используем веб-скрапинг, чтобы получить данные о пробеге 3399 поездов с сайта http://www.huchepiao.com. В связи с постоянной корректировкой железнодорожных путей,У нас есть обновления для 2020 Данные Года. Атрибуты, включенные в данные, включают номер поезда, Последовательность станций、Название станции и километраж от станции приезжать. Мы дополнили недостающие данные о пробеге посредством ручного поиска.

Место встречи на вокзале:в соответствии с 3,399 Действующие линии высокоскоростной железной дороги, после удаления дубликатов получим 727 сайты. Названия этих станций уникальны. Затем мы получаем их географическое положение, включая провинцию, город и район. Мы дополнили недостающую информацию о местоположении посредством ручного поиска.
Коллекция узловых станций:в железнодорожной сети,Пересечение нескольких магистральных линий обычно называют железнодорожным узлом.,Он состоит из нескольких станций, межстанционных соединительных линий, входящих линий и сигнальных линий. в наборе данных,Мы рассмотрели десять репрезентативных перекрестков в Китае.

3. Сложность набора данных высокоскоростной железнодорожной сети.

Сложность нашего набора данных о сети высокоскоростных железных дорог отражается в: (1) пространственно-временных характеристиках распределения операций поездов; (2) динамике сети высокоскоростных железных дорог; (3) динамических сообществах сети высокоскоростных железных дорог; факторов внешнего воздействия на работу поездов.

Характеристики пространственно-временного распределения:В качестве примера возьмем общее количество задержек на станции.,Картирование пространственно-временного распределения задержек станций,Как показано на рисунке.
Динамические характеристики:к 2020 Год 1 луна 16 В качестве примера мы нарисовали рисунок Динамическая оперативная сеть в 4. Синяя линия представляет собой нормальную работу железнодорожной линии, а красная линия представляет собой задержку работы железнодорожной линии. от 00:00 приезжать 06:00 Поездов ходит очень мало. Однако в другое время поезда проходят почти через каждую станцию ​​сети. По сравнению с другим временем задержки поездов с 09:00 до 21:00 являются более серьезными, что указывает на то, что сеть задержек поездов также динамична.
Динамические функции сообщества:картина中不同的颜色代表不同的社区。потому что00:00к06:00Очень мало поездов ходит,Через большинство станций поезда не проходят.,Поэтому они разделены на одно сообщество. В зависимости от местоположения станции, изменения маршрутов движения поездов, изменения статуса задержки и т. д.,Меняется и общественная структура железнодорожной сети.

4. Инструкции по записи данных

(1) Набор данных 30 расположен в figshare и доступен в виде 4 отдельных файлов CSV, как описано ниже:

(2) данные о работе высокоскоростных поездов.csv: 3399 данных о работе высокоскоростных поездов с 2019Год10луна8 по 2020Год1луна27.,большие праздники ипогода Сопутствующие факторы влияния。

(3) Данные о задержке на железнодорожном вокзале.csv: 2019Год10луна8th [00:00, 01:00), 2020Год1луна27 число[23:00, 24:00), Количество задержанных поездов на 727 вокзалах, Основные праздники и факторы влияния, связанные с погодой.

(4) Данные о пробеге соседних станций.csv: данные о пробеге соседних станций для 3399 линий движения поездов.

junction station data.csv:2019Год10луна8Солнцестояние2020Год1луна27Десятка лучших в Японии и Китаеданные хаба,Включает общее количество поездов, проходящих через станцию ​​в разных направлениях, и общее количество задержанных поездов.

Вставьте указанный выше URL-адрес загрузки в адресную строку браузера.,Скачать самостоятельно

boy illustration
Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Прочитайте нейросетевую модель Трансформера в одной статье
boy illustration
.ART Теплые зимние предложения уже открыты
boy illustration
Сравнительная таблица описания кодов ошибок Amap
boy illustration
Уведомление о последних правилах Points Mall в декабре 2022 года.
boy illustration
Даже новички могут быстро приступить к работе с легким сервером приложений.
boy illustration
Взгляд на RSAC 2024|Защита конфиденциальности в эпоху больших моделей
boy illustration
Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.
boy illustration
Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)
boy illustration
Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов
boy illustration
[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста
boy illustration
Обзор Cloud-init и этапы создания в рамках PVE
boy illustration
Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)
boy illustration
Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.
boy illustration
Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!
boy illustration
[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !
boy illustration
[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз
boy illustration
Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.
boy illustration
Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?
boy illustration
Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента
boy illustration
Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.
boy illustration
Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)
boy illustration
[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши
boy illustration
Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)
boy illustration
Кодирование Base64 в MultipartFile
boy illustration
5 точек расширения SpringBoot, супер практично!
boy illustration
Глубокое понимание сопоставления индексов Elasticsearch.
boy illustration
15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.
boy illustration
Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.