Всем привет, мы снова встретились, я ваш друг Цюаньчжаньцзюнь.
В последнее время я не обращал особого внимания на сайт Atlas Valley, но сегодня открыл его, чтобы проверить. Оказалось, что официальный сервис закрыли напрямую, остался только сайт Atlas Island, требующий оплаты.
Я испытываю облегчение, когда вижу, что кто-то оставляет сообщение под моей статьей, а это значит, что мое писательское направление имеет определенную аудиторию. [Я чувствую такое облегчение]
Ладно, короче говоря. Поскольку Атласской долины больше нет, я нашел новый веб-сайт, на котором каждый может учиться — Showman Collection.
Сайт Сюренджи: www.xiurenb.com.
Ниже приведен соответствующий код для справки и изучения [плохой смех]
# Импортировать библиотеку
import time, os, requests
from lxml import etree
# Определить заголовки запроса
headers = {
'User-Agent':'Chrome 10.1'
}
# Форматированный список
img_list = []
url_list = []
# Входящие данные
Page_Num = input('Enter the Organization and Page_Num:')
# с URL = «https://www.xiurenb.com/MyGirl/6149» — это пример. Здесь необходимо передать данные «MyGirl/6149».
# Получите URL-адрес каждой страницы фотоальбома и впишите его в список.
url = 'https://www.xiurenb.com/' + str(Page_Num)
Num_res = requests.get(url=url + '.html', headers=headers)
Num_tree = etree.HTML(Num_res.text)
Num = len(Num_tree.xpath('/html/body/div[3]/div/div/div[4]/div/div/a'))
url_list.append(url)
for i in range(1, int(Num) - 2):
url_other = url + '_' + str(i)
url_list.append(url_other)
# Получите URL-адрес каждого изображения и запишите его в список.
for url in url_list:
res = requests.get(url=url + '.html',headers=headers)
tree = etree.HTML(res.text)
img_src = tree.xpath('/html/body/div[3]/div/div/div[5]/p/img/@src')
for img in img_src:
img_list.append(img)
time.sleep(0.5)
# Создайте каталог для сохранения изображений
res = requests.get(url=url_list[0] + '.html',headers=headers)
res.encoding = 'utf-8'
tree = etree.HTML(res.text)
path_name = tree.xpath('/html/body/div[3]/div/div/div[1]/h1//text()')[0][11:]
print(path_name)
the_path_name = 'C:/Users/liu/Pictures/' + path_name
if not os.path.exists(the_path_name):
os.mkdir(the_path_name)
# Получите изображение и сохраните его в указанном каталоге.
num = 0
for j in img_list:
img_url = 'https://www.xiurenb.com' + j
img_data = requests.get(url=img_url, headers=headers).content
img_name = img_url.split('/')[-1]
finish_num = str(num) + '/' + str(len(img_list))
with open('C:/Users/liu/Pictures/' + path_name + '/' + img_name, 'wb') as f:
print(f'Downloading the img:{img_name} {finish_num}')
f.write(img_data)
f.close()
num += 1
time.sleep(0.5)
# Подсказка об успешной операции
print('Finished!')
Это только первая версия кода этого веб-сайта, и есть еще некоторые области, требующие улучшения. Например, вам нужно самостоятельно просмотреть URL-адрес, чтобы передать данные: вы можете одновременно получить все фотографии только одного фотоальбома...
В дальнейшем я буду время от времени его оптимизировать и улучшать, чтобы вы могли обратить на него внимание.
Комментарии, лайки и коллекции являются мотивацией для моего написания. Надеюсь, вы меня очень поддержите.
Издатель: Full stack программист и руководитель стека, укажите источник для перепечатки: https://javaforall.cn/158683.html Исходная ссылка: https://javaforall.cn