Распознавание текста на экране Python_python распознает текст изображения
Распознавание текста на экране Python_python распознает текст изображения

Всем привет, мы снова встретились, я ваш друг Цюаньчжаньцзюнь.

Потому что школа требует, чтобы вы прошли онлайн-курс под названием «Мир упаковки», и в курсе более 200 вопросов с несколькими вариантами ответов, и их можно выполнить только на мобильных телефонах. На вопросы нельзя ответить в веб-версии. невозможно смотреть видео. Это невозможно прочитать в моей жизни... поэтому я написал несколько строк кода для поиска ответов на Baidu.

Идея заключается в следующем:

Спроецируйте экран мобильного телефона на компьютер;

Делайте снимки экрана и распознавайте текст изображения;

Позвоните в Baidu для поиска;

Извлеките ключевые слова HTML.

Конфигурация среды:python3.6、Сторонняя библиотека: pyautogui.、PIL、pytesseract、Механизм распознавания tesseract-ocr

Чтобы распознать китайский язык, механизму ocr необходимо загрузить китайский пакет chi_sim и поместить его в Tesseract-OCR\tessdata. После установки ocr вам необходимо настроить путь вызова. Найдите pytesseract.py в Python36\Lib\site-packages\pytesseract (это мой путь в Windows), откройте его и добавьте путь:

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

2 tesseract_cmd = ‘tesseract’

3 tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe’

4 img_mode = ‘RGB’

Затем используйте AirDroid, Vysor, 360 Mobile Assistant и т. д., чтобы спроецировать экран телефона на компьютер, и с помощью мыши определите координаты скриншота. Код следующий:

1 importpyautogui as pag

2 x,y =pag.position()

3 posStr = “position:”+str(x).rjust(4)+’,’+str(y).rjust(4)

4 print(posStr)

Чтобы получить две координаты (начальную координату и конечную координату снимка экрана), затем используйте полученные координаты, чтобы использовать следующий код для создания снимка экрана и вызвать механизм OCR для распознавания (распознанные слова разделяются пробелами, поэтому пробелы в строке необходимо удалить) , код следующий:

1 from PIL importImage2 from PIL importImageGrab3 importpytesseract4 importwebbrowser5

6 pos = (0,245,425, 327)7 Cut_img =ImageGrab.grab(pos)8 Cut_img.save('C:/imgSave/1.jpg') #Сохраняем скриншот в папку

9 print(“screenshots sucess”)10

11 text=pytesseract.image_to_string(Image.open('C:/imgSave/1.jpg'),lang='chi_sim') #Вызов механизма распознавания для распознавания

12 text=text.replace(» «,») #Удалить пробелы 13 print(text)14 url ​​= ‘http://www.baidu.com/s?wd=%s’ % text #Вызов поиска Baidu

15 webbrowser.open(url)

В конце концов, все результаты поиска представляли собой банки вопросов, поэтому я не стал извлекать ключевые слова в формате HTML, мне было на самом деле лениво.

Издатель: Лидер стека программистов полного стека, укажите источник для перепечатки: https://javaforall.cn/134513.html Оригинальная ссылка: https://javaforall.cn

boy illustration
RasaGpt — платформа чат-ботов на основе Rasa и LLM.
boy illustration
Nomic Embed: воспроизводимая модель внедрения SOTA с открытым исходным кодом.
boy illustration
Улучшение YOLOv8: EMA основана на эффективном многомасштабном внимании, основанном на межпространственном обучении, и эффект лучше, чем у ECA, CBAM и CA. Малые цели имеют очевидные преимущества | ICASSP2023
boy illustration
Урок 1 серии Libtorch: Тензорная библиотека Silky C++
boy illustration
Руководство по локальному развертыванию Stable Diffusion: подробные шаги и анализ распространенных проблем
boy illustration
Полностью автоматический инструмент для работы с видео в один клик: VideoLingo
boy illustration
Улучшения оптимизации RT-DETR: облегченные улучшения магистрали | Support Paddle облегченный rtdetr-r18, rtdetr-r34, rtdetr-r50, rtdet
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | Деформируемое внимание с большим ядром (D-LKA Attention), большое ядро ​​​​свертки улучшает механизм внимания восприимчивых полей с различными функциями
boy illustration
Создано Datawhale: выпущено «Руководство по тонкой настройке развертывания большой модели GLM-4»!
boy illustration
7B превышает десятки миллиардов, aiXcoder-7B с открытым исходным кодом Пекинского университета — это самая мощная модель большого кода, лучший выбор для корпоративного развертывания.
boy illustration
Используйте модель Huggingface, чтобы заменить интерфейс внедрения OpenAI в китайской среде.
boy illustration
Оригинальные улучшения YOLOv8: несколько новых улучшений | Сохранение исходной информации — алгоритм отделяемой по глубине свертки (MDSConv) |
boy illustration
Второй пилот облачной разработки | Быстро поиграйте со средствами разработки на базе искусственного интеллекта
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция с нулевым кодированием и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
Решенная Ошибка | Загрузка PyTorch медленная: TimeoutError: [Errno 110] При загрузке факела истекло время ожидания — Cat Head Tiger
boy illustration
Brother OCR, библиотека с открытым исходным кодом для Python, которая распознает коды проверки.
boy illustration
Новейшее подробное руководство по загрузке и использованию последней демонстрационной версии набора данных COCO.
boy illustration
Выпущен отчет о крупной модели финансовой отрасли за 2023 год | Полный текст включен в загрузку |
boy illustration
Обычные компьютеры также могут работать с большими моделями, и вы можете получить личного помощника с искусственным интеллектом за три шага | Руководство для начинающих по локальному развертыванию LLaMA-3
boy illustration
Одной статьи достаточно для анализа фактора транскрипции SCENIC на Python (4)
boy illustration
Бросая вызов ограничениям производительности небольших видеокарт, он научит вас запускать большие модели глубокого обучения с ограниченными ресурсами, а также предоставит полное руководство по оценке и эффективному использованию памяти графического процессора!
boy illustration
Команда Fudan NLP опубликовала 80-страничный обзор крупномасштабных модельных агентов, в котором в одной статье представлен обзор текущего состояния и будущего агентов ИИ.
boy illustration
[Эксклюзив] Вы должны знать о новой функции JetBrains 2024.1 «Полнострочное завершение кода», чтобы решить вашу путаницу!
boy illustration
Краткое изложение базовых знаний о регистрации изображений 1.0
boy illustration
Новейшее подробное руководство по установке и использованию библиотеки cv2 (OpenCV, opencv-python) в Python.
boy illustration
Легко создайте локальную базу знаний для крупных моделей на основе Ollama+AnythingLLM.
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание решения. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Одна статья поможет вам понять RAG (Retrival Enhanced Generation) | Введение в концепцию и теорию + практику работы с кодом (включая исходный код).
boy illustration
Эволюция архитектуры шлюза облачной разработки
boy illustration
Docker и Kubernetes [Разработка контейнерных приложений с помощью Python]