OCR (оптическое распознавание символов) — это технология, используемая для преобразования печатного или рукописного текста в редактируемые и доступные для поиска электронные документы. Он анализирует формы и структуры символов на изображениях и преобразует их в машиночитаемые текстовые данные. Технология оптического распознавания символов играет важную роль во многих областях, включая управление документами, автоматизированный офис, оцифровку библиотек, распознавание номерных знаков и т. д.
Для извлечения текста OCR ранее также был представлен Umi-OCR. Этот инструмент, и то, чем мы собираемся поделиться сегодня, в основном представляет собой инструмент с открытым исходным кодом, используемый для решения проблем, связанных с кодами проверки. ддддокр адрес проекта автора на github следующий:https://github.com/sml2h3/ddddocr?tab=readme-ov-file
Когда мы выполняем некоторые ежедневные операции, связанные с автоматическим тестированием, нам иногда необходимо вводить коды проверки. Сейчас на рынке представлено множество типов кодов проверки. Основные из них следующие:
pip install ddddocr
Подождите установки и затем используйте его.。
Ниже приведен пример использования:import ddddocr
ocr = ddddocr.DdddOcr()
#Путь к изображению
with open("img.png", 'rb') as f:
image = f.read()
res = ocr.classification(image)
print(res)
2. Обнаружение цели. Подходит для щелчков по тексту и значков. Проще говоря, для кодов подтверждения, вводимых щелчком мыши, текст или значки на изображении могут быть быстро обнаружены.
import ddddocr
import cv2
det = ddddocr.DdddOcr(det=True)
with open("test.jpg", 'rb') as f:
image = f.read()
poses = det.detection(image)
print(poses)
im = cv2.imread("test.jpg")
for box in poses:
x1, y1, x2, y2 = box
im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)
cv2.imwrite("result.jpg", im)
Творить непросто. Если вы считаете, что эта статья вам полезна, поставьте мне лайк. Это будет моей мотивацией продолжать делиться высококачественным контентом.