KNearest 및 SVM 알고리즘을 사용하여 OpenCV-Python에서 기본 숫자 인식 OCR 시스템을 어떻게 구현할 수 있습니까?
OpenCV-Python의 간단한 숫자 인식 OCR
소개
이 글은 OpenCV-Python을 사용하여 기본적인 숫자 인식 OCR(광학 문자 인식) 시스템을 구현합니다. 두 가지 인기 있는 기계 학습 알고리즘인 KNearest와 SVM을 살펴보겠습니다.
질문 1: Letter_recognition.data 파일
Letter_recognition.data는 OpenCV-Python에 포함된 데이터 세트입니다. 샘플. 여기에는 각 문자에 대한 16개의 기능 값과 함께 손으로 쓴 문자 모음이 포함되어 있습니다. 이 파일은 다양한 문자 인식 작업을 위한 훈련 데이터로 사용됩니다.
자신만의 Letter_recognition.data 구축:
다음 단계에 따라 자신만의 letter_recognition.data 파일을 생성할 수 있습니다. :
- 각 문자가 10x10 픽셀 이미지로 표시되는 문자 데이터세트를 준비합니다.
- 각 이미지에서 픽셀 값을 추출하여 100개 값의 특징 벡터를 형성합니다.
- 각 문자에 레이블(0-25, A-Z에 해당)을 수동으로 할당합니다.
- 특징 벡터와 레이블을 텍스트 파일에 저장하고 각 행은
질문 2: KNearest의 results.ravel()
results.ravel( )는 인식된 숫자 배열을 다차원 배열에서 평면 1D 배열로 변환합니다. 이렇게 하면 결과를 더 쉽게 해석하고 표시할 수 있습니다.
질문 3: 간단한 숫자 인식 도구
letter_recognition.data를 사용하여 간단한 숫자 인식 도구를 만들려면 다음을 따르세요. 단계:
데이터 준비:
- 사용자 정의 letter_recognition.data 파일을 로드하거나 OpenCV의 샘플을 사용하세요.
훈련:
- KNearest 또는 SVM 분류기 인스턴스를 생성합니다.
- letter_recognition.data의 샘플과 응답을 사용하여 분류기를 훈련합니다.
테스트:
- 인식할 숫자가 포함된 이미지를 로드합니다.
- 이미지를 전처리하여 개별 숫자를 분리합니다.
- 각 숫자를 변환합니다. 숫자를 특징 벡터(100픽셀 값)로 변환합니다.
- 훈련된 분류기를 사용하여 각 특징 벡터에 가장 가까운 일치 항목을 찾고 해당 숫자를 표시합니다.
예제 코드 :
import numpy as np import cv2 # Load data samples = np.loadtxt('my_letter_recognition.data', np.float32, delimiter=',', converters={ 0 : lambda ch : ord(ch)-ord('A') }) responses = a[:,0] # Create classifier model = cv2.KNearest() model.train(samples, responses) # Load test image test_img = cv2.imread('test_digits.png') # Preprocess image gray = cv2.cvtColor(test_img, cv2.COLOR_BGR2GRAY) thresh = cv2.adaptiveThreshold(gray, 255, 1, 1, 11, 2) # Extract digits contours, hierarchy = cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE) digits = [] for cnt in contours: if cv2.contourArea(cnt) > 50: [x, y, w, h] = cv2.boundingRect(cnt) roi = thresh[y:y+h, x:x+w] roismall = cv2.resize(roi, (10, 10)) digits.append(roismall) # Recognize digits results = [] for digit in digits: roismall = roismall.reshape((1, 100)) roismall = np.float32(roismall) _, results, _, _ = model.find_nearest(roismall, k=1) results = results.ravel() results = [chr(int(res) + ord('A')) for res in results] # Display results output = cv2.cvtColor(test_img, cv2.COLOR_BGR2RGB) for (digit, (x, y, w, h)) in zip(results, contours): cv2.rectangle(output, (x, y), (x + w, y + h), (0, 255, 0), 2) cv2.putText(output, str(digit), (x, y), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2) cv2.imshow('Output', output) cv2.waitKey(0)
이 예제에서는 숫자 인식에 KNearest를 사용하지만 대신 SVM 분류자를 생성하여 이를 SVM으로 대체할 수 있습니다.
위 내용은 KNearest 및 SVM 알고리즘을 사용하여 OpenCV-Python에서 기본 숫자 인식 OCR 시스템을 어떻게 구현할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

Python은 게임 및 GUI 개발에서 탁월합니다. 1) 게임 개발은 Pygame을 사용하여 드로잉, 오디오 및 기타 기능을 제공하며 2D 게임을 만드는 데 적합합니다. 2) GUI 개발은 Tkinter 또는 PYQT를 선택할 수 있습니다. Tkinter는 간단하고 사용하기 쉽고 PYQT는 풍부한 기능을 가지고 있으며 전문 개발에 적합합니다.

Python은 배우고 사용하기 쉽고 C는 더 강력하지만 복잡합니다. 1. Python Syntax는 간결하며 초보자에게 적합합니다. 동적 타이핑 및 자동 메모리 관리를 사용하면 사용하기 쉽지만 런타임 오류가 발생할 수 있습니다. 2.C는 고성능 응용 프로그램에 적합한 저수준 제어 및 고급 기능을 제공하지만 학습 임계 값이 높고 수동 메모리 및 유형 안전 관리가 필요합니다.

제한된 시간에 Python 학습 효율을 극대화하려면 Python의 DateTime, Time 및 Schedule 모듈을 사용할 수 있습니다. 1. DateTime 모듈은 학습 시간을 기록하고 계획하는 데 사용됩니다. 2. 시간 모듈은 학습과 휴식 시간을 설정하는 데 도움이됩니다. 3. 일정 모듈은 주간 학습 작업을 자동으로 배열합니다.

Python은 개발 효율에서 C보다 낫지 만 C는 실행 성능이 높습니다. 1. Python의 간결한 구문 및 풍부한 라이브러리는 개발 효율성을 향상시킵니다. 2.C의 컴파일 유형 특성 및 하드웨어 제어는 실행 성능을 향상시킵니다. 선택할 때는 프로젝트 요구에 따라 개발 속도 및 실행 효율성을 평가해야합니다.

파이썬은 자동화, 스크립팅 및 작업 관리가 탁월합니다. 1) 자동화 : 파일 백업은 OS 및 Shutil과 같은 표준 라이브러리를 통해 실현됩니다. 2) 스크립트 쓰기 : PSUTIL 라이브러리를 사용하여 시스템 리소스를 모니터링합니다. 3) 작업 관리 : 일정 라이브러리를 사용하여 작업을 예약하십시오. Python의 사용 편의성과 풍부한 라이브러리 지원으로 인해 이러한 영역에서 선호하는 도구가됩니다.

Pythonlistsarepartoftsandardlardlibrary, whileraysarenot.listsarebuilt-in, 다재다능하고, 수집 할 수있는 반면, arraysarreprovidedByTearRaymoduledlesscommonlyusedDuetolimitedFunctionality.

하루에 2 시간 동안 파이썬을 배우는 것으로 충분합니까? 목표와 학습 방법에 따라 다릅니다. 1) 명확한 학습 계획을 개발, 2) 적절한 학습 자원 및 방법을 선택하고 3) 실습 연습 및 검토 및 통합 연습 및 검토 및 통합,이 기간 동안 Python의 기본 지식과 고급 기능을 점차적으로 마스터 할 수 있습니다.
