[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [saigonlug] Re: VietOCR - PMNM nhận dạng ký tự Việt Nam



2011/12/31 nguyenq <[email protected]>:
> Trên ảnh chuẩn (reference image) tạo bởi PS hay GIMP thì Tesseract OCR
> cho kết quả chính xác hơn 97% cho Tiếng Việt. Khi chạy thêm phần hậu

-> Kết quả này là thấp.

> xử lý (post-processing) trong VietOCR, độ chính xác được nâng lên thêm

Điều này hiển nhiên. Không rõ độ chính xác được nâng lên bao nhiêu?

> 1 chút nữa. Khi thử nghiệm với ảnh scan từ 1 trang giấy tốt (rõ ràng,
> không bị tì vết, font Unicode, 300 DPI) thì kết quả cũng rất cao, tuy
> không bằng được như ảnh chuẩn.

Câu hỏi trong email trước của mình: Mình muốn biết con số định lượng,
chứ không phải định tính :).

>
> Dĩ nhiên, mức độ chính xác tùy thuộc nhiều vào chất lượng của ảnh.
> Tesseract chủ yếu là 1 OCR engine, cho nên nếu ảnh kém chất lượng,
> người sử dụng cần thực thi công đoạn image processing trước khi OCR.
> Trong homepage có để thông tin đề cập đến 1 số phần mềm nguồn mở giúp
> ở khâu đó.

Nếu mà cạnh tranh được với các phần mềm thương mại được thì hay nhỉ?
Mình sẽ làm marketing và sales giúp, hehe.

-- 
Best Regards,
Nguyen Hung Vu [aka: NVH] ( in Vietnamese: Nguyễn Vũ Hưng )
[email protected] , YIM: vuhung16 , Skype:
vuhung16plus, twitter: vuhung, MSN: vuhung16.
http://www.facebook.com/nguyenvuhung
http://nguyen-vu-hung.blogspot.com/