Loading

Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

Thảo luận trong 'Phần mềm Văn phòng, Kinh tế' bắt đầu bởi Uploadervn, 15/12/11.

  1. Uploadervn

    Uploadervn Banned

    Tham gia:
    15/12/11
    Bài viết:
    7
    Đã được thích:
    0
    Trước đây có máy scan cứ phải mua phần mềm Vietdoc của Viện Công nghệ thông tin với giá khoảng 8 tr/bản. Đắt mà chất lượng bình thường.Mới tìm được phần mềm vietocr sử dụng mã nguồn mở, xác xuất nhận dạng đúng hiện nay là 97% và phiên bản sau sẽ nâng lên hơn nữa.VietOCR, hiện có trong Java and .NET executable, là một GUI frontend cho Tesseract OCR engine. Cả hai phiên bản đều có giao diện tương tự và có cùng khả năng nhận diện ký tự từ các loại dạng ảnh phổ thông. Chương trình còn có khả năng vận hành như một ứng dụng console, thi hành lệnh từ command line.Batch processing cũng được hỗ trợ. Chương trình theo dõi một watch folder cho các tập tin ảnh mới, tự động xử lý chúng qua OCR engine, và xuất kết quả nhận dạng ra một output folder.Language data cho Việt ngữ và Anh ngữ đã được gói kèm với chương trình. Data cho các ngôn ngữ khác có thể hạ tải từ Tesseract website và cần đặt vào tessdata folder.[​IMG]Chương trình chạy tốt trên win 7 64 bit, lưu ý là khi scan nên để độ phân giải của máy từ 200 trở lên



    Link download


Chia sẻ trang này

Bảo vệ | Viện dân số và các vấn đề xã hội | Học Toeic | Học Toeic ở đâu tốt | Game Bigone Online | sach luyen thi toeic | ngôi sao