Sản phẩm

Khách hàng tiêu biểu

Video

Khảo sát ý kiến độc giả

Bạn quan tâm điều gì khi mua sản phẩm công nghệ?

Khác

Chế độ hậu mãi

Dịch vụ

Giá cả

Gửi ý kiến Kết quả

Giải pháp ABBYY FlexiCapture 9.0

ABBYY FlexiCapture 9.0 là giải pháp hoàn chính cho bài toán phân loại tài liệu, nhận dạng và trích xuất dữ liệu. FlexiCapture có thể nhận dạng và trích xuất dữ liệu từ nhiều loại mẫu biểu và tài liệu, kết xuất dữ liệu này tới các file lưu trữ hoặc cơ sở dữ liệu, lưu tài liệu gốc ở các định dạng ảnh, bao gồm cả chuẩn PDF, PDF/A.

 

ABBYY FlexiCapture 9.0

Là giải pháp hoàn chính cho bài toán phân loại tài liệu, nhận dạng và trích xuất dữ liệu. FlexiCapture có thể nhận dạng và trích xuất dữ liệu từ nhiều loại mẫu biểu và tài liệu, kết xuất dữ liệu này tới các file lưu trữ hoặc cơ sở dữ liệu

ABBYY FlexiCapture 9.0

ABBYY FlexiCapture 9.0 là giải pháp hoàn chính cho bài toán phân loại tài liệu, nhận dạng và trích xuất dữ liệu. FlexiCapture có thể nhận dạng và trích xuất dữ liệu từ nhiều loại mẫu biểu và tài liệu, kết xuất dữ liệu này tới các file lưu trữ hoặc cơ sở dữ liệu, lưu tài liệu gốc ở các định dạng ảnh, bao gồm cả chuẩn PDF, PDF/A.

Công nghệ nhận dạng chữ in (Optical Character Recognition - OCR) là công nghệ cho phép chuyển đổi tài liệu dạng ảnh (các ảnh đầu ra của máy quét, máy ảnh, file PDF dạng ảnh…) thành tài liệu có thể biên tập được (file text, file Word…).

Công nghệ nhận dạng chữ in OCR

Hãy tưởng tượng bạn đang có trong tay một số tài liệu giấy như sách, báo, tờ rơi quảng cáo, hợp đồng v..v… máy quét chỉ có thể giúp bạn biến những tài liệu giấy này thành tài liệu dạng ảnh. Với các tài liệu dạng ảnh, bạn chỉ có thể đọc mà không thể biên tập lại chúng trên các hệ soạn thảo điện tử hiện nay; các hệ thống tìm kiếm cũng không thể tìm được các đoạn văn bản trên những tài liệu này.

Với việc sử dụng phần mềm nhận dạng chữ in, bài toán tìm kiếm toàn văn, trích dẫn, biên soạn lại các tài liệu dạng ảnh sẽ được thực hiện rất đơn giản.

Công nghệ nhận dạng đánh dấu OMR

Một số thiết bị nhận dạng đánh dấu truyền thống dựa vào nguyên lý phản xạ ánh sáng (tại các vùng có đánh dấu/tô, ánh sáng sẽ phản xạ yếu hơn các vùng trống khác), với các thiết bị này, yêu cầu về việc đánh dấu, tạo mẫu, cũng như yêu cầu về chất liệu giấy in rất khắt khe.

Ngược với các thiết bị đánh dấu truyền thống, các phần mềm nhận dạng đánh dấu (Optical Mark Recognition - OMR) cho phép người dùng tự tạo các mẫu cũng như in chúng trên các chất liệu giấy thông thường. Phần mềm chỉ cần làm việc với ảnh quét của mẫu sau khi điền.

Về mặt công nghệ, OMR đơn giản hơn rất nhiều so với công nghệ OCR hay ICR. Công nghệ OMR thường được dùng để xử lý dữ liệu từ các phiếu điều tra hay các bài thi trắc nghiệm.

Công nghệ nhận dạng chữ viết tay ICR

Công nghệ nhận dạng chữ viết tay hay còn gọi là công nghệ nhận dạng ký tự thông minh (Intelligent Character Recognition - ICR) là sự phát triển ở mức cao hơn của công nghệ nhận dạng chữ in. Đối tượng nhận dạng của công nghệ ICR không chỉ là chữ in mà còn bao gồm cả chữ viết tay.

Công nghệ nhận dạng chữ viết tay thường được sử dụng trong việc nhận dạng thông tin từ các tài liệu dạng biểu mẫu. Trên các tài liệu dạng này, một số thông tin được điền bằng tay tại các vị trí cố định (tờ khai mở tài khoản ngân hàng, tờ khai hải quan, phiếu đăng ký v..v…).

Công nghệ nhận dạng văn bản ADRT

ADRT (Adaptive Document Recognition Technology) là một bước tiến lớn trong công nghệ nhận dạng tài liệu; là một phần quan trọng và chỉ có trong công nghệ OCR của ABBYY. ADRT được dùng để nhận dạng các cấu trúc logic, cách dàn trang cũng như các định dạng khác nhau trong tài liệu nhiều trang, ví dụ như: mục lục, đầu trang, chân trang, chú thích, chú thích bảng, chú thích ảnh, số trang v..v…

Khi kết quả nhận dạng được lưu dưới dạng Microsoft Word, các định dạng trên được nhìn nhận như những đối tượng tương ứng trong Word chứ không đơn thuần chỉ là các khối văn bản.

Để đạt được tính chính xác trong việc phân tích dàn trang, cấu trúc logic cũng như các định dạng trong tài liệu là do ADRT xem xét và xử lý các tài liệu nhiều trang như là một đối tượng tổng thể chứ không phải là tập hợp các trang riêng biệt. Với công nghệ ADRT, người dùng sẽ không mất, hoặc mất rất ít thời gian cho việc biên tập lại kết quả nhận dạng.

 

Tags: giải phápGiải pháp ABBYY FlexiCapture 9.0

Pin it

Bài viết cùng chủ đề:

Tin mới

Hỗ trợ trực tuyến

Tư vấn giải pháp số hóa tài liệu

Cao Hoàng Anh

ĐT: 04.376 75677 Mobile: 0904 805 255

Đoàn Huy Thuận

ĐT: 04.376 75677 Mobile: 0904 632 189

Tiếp nhận ý kiến khách hàng

Mr Sơn

ĐT: 04.376 75677 (30) Mobile: 0904 777 168

Download tài liệu

Gửi yêu cầu demo Gửi yêu cầu demo

Gửi yêu cầu lấy báo giá Gửi yêu cầu lấy báo giá

Đọc tin RSS

Đăng ký nhận bản tin

Đăng ký