Home » Articole » Articole » Afaceri » Protecţie » Captarea datelor din documente tipărite

Captarea datelor din documente tipărite

postat în: Protecţie 0

carti-scanare

Una dintre cele mai utile aplicaţii ale capturii de date este colectarea de informaţii din documente pe hârtie şi salvarea lor în baze de date (CMS, ECM şi alte sisteme). Există mai multe tipuri de tehnologii de bază utilizate pentru captarea datelor în funcţie de tipul de date:

  • OCR – pentru recunoaşterea textului tipărit
  • ICR – pentru recunoaşterea textului scris manual
  • OMR – pentru recunoaşterea mărcilor
  • OBR – pentru recunoaşterea codurilor de bare
  • BCR – pentru recunoaşterea cărţilor de vizită
  • DLR – pentru recunoaşterea aspectului documentelor

Aceste tehnologii de bază permit extragerea informaţiilor din documentele pe hârtie pentru o prelucrare ulterioară în sistemele de informaţii de întreprindere, cum ar fi ERP, CRM şi altele.

Documentele de captare de date pot fi împărţite în 3 grupe: structurate, semi-structurate şi nestructurate.

Documentele structurate de acelaşi tip (chestionare, teste, formulare de asigurare, declaraţiilor fiscale, buletine de vot, etc) au toate aceeaşi structură şi aspect. Acesta este cel mai simplu model pentru captura de date, deoarece fiecare câmp de date se află în acelaşi loc pentru toate documentele.

Documentele semi-structurate (facturi, ordine de cumpărare, suprapunere, etc) au aceeasi structura, dar apariţia lor depinde de numărul de elemente şi de alţi parametri. Capturarea datele din aceste documente este o sarcină complexă, dar rezolvabilă.

Documente nestructurate (scrisori, contracte, articole, etc) au structura flexibilă, în funcţie de structură şi aspect.

Cele mai cunoscute tipuri de aplicaţii

ABBYY

Tehnologii de bază: OCR (195 limbi), ICR (113 limbi, OMR, OBR, BCR

Aplicaţie captură date: ABBYY FlexiCapture este un software inteligent de captură date şi documente prelucrarează automat orice tip de documente şi formulare structurate, semi-structurate şi nestructurate

SDK captură date: ABBYY FlexiCapture Engine este un SDK pentru captură de date şi de de documente pentru orice tip de documente şi formulare structurate, semi-structurate şi nestructurate

Accusoft

Tehnologii de bază: OCR (118 limbi), ICR (11 limbi), OMR, OBR

SDK captură date:

  • ImageGear for. NET este un SDK care oferă cod complet administrat pentru dezvoltare de aplicaţii WinForms, ASP.NET, şi WPF. Componenta de recunoaştere opţional permite un set OCR complet integrat.
  • FormSuite, disponibil pentru. NET sau ActiveX, este un SDK pentru prelucrare formulare structurate conceput să prelucreze formulare de la scanare până la recunoaştere. Se poate, de asemenea, adăuga crearea şi recunoaşterea codurilor de bare.

AnyDoc Software

Tehnologii de bază: OCR (4 limbi), ICR, OMR, OBR

Aplicaţie captură date: OCR for AnyDoc automatizează captura de date din toate documentele de afaceri, inclusiv documente structurate, semi-structurate, şi nestructurate prin incorporarea tehnologueu AnyApp pentru procesarea fără şablon.

Cvision Technologies

Tehnologii de bază: OCR (60 limbi, ICR (60 limbi), OMR, OBR

Aplicaţie captură date: Cvision”s Trapeze este un software inteligent capabil să recunoască şi să captureze texte din documente structurate, semi-structurate, şi nestructurate inclusiv formulare, facturi, şi EOB

SDK captură date: Cvision”s Trapeze”s SDK capturează date din documentele structurate, semi-structurate, şi nestructurate, inclusiv formulare, facturi, şi EOB

Expervision

Tehnologii de bază: OCR (18 limbi, ICR (18 limbi), OMR, OBR, BCR

Aplicaţie captură date: Expervision TypeReader poate procesa automat textele complete ale unor documente. În condiţiile unei identificări cu acurateţe, viteza de procesare poate depăşi 100 pagini pe minut.

SDK captură date: Expervision OpenRTK Engine este un SDK pentru captura inteligentă de date şi prelucrarea documentelor. Are funcţia de suport lingvistic flexibil, în teorie, poate suporta orice limbă suplimentară şi învăţa să se adapteze la fonturi diferite în funcţie de solicitarea personalizată. Suportă definiţie API personalizată şi dezvoltare.

I.R.I.S. Group

Tehnologii de bază: OCR (120 limbi), ICR (limbi latine), OMR, OBR, BCR

Aplicaţie captură date:

  • IRISCapture for Invoices – soluţie pentru procesarea facturilor
  • IRISCapture Pro for Forms este un set de software inteligent care captează automat, sortează şi identifică toate tipurile de documente şi formulare

LEADTOOLS

Tehnologii de bază: OCR (118 limbi), ICR (15 limbi), OMR, OBR, BCR

SDK captură date: Modulul LEADTOOLS Forms Recognition este un SDK .NET, care exploatează puterea tehnologiei LEAD de procesare a imaginii pentru a identifica inteligent componente de formulare şi caracteristici care pot fi utilizate pentru a recunoaşte formulare structurate

Nuance Communications

Tehnologii de bază: OCR (120 limbi), ICR, OMR, OBR, BCR

Aplicaţie captură date: OmniPage Professional 17 uşurează prelucrarea formularelor structurate de la început până la final. Poţi converti formularele pe hârtie în formulare electronice şi apoi să colectezi datele.

SDK captură date: OmniPage Capture SDK for Windows cu tehnologia sa avansată Logical Form Recognition (LFR) automatizează crearea şabloanelor pentru formulare şi procesarea formularelor structurate.

PSIGEN Software

Tehnologii de bază: OCR (99 limbi, ICR, OMR, OBR, BCR (1D şi 2D)

Aplicaţie captură date: PSI: Capture este o soluţie de captură completă, care include toate funcţionalităţile necesare pentru a procesa în mod automat toate documentele structurate şi semi-structurate, inclusiv facturi, formulare şi emailuri generale. Unul dintre punctele sale cheie este de interfaţă dinamică de neegalat la SharePoint.

Traducere şi adaptare din Wikipedia sub licenţă gratuită GNU.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *