Una dintre cele mai utile aplicaţii ale capturii de date este colectarea de informaţii din documente pe hârtie şi salvarea lor în baze de date (CMS, ECM şi alte sisteme). Există mai multe tipuri de tehnologii de bază utilizate pentru captarea datelor în funcţie de tipul de date:
- OCR – pentru recunoaşterea textului tipărit
- ICR – pentru recunoaşterea textului scris manual
- OMR – pentru recunoaşterea mărcilor
- OBR – pentru recunoaşterea codurilor de bare
- BCR – pentru recunoaşterea cărţilor de vizită
- DLR – pentru recunoaşterea aspectului documentelor
Aceste tehnologii de bază permit extragerea informaţiilor din documentele pe hârtie pentru o prelucrare ulterioară în sistemele de informaţii de întreprindere, cum ar fi ERP, CRM şi altele.
Documentele de captare de date pot fi împărţite în 3 grupe: structurate, semi-structurate şi nestructurate.
Documentele structurate de acelaşi tip (chestionare, teste, formulare de asigurare, declaraţiilor fiscale, buletine de vot, etc) au toate aceeaşi structură şi aspect. Acesta este cel mai simplu model pentru captura de date, deoarece fiecare câmp de date se află în acelaşi loc pentru toate documentele.
Documentele semi-structurate (facturi, ordine de cumpărare, suprapunere, etc) au aceeasi structura, dar apariţia lor depinde de numărul de elemente şi de alţi parametri. Capturarea datele din aceste documente este o sarcină complexă, dar rezolvabilă.
Documente nestructurate (scrisori, contracte, articole, etc) au structura flexibilă, în funcţie de structură şi aspect.
Cele mai cunoscute tipuri de aplicaţii
ABBYY
Tehnologii de bază: OCR (195 limbi), ICR (113 limbi, OMR, OBR, BCR
Aplicaţie captură date: ABBYY FlexiCapture este un software inteligent de captură date şi documente prelucrarează automat orice tip de documente şi formulare structurate, semi-structurate şi nestructurate
SDK captură date: ABBYY FlexiCapture Engine este un SDK pentru captură de date şi de de documente pentru orice tip de documente şi formulare structurate, semi-structurate şi nestructurate
Accusoft
Tehnologii de bază: OCR (118 limbi), ICR (11 limbi), OMR, OBR
SDK captură date:
- ImageGear for. NET este un SDK care oferă cod complet administrat pentru dezvoltare de aplicaţii WinForms, ASP.NET, şi WPF. Componenta de recunoaştere opţional permite un set OCR complet integrat.
- FormSuite, disponibil pentru. NET sau ActiveX, este un SDK pentru prelucrare formulare structurate conceput să prelucreze formulare de la scanare până la recunoaştere. Se poate, de asemenea, adăuga crearea şi recunoaşterea codurilor de bare.
AnyDoc Software
Tehnologii de bază: OCR (4 limbi), ICR, OMR, OBR
Aplicaţie captură date: OCR for AnyDoc automatizează captura de date din toate documentele de afaceri, inclusiv documente structurate, semi-structurate, şi nestructurate prin incorporarea tehnologueu AnyApp pentru procesarea fără şablon.
Cvision Technologies
Tehnologii de bază: OCR (60 limbi, ICR (60 limbi), OMR, OBR
Aplicaţie captură date: Cvision”s Trapeze este un software inteligent capabil să recunoască şi să captureze texte din documente structurate, semi-structurate, şi nestructurate inclusiv formulare, facturi, şi EOB
SDK captură date: Cvision”s Trapeze”s SDK capturează date din documentele structurate, semi-structurate, şi nestructurate, inclusiv formulare, facturi, şi EOB
Expervision
Tehnologii de bază: OCR (18 limbi, ICR (18 limbi), OMR, OBR, BCR
Aplicaţie captură date: Expervision TypeReader poate procesa automat textele complete ale unor documente. În condiţiile unei identificări cu acurateţe, viteza de procesare poate depăşi 100 pagini pe minut.
SDK captură date: Expervision OpenRTK Engine este un SDK pentru captura inteligentă de date şi prelucrarea documentelor. Are funcţia de suport lingvistic flexibil, în teorie, poate suporta orice limbă suplimentară şi învăţa să se adapteze la fonturi diferite în funcţie de solicitarea personalizată. Suportă definiţie API personalizată şi dezvoltare.
I.R.I.S. Group
Tehnologii de bază: OCR (120 limbi), ICR (limbi latine), OMR, OBR, BCR
Aplicaţie captură date:
- IRISCapture for Invoices – soluţie pentru procesarea facturilor
- IRISCapture Pro for Forms este un set de software inteligent care captează automat, sortează şi identifică toate tipurile de documente şi formulare
LEADTOOLS
Tehnologii de bază: OCR (118 limbi), ICR (15 limbi), OMR, OBR, BCR
SDK captură date: Modulul LEADTOOLS Forms Recognition este un SDK .NET, care exploatează puterea tehnologiei LEAD de procesare a imaginii pentru a identifica inteligent componente de formulare şi caracteristici care pot fi utilizate pentru a recunoaşte formulare structurate
Nuance Communications
Tehnologii de bază: OCR (120 limbi), ICR, OMR, OBR, BCR
Aplicaţie captură date: OmniPage Professional 17 uşurează prelucrarea formularelor structurate de la început până la final. Poţi converti formularele pe hârtie în formulare electronice şi apoi să colectezi datele.
SDK captură date: OmniPage Capture SDK for Windows cu tehnologia sa avansată Logical Form Recognition (LFR) automatizează crearea şabloanelor pentru formulare şi procesarea formularelor structurate.
PSIGEN Software
Tehnologii de bază: OCR (99 limbi, ICR, OMR, OBR, BCR (1D şi 2D)
Aplicaţie captură date: PSI: Capture este o soluţie de captură completă, care include toate funcţionalităţile necesare pentru a procesa în mod automat toate documentele structurate şi semi-structurate, inclusiv facturi, formulare şi emailuri generale. Unul dintre punctele sale cheie este de interfaţă dinamică de neegalat la SharePoint.
Traducere şi adaptare din Wikipedia sub licenţă gratuită GNU.
Lasă un răspuns