DOKuStar

DOKuStar

DOKuStar tilbyr

  • Utmerket karakter gjenkjenning basert på en svært anerkjent tolkingsmotor
  • Databehandling av komplekse tabell strukturer, selv der overskrifter mangler og med forstyrrende bakgrunn
  • Utmerket pris/ytelse forhold gjennom skalerbar produktmiks
  • DOKuStar Design Studio: Templates for å spesifisere egenskaper som skal benyttes for klassifisering og for å bestemme struktur på felt som skal være gjenstand for tolking (tabeller, formularer, adressefelt med mer)
  • Output i XML format som tillater analyse ved hjelp av enhver applikasjon som benytter standard verktøy
  • Brukervennlig og veldokumentert grensesnitt inkludert applikasjonseksempler
  • Veiledning med gode instruksjoner
  • Godt kvalifisert personell ved opplæring, installasjon, integrasjon og support

Generell produktbeskrivelse

DOKuStar klassifiserer og tolker informasjon på papir- og elektroniske dokumenter raskt og effektivt. De tolkete data kan deretter benyttes i applikasjoner for databehandling, dokumentbehandling, arbeidsflyt og arkivering.
 
Et typisk system skanner innkommende dokumenter og benytter programvare for karakter gjenkjenning (OCR). Relevant informasjon for klassifisering, indeksering og tolkning blir gjenkjent, deretter overført til neste applikasjon, som for eksempel et regnskaps- eller saksbehandlingssystem.
 
DOKuStar klassifiserer skannede dokumenter iht. papirformat, nøkkelord (som logisk linkes sammen og fraser) og geometriske strukturer (som for eksempel posisjon på nøkkelord i et dokument). Annen relevant informasjon som benyttes i prosessen er bl.a. kontrast, forstyrrende bakgrunn, utskrifts- og papir kvalitet, samt farge.
 
Ulike dokument behandlingssystemer har behov for ulike data, avhengig av den prosess de støtter. Spesielle krav stilles dersom automatisering er ønskelig.
 
Eksempel: For å sortere dokument typene fra hverandre vil DOKuStar gjenkjenne "Faktura" som en dokument type forskjellig fra "Pakkseddel". Den videre fakturabehandlingen krever deretter en automatisk tolking av fakturainformasjon som fakturanummer, fakturadato, beløp og annet. Dokumentet "Pakkseddel" setter andre krav. DOKuStar vil sortere dokumentene automatisk og deretter gjøre datauttrekk nødvendig for den enkelte dokument type.
 
Et system som skal automatisere prosessen knyttet til klassifisering, indeksering og tolking av dokumenter krever høy grad av nøyaktighet, fleksibilitet, hastighet og åpenhet for integrasjon mot andre kjernesystemer. DOKuStar er en programvare som møter alle disse krav.

Tolking av fakturainformasjon - En global profil

DOKuStar benytter seg i utgangspunktet av én global profil for tolking av fakturainformasjon. Den globale profilen er bygget opp av kjente nøkkelord, norske
og utenlandske, og avarter av disse (fraser), som bygges inn i en ordliste. Det bygges mer "intelligens" i systemet ved at ordlisten tilføyes nye nøkkelord og fraser når man møter disse. I tillegg til dette benyttes geometriske strukturer for å øke hastighet og treffsikkerhet ved tolking. Dette innebærer en svært lav terskel for implementering og igangkjøring av systemet.
 
I praksis kan man starte skanning og tolking i det øyeblikket DOKuStar med Startkit er installert. Mengden leverandører er erfaringsmessig stor, og uten en global profil vil det kreve relativt store ressurser før systemet kan driftsettes.
 
I tillegg innebærer den globale tolkingen at systemet er svært enkelt å vedlikeholde idet alle leverandører omfattes av samme profil. Dersom systemet ikke tolker et felt, så legges dette inn av operatør og behandlingsprosessen kan fortsette uten stopp. I ettertid kan man gjøre forbedringer ved å legge til nye nøkkelord og fraser i ordlisten, eller tilpasse de geometriske strukturene uavhengig av øvrig prosess.
 
Ved helt spesielle behov kan man også sette opp leverandøravhengige profiler, men erfaringsmessig er dette svært sjelden nødvendig.
 

DOKuStar Classify

Klassifiserer skannede dokumenter iht. papirformat, nøkkelord (kombinert og fraser) og geometrisk struktur (posisjon på nøkkelord i dokumentet). DOKuStar Classify er en obligatorisk modul, og kan kombineres med de andre. 

DOKuStar Index

En kostnadseffektiv og nivåbasert programvare for automatisk indeksering til arkiv-,  arbeidsflyt- og ERP applikasjoner. Programvaren indekserer inntil 6 felt per side. Datoer i originaldokument kan som eksempel indekseres og formateres til dag-måned-år, og systemet foretar valideringskontroll. I tillegg til indekseringsfelt med faste strukturer som for eksempel dato og beløp, kan indekseringsfelt med brukerdefinerte strukturer også tolkes. Tvetydigheter kan utelukkes av systemet ved at bruker kan definere hvordan feltene er posisjonert i relasjon til hverandre. Brukerdefinerte indeksfelt kan lagres og benyttes i andre DOKuStar prosjekt.  

DOKuStar Reader

Denne modulen tolker et ubegrenset antall indeksfelt. I tillegg kan det finne og lese også komplekse strukturer som forefinnes i tabeller eller adressefelt, ordresedler og leveringsbekreftelser. Systemet håndterer både geometrisk oppbygde tabeller og ustrukturert layout. DOKuStar Reader kan til og med gjenkjenne tabeller når ikke overskrifter er lokalisert over individuelle kolonner, dersom overskriftene er feilaktig plassert, med forstyrrende bakgrunn, eller er skrevet med svært liten skrifttype. Ved tolking av tabeller og formularer vil DOKuStar forsøke å gjenkjenne den logiske tabellstrukturen. Programmet vil først søke etter tabellen, deretter analysere tabellens struktur. Dette resulterer i utvikling av en matrise, der linjer og kolonner korresponderer med de som forefinnes i originalt dokument.
 
DOKuStar er et fleksibelt produkt som kan tolke ulike forretningskritiske dokumenter, alt skannet i en operasjon. Eksempler på dette er: Ordresedler, fakturaer, leveringsbekreftelser, spørreskjema, serviceformularer, tabeller og formularer, kontrakter, timelister med mer.