1. kamere
  2. Car Audio & Electronics
  3. Domači glasbeni sistem
  4. Osebni avdio
  5. televizorji
  6. Pametni dom
  >> Elektronske tehnologije Online >  >> Pametni dom >> Pametno življenje

Slabosti OCR

Poštna služba ZDA uporablja tehnologijo optičnega prepoznavanja znakov (OCR) za branje naslovov na kosih pošte. Da bi bilo pošto berljivo z razvrščevalnikom pošte OCR, morajo biti naslovi in ​​pisave oblikovani na določen način. Programska oprema OCR je uporabna za pretvorbo optično prebranih slik tipkanih ali ročno napisanih dokumentov v elektronsko besedilo, po katerem je mogoče iskati, vendar ima slabosti, ki omejujejo njeno uporabo.

Omejeni dokumenti

Optično prepoznavanje znakov najbolje deluje pri tipkanih dokumentih dobre kakovosti. Ročno napisanih dokumentov programska oprema OCR ne more zlahka prebrati. Podobno tipkane pisave, ki spominjajo na rokopis, pa tudi nelatinične pisave povzročajo veliko napak med postopkom OCR. Če ima dokument slab kontrast, je zmečkan ali umazan ali sta si besedilo in ozadje podobna v temi, OCR morda ne bo deloval dobro. OCR ima težave z dokumenti, ki vsebujejo slike in besedilo. Preglednice bodo povzročile tudi več napak.

Natančnost

Nobena programska oprema OCR ni 100-odstotno natančna. Število napak je odvisno od kakovosti in vrste dokumenta, vključno z uporabljeno pisavo. Napake, ki se pojavijo med OCR, vključujejo napačno branje črk, preskakovanje črk, ki niso berljive, ali mešanje besedila iz sosednjih stolpcev ali napisov slik. Če je potrebna visoka natančnost – kot pri pretvorbi digitalnih knjig v elektronsko obliko – bo potrebno elektronsko besedilo očistiti.

Rešitve

OCR ima težave pri razlikovanju med znaki, kot sta številka nič in velika črka »O«. Temu se lahko izognete tako, da uporabite posebno pisavo OCR, na primer pisanje ničle. Vendar to deluje samo za dokumente, ustvarjene z OCR, kot so vprašalniki. Pri izdelavi vprašalnikov, ki bodo napisani na roko, raziskovalci uporabljajo tudi polja za vsako črko.

Dodatno delo

Tudi če je skenirana slika izvirnega dokumenta visoke kakovosti, so potrebni dodatni koraki za čiščenje besedila OCR. Popravljanje napak, ki jih ustvari OCR, je zelo delovno intenzivno. Oseba mora ročno primerjati izvirni dokument in elektronsko besedilo. Ljudje delajo napake tudi pri tipkanju besedila iz dokumenta, vendar je včasih hitreje preskočiti korak OCR.


  1. Slabosti besedilnih sporočil za govor v angleščini
  2. Slabosti Kabelska TV
  3. Slabosti plazma TV
  4. Slabosti plazma TV
  5. Slabosti digitalnega oddajanja