Editing Optikai karakterfelismerés

Jump to navigation Jump to search

Warning: You are not logged in. Your IP address will be publicly visible if you make any edits. If you log in or create an account, your edits will be attributed to your username, along with other benefits.

The edit can be undone. Please check the comparison below to verify that this is what you want to do, and then save the changes below to finish undoing the edit.

Latest revision Your text
Line 4: Line 4:
 
Manapság egyre pontosabbá és kifinomultabbá válik az olyan kapcsolódó tudományágak fejlődésével, mint a mesterséges intelligencia vagy a gépi tanulás.
 
Manapság egyre pontosabbá és kifinomultabbá válik az olyan kapcsolódó tudományágak fejlődésével, mint a mesterséges intelligencia vagy a gépi tanulás.
 
Ezt a módszert különféle területeken és módokon hasznosítják: az autók rendszámainak automatikus felismerésére, postán a levelek és csomagok elosztására, vagy a könyvtárak és archívumok állományaik digitalizálására és megőrzésére.  
 
Ezt a módszert különféle területeken és módokon hasznosítják: az autók rendszámainak automatikus felismerésére, postán a levelek és csomagok elosztására, vagy a könyvtárak és archívumok állományaik digitalizálására és megőrzésére.  
 +
  
 
== Rövid története ==
 
== Rövid története ==
  
 
Bár a legkorábbi -  még analóg - szövegfelismerő eszközök feltalálása visszanyúlik a 20. század első évtizedeire, az OCR-technológiák széles körben való fejlesztése és használata csak az 1950-es években kezdődött el igazán. Ebben az időben olyan egyszerűsített betűkészleteket hoztak létre, amelyek könnyebben konvertálhatók digitálisan olvasható szövegekké. Az első ilyen speciális betűkészletet David Shepard hozta létre, és az OCR-7B néven vált ismertté. Az OCR-7B még ma is használatban van, például megtalálható a  bankkártyák dombornyomásán. Az 1960-as években a postaszolgálatok számos országban elkezdték használni az OCR technológiát, amivel jelentősen felgyorsították a levelek és csomagok válogatását. A 2000-es években kulcsfontosságú szerepe volt az OCR technológiának a CAPTCHA programok kifejlesztésében, amelyek a internetes botok és spammerek megfékezését szolgálták.
 
Bár a legkorábbi -  még analóg - szövegfelismerő eszközök feltalálása visszanyúlik a 20. század első évtizedeire, az OCR-technológiák széles körben való fejlesztése és használata csak az 1950-es években kezdődött el igazán. Ebben az időben olyan egyszerűsített betűkészleteket hoztak létre, amelyek könnyebben konvertálhatók digitálisan olvasható szövegekké. Az első ilyen speciális betűkészletet David Shepard hozta létre, és az OCR-7B néven vált ismertté. Az OCR-7B még ma is használatban van, például megtalálható a  bankkártyák dombornyomásán. Az 1960-as években a postaszolgálatok számos országban elkezdték használni az OCR technológiát, amivel jelentősen felgyorsították a levelek és csomagok válogatását. A 2000-es években kulcsfontosságú szerepe volt az OCR technológiának a CAPTCHA programok kifejlesztésében, amelyek a internetes botok és spammerek megfékezését szolgálták.
 +
  
 
== Típusok ==
 
== Típusok ==
Line 19: Line 21:
  
 
A legtöbb karakterfelismerő rendszer ugyanazon folyamat szerint dolgozik. A folyamat első lépése az analóg dokumentum optikai szkennerrel történő digitalizálása. Ezt követi a kapott digitális képen levő szövegblokkok, szövegsorok elkülönítése és vizsgálata. Majd a szoftver felismeri a sorokban szereplő betűket vagy betűpárokat. Végül a felismert szöveg helyesírás- vagy nyelvtani ellenőrzésen is áteshet.
 
A legtöbb karakterfelismerő rendszer ugyanazon folyamat szerint dolgozik. A folyamat első lépése az analóg dokumentum optikai szkennerrel történő digitalizálása. Ezt követi a kapott digitális képen levő szövegblokkok, szövegsorok elkülönítése és vizsgálata. Majd a szoftver felismeri a sorokban szereplő betűket vagy betűpárokat. Végül a felismert szöveg helyesírás- vagy nyelvtani ellenőrzésen is áteshet.
 +
  
 
== Az output ==
 
== Az output ==
  
 
Különféle karakterfelismerő szoftverek eltérő formában jeleníthetik meg az eredményt. A kapott output lehet egy egyszerű szöveges fájl vagy kifinomultabb rendszerek készíthetnek egy annotált PDF fájt, amely megtartja az eredeti kép szerkezetét, de a benne lévő szöveg kereshetővé válik. Továbbá a karakterfelismerés eredménye tárolható ALTO formátumban is, amely az amerikai Kongresszusi Könyvtár által létrehozott és fenntartott XML alapú szabvány.
 
Különféle karakterfelismerő szoftverek eltérő formában jeleníthetik meg az eredményt. A kapott output lehet egy egyszerű szöveges fájl vagy kifinomultabb rendszerek készíthetnek egy annotált PDF fájt, amely megtartja az eredeti kép szerkezetét, de a benne lévő szöveg kereshetővé válik. Továbbá a karakterfelismerés eredménye tárolható ALTO formátumban is, amely az amerikai Kongresszusi Könyvtár által létrehozott és fenntartott XML alapú szabvány.
 +
  
 
== Technikák ==
 
== Technikák ==
Line 36: Line 40:
 
 
 
''Binarizáció'' – A színes vagy szürkeárnyalatos képet átkonvertálhatjuk fekete-fehérré. (Ezt bináris képnek nevezik, mert összesen két szín alkotja a képet.) A binarizáció feladata, hogy megnövelje a kontrasztot a szöveg és a háttér között, amitől könnyebben szétválaszthatóvá válik a kettő.
 
''Binarizáció'' – A színes vagy szürkeárnyalatos képet átkonvertálhatjuk fekete-fehérré. (Ezt bináris képnek nevezik, mert összesen két szín alkotja a képet.) A binarizáció feladata, hogy megnövelje a kontrasztot a szöveg és a háttér között, amitől könnyebben szétválaszthatóvá válik a kettő.
 +
  
 
'''Utófeldolgozás:'''
 
'''Utófeldolgozás:'''
 
Az eredmények pontossága azáltal is növelhető, ha a szoftver a kapott szöveget összeveti egy szótárral, amely tartalmazza a dokumentumban előfordulható összes szót. Ez azonban nem minden esetben lehetséges. Ha a dokumentum olyan egyedi tulajdonneveket vagy speciális kifejezéseket tartalmaz, amelyek nem szerepelnek a megadott szótárban, akkor ezeknek a felismerése problémában ütközhet.
 
Az eredmények pontossága azáltal is növelhető, ha a szoftver a kapott szöveget összeveti egy szótárral, amely tartalmazza a dokumentumban előfordulható összes szót. Ez azonban nem minden esetben lehetséges. Ha a dokumentum olyan egyedi tulajdonneveket vagy speciális kifejezéseket tartalmaz, amelyek nem szerepelnek a megadott szótárban, akkor ezeknek a felismerése problémában ütközhet.
 +
  
 
'''Egyéb megoldások:'''
 
'''Egyéb megoldások:'''

Please note that all contributions to wikibase-docker may be edited, altered, or removed by other contributors. If you do not want your writing to be edited mercilessly, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource (see Project:Copyrights for details). Do not submit copyrighted work without permission!

Cancel Editing help (opens in new window)