Saturday, December 28, 2013

OCR ဆိုတာဘာလည္း…..




OCR ဆိုတာကိုမေျပာခင္မွာအရင္ရွင္ျပခ်င္တာကေတာ့ကၽြန္ေတာ္တို႕
သာမာန္အားျဖင့္ E-book (PDF) ေတြမွာအမ်ိဳးအစားအားျဖင့္ ႏွစ္မ်ိဳး
ရွိပါတယ္။၄င္းတို႕ကေတာ့ Image PDF နဲ႕ Text PDF ဆိုပီးေတာ့ေပ့ါ
ဘာေတြကြာျခားသလည္းဆိုေတာ့ ကၽြန္ေတာ္တို႕ Text PDF ေတြမွာ
ဆိုရင္ေတာ့ ၄င္း PDF File အတြင္းပါ၀င္ေသာ စာသားမ်ားအားအလြယ္
တကူ Ctrl + F (Search) လုပ္ပီးရွာေဖြလို႕ေပမယ့္။ Image PDF ေတြ
မွာကေတာ့ Search လုပ္ခြင့္မရွိပဲ PDF File တစ္ခုလံုးက Image တစ္ခု
ကို Scan ဖတ္ထားပီး PDF Converting လုပ္ထားသလိုမ်ိဳးျဖစ္ေနေသာ
ေၾကာင့္ျဖစ္ပါတယ္။ ဒါေၾကာင့္ ကၽြန္ေတာ္တို႕က OCR Service ပါေသာ
Reader သို႕မဟုတ္၊ OCR Software တစ္မ်ိဳးမ်ိဳးျဖင့္ ၄င္း Image PDF
မ်ားကို Text PDF အျဖစ္သို႕ ေျပာင္းလည္းရပါတယ္။ဒါေၾကာင့္ အခု
ဒီေခါင္းစဥ္ေအာက္မွာကၽြန္ေတာ္က PDF-X Change Viewer နဲ႕
Adobe Reader ႏွစ္ခုကိုယွဥ္ပီးေျပာသြားပါမယ္။လိုအပ္တဲ့
Software ကိုေတာ့ ဒီမွာေဒါင္းလိုက္ပါ အိုေခအရင္ဆံုး
သင့္စက္ထဲကို PDF-X Change Viewer Software ကို Install
လုပ္လုိက္ပါ။ အားလံုးဟာပံုမွန္အတိုင္းပါပဲအဲဒီေနရာမွာတစ္ခု
ေျပာခ်င္တာက Installation အပိုင္းေပါ့.. Select Components
ဆိုတဲ့အပိုင္းေရာက္ရင္ေအာက္ပါပံုအတိုင္း



မွ်ားအနီေလးျပထားတဲ့ OCR ဆိုတဲ့ Service ေလးကိုအမွန္ျခစ္မျဖဳတ္မိဖို႕ျဖစ္ပါတယ္။
ကဲ Software ကုိစာဖတ္သူသြင္းပီးသြားပီလို႕ ယူဆလိုက္ပါတယ္။ဒါေၾကာင့္ ဆက္ရေအာင္
ဥပမာတစ္ခုအေနနဲ႕ ကၽြန္ေတာ္က Image PDF ဖိုင္တစ္ခုကိုဖြင့္ပီး ၄င္းထဲမွာပါ၀င္ေသာ
Word တစ္ခုခုအား Search ျဖင့္ ရွာၾကည့္လိုက္ပါတယ္။ ပထမဦးဆံုး Adobe Reader
ထဲကေနေပ့ါ…


အထက္ပါပံုအတိုင္းသင္ရိုက္ရွာလိုက္ေသာစာသားဟာမရွိပါဘူးဆိုပီးေတာ့
Message ေဖာ္ျပပါတယ္။ေနာက္တစ္ခုX Change Viewer အတြင္းမွာလည္း
ထပ္မံရွာၾကည့္ပါတယ္။




ဒီထဲမွာလည္းမေတြ႕ဘူးလို႕ေျပာပါတယ္။ ဒါဟာ Image PDF ဖိုင္ျဖစ္ေနလို႕ပါပဲ…
ကၽြန္ေတာ္တို႕က Adobe Reader ထဲမွာဆိုရင္ OCR Service Mode မပါ၀င္တဲ့
အတြက္ေၾကာင့္ ၄င္း Image PDF ကို Text PDF အျဖစ္ Convert လုပ္လို႕မရပါ
ဘူး။ ဒါေၾကာင့္ ကၽြန္ေတာ္တို႕က X Change Viewer ထဲကေန Convert လုပ္မွာ
ျဖစ္ပါတယ္။ ဒါေၾကာင့္ေအာက္ပါပံုအတိုင္း



မွင္အနီေရာင္ေလး၀ိုင္းျပထားတဲ့ေနရာမွာ OCR ဆိုတာကို ႏွိပ္လိုက္ပါမယ္။
ဒီအခါမွာေတာ့ ေအာက္ပါပံုအတိုင္း



OCR Converting Service ModeMenuေပၚလာတဲ့အခါမွာေတာ့ ဘာမွ
မေျပာင္းလည္းပဲ OK ဆိုတာကိုႏွိပ္လိုက္ပါ့မယ္။ဒါဆိုရင္ေအာက္ပါပံုအတုိင္း



သင့္ Image PDF File အတြင္းရွိစာမ်က္ႏွာအားလံုးကို Text PDF ဖုိင္အျဖစ္
သို႕ Converting လုပ္ေနတာျဖစ္ပါတယ္။ဒီေနရာမွာစာရြက္ရည္မ်ားလွ်င္မ်ား
သလိုအခ်ိန္အားျဖင့္လည္းအနည္းငယ္ ၾကာျမင့္ပါမယ္။ဒီေနာက္ Converted
ပီးသြားတာနဲ႕ ကၽြန္ေတာ္တို႕ကခုနကရိုက္ရွာတဲ့ “text “ ဆိုတာကိုထပ္မံရိုက္ပီး
ရွာတဲ့အခါမွာေတာ့



အထက္ပါပံုအတိုင္း PDF ဖိုင္ထဲမွာရွိသမွ် TEXT ႏွင့္ ပတ္သက္သမွ် စကားလံုး
တိုင္းကိုေဖာ္ျပေပးမွာျဖစ္ပါတယ္။ဒါဟာဘာေၾကာင့္လည္းဆိုေတာ့ လက္ရွိ
Image PDF ကေန Text PDF အျဖစ္သို႕ OCR Services Mode ကိုအသံုးျပဳ
ပီး Converted လုပ္လုိက္ေသာေၾကာင့္ျဖစ္သည္။ အခုေနာက္ပိုင္း Adobe
Reader ေတြဘယ္ေလာက္ပဲထြက္ထြက္ OCR Service မပါပါဘူး။ သို႕ေပ
ေသာ္ညာလည္း Adobe Acrobat Reader မွာကေတာ့ OCR ကို Support
လုပ္တာကိုေတြ႕ရွိရပါတယ္။ ဒီေလာက္ဆိုရင္ ကၽြန္ေတာ္တို႕ဖတ္ေနၾကတ့ဲ
PDF အေၾကာင္းနဲ႕ OCR အေၾကာင္းကိုအၾကမ္းဖ်ဥ္းေလးသေဘာေပါက္
နားလည္မယ္လို႕ ယံုၾကည္ေမွ်ာ္လင့္မိပါတယ္။ ဒီ Post ေလးျဖစ္ေျမာက္ဖို႕
အႀကံဥာဏ္ရေအာင္ ကၽြန္ေတာ့္ရဲ႕ Customer တစ္ဦးျဖစ္တဲ့ ဗီယက္နမ္
တစ္ေယာက္လည္းဒီ Post ေလးနဲ႕ ဂုဏ္ျပဳလိုက္ပါတယ္။
ေလးစားစြာျဖင့္
Cristiano Zarni@ ဦးဇာနည္

No comments:

Post a Comment