This content requires Adobe Flash Player 8
Statistical Machine Translation (SMT)
. MMNLP focused on Statistical Machine Translation (SMT) on March 2010.
. SMT is automatically aligning words and phrases within sentence pairs in a parallel corpus.
. Probabilities are determined automatically by training a statistical model using the parallel corpus.
. We apply SMT using Moses.
. The BLEU score of the system is 9.3%
International Trainings & Conferences
- Asian Applied Natural Language Processing for Linguistics Diversity and
- Language Resource Development (ADD) http://www.tcllab.org/
- ADD-1 Program: Introduction to NLP , August 21 - September 1, 2006
- ADD-2 Program: Morpho-Syntactic Analysis, March 6 - 14, 2007
- ADD-3 Program: Studies on Speech – Image Processing, February 25 – March 2, 2008
- ADD-4 Program: "Language Resource technology"
- Morpho-Syntactic Analysis, Annotation, Tools, and Implementation, February 23 – 27, 2009 ,
http://www.tcllab.org/
- ADD#6 and Asian WordNet Meeting Phuket, Thailand December 6-9,2010. www.asianwordnet.org
Future Plan
. Parallel Corpora with POS tagging.
. Annotated parallel corpus.
. English Vs Myanmar Machine Translation.
. Building WordNet
. Participate in Asian WordNet
. Multi-lingual Machine Translation.
ကြန္ပ်ဴတာျမန္မာစာစနစ္ အေကာင္အထည္ေဖာ္ျခင္းအဖြဲ႕
သတင္းအခ်က္အလက္နည္းပညာ တုိးတက္လာတာႏွင့္အမွ် လူသားတုိ႔သည္ ကြန္ပ်ဴတာတြင္ ျမင္ေတြ႕ေနရေသာ အဂၤလိပ္စကား လုံးမ်ား အျပင္ မိမိတုိ႔ေန႔စဥ္ ေျပာဆုိသုံးစဲြေနၾကေသာ ဘာသာစကားလုံးမ်ား ျမင္ေတြ႕ အသုံးျပဳႏုိင္ေအာင္ Localization လုပ္ေဆာင္လာၾကသလုိ အဂၤလိပ္ဘာသာ စကားသာမက မိမိတုိ႔ေန႔စဥ္ ေျပာဆုိ သုံးစြဲေနၾက ဘာသာစကား (Natural Language) မ်ားျဖင့္ အသုံးျပဳႏုိင္ေအာင္ Natural Language Processing (NLP) လုပ္ငန္းမ်ားကုိ ႀကိဳးပမ္းလာၾကပါသည္။ ကြန္ပ်ဴတာသုံး ျမန္မာစာနစ္ အေကာင္အထည္ ေဖာ္ျခင္း လုပ္ငန္းစဥ္မ်ားသည္ အမ်ိဳးသားအဆင့္လုပ္ငန္းမ်ား ျဖစ္သည့္အတြက္ အားလုံး ပူးေပါင္း ပါ၀င္ၾကဖုိ႔ ဖိတ္ေခၚအပ္ပါသည္။
၀က္ဆုိက္တြင္ Myanmar NLP Research Lab ၏ လက္ရွိအေကာင္အထည္ေဖာ္ေနေသာ သုေတသနလုပ္ငန္း မ်ားႏွင့္ ၿပီးစီးသြားေသာ သုေတသနလုပ္ငန္းမ်ားကုိ ေဖာ္ျပထားပါသည္။
NLP ကုိစိတ္၀င္စားေသာ သုေတသီမ်ား၊ ဘာသာေဗဒပညာရွင္မ်ား နည္းပညာရွင္မ်ားအားလုံး၏ အေတြ႕အႀကဳံ မ်ား၊ နည္းပညာ မ်ားႏွင့္ ေဆြးေႏြးအႀကံျပဳခ်က္မ်ားအားလုံးကုိ ဖိတ္ေခၚပါတယ္။
ျမန္မာႏုိင္ငံတစ္၀န္းလုံးရွိ ျမန္မာစာတတ္ေျမာက္သူတုိင္း ကြန္ပ်ဴတာကုိ အသုံးျပဳႏုိင္၍ သတင္းအခ်က္အလက္ မ်ား ရယူအသုံးခ်ႏုိင္ရန္၊ နယ္ပယ္အသီးသီးတြင္ ကြန္ပ်ဴတာသုံးစနစ္မ်ားကုိ ျမန္မာဘာသာျဖင့္ အသုံးခ်ႏုိင္ရန္ စသည့္ ရည္ရြယ္ခ်က္မ်ားျဖင့္ အေကာင္ အထည္ေဖာ္ရန္ က်န္ရွိေနေသာ လုပ္ငန္းမ်ားျဖစ္သည့္ စာလုံးေပါင္း သတ္ပုံစစ္ေဆးျခင္း၊ ကမၻာသုံးဘာသာစကား အမ်ိဳးမ်ိဳးကုိ ျမန္မာ ဘာသာသုိ႔ ကြန္ပ်ဴတာျဖင့္ ဘာသာျပန္ဆုိျခင္း၊ စသည္တုိ႔ကုိ လုပ္ေဆာင္ႏုိင္သည့္ အဆင့္ျမင့္ျမန္မာစာသုံးစနစ္ကုိ ပုိမုိထိေရာက္ျမန္ဆန္စြာ အေကာင္အထည္ ေဖာ္ ေဆာင္ရြက္ႏုိင္ရန္အတြက္ ျပည္ေထာင္စုျမန္မာႏုိင္ငံေတာ္ ၀န္ႀကီးခ်ဳပ္ရုံး၏ ၁၄-၁၁-၂၀၀၅ ရက္ေန႔စဲြပါ အမိန္႔ေၾကာ္ျငာစာ အမွတ္ ၃၅/၂၀၀၅ ျဖင့္ အီလက္ထေရာနစ္ အမ်ိဳးသားအဆင့္ လုပ္ငန္းအဖြဲ႕၊ ဥကၠ႒၊ ဆက္သြယ္ေရး၊ စာတုိက္ႏွင့္ ေၾကးနန္း၀န္ႀကီးဌာန၊ ၀န္ႀကီး ဥကၠ႒အျဖစ္ ဦးစီးေသာ “ကြန္ပ်ဴတာသုံး ျမန္မာစာ စနစ္” ကုိတုိးခ်ဲ႕ ဖြဲ႕စည္းေပးခဲ့ပါသည္။ လုပ္ငန္းတာ၀န္မ်ားအလုိက္ လုပ္ငန္းအဖြဲ႕ (၄)ဖဲြ႕ကုိ ထပ္ဆင့္ဖြဲ႕စည္း လုပ္ေဆာင္လ်က္ရွိပါသည္။
ကြန္ပ်ဴတာသုံး ဘာသာျပန္စနစ္၏ လုပ္ငန္းအေျခအေန
ကြန္ပ်ဴတာသုံး ျမန္မာစာစနစ္ အေကာင္အထည္ေဖာ္ျခင္းကုိ ေအာက္ပါလုပ္ငန္းစီမံခ်က္အတုိင္း အဆင့္ (၄) ဆင့္ခ်မွတ္ေဆာင္ရြက္ခဲ့ပါသည္။
(၁) အေျခခံျမန္မာစာသုံးစနစ္ Basic Language Support (Enabling Kit)
- Typing and Editing
- OS Interface in Myanmar
- Office Interface in Myanmar
- Local setting (Date,Time,Currency)
(၂) အဆင့္ျမင့္ ျမန္မစာသုံးစနစ္ အဆင့္ ၁ Advanced Support Level 1
- Sorting
- Searching
(၃) အဆင့္ျမင့္ ျမန္မာစာသုံးစနစ္ အဆင့္ ၂ Advanced Support Level 2
- Dictionary
- Spelling Check
- Theasaurus
- MUI (Multiple User Interface)
(၄) အဆင့္ျမင့္ ျမန္မာစာသုံးစနစ္ အဆင့္ ၃ Advanced Support Level 3
- Optical Character Reader (OCR)
- Machine Translation
- Voice Recognition
- Hand Script Recongnition
အထက္ပါ လုပ္ငန္းစီမံခ်က္မ်ားကုိ Microsoft (MS) Platform မွာသာမက Open Source Software (OSS) Platform မွာ လုပ္ကုိင္ရရွိေအာင္ အေကာင္အထည္ေဖာ္ ေဆာင္ရြက္ရန္ ခ်မွတ္ခဲ့ျခင္းျဖစ္ပါသည္။
လုပ္ငန္းေဖာ္ေဆာင္မႈမ်ား
ပထမဦးစြာ အေျခခံ ျမန္မာစာသုံးစနစ္မွ Typing and Editing (ကြန္ပ်ဴတာသုိ႔ ျမန္မာစာရုိက္သြင္းျခင္းႏွင့္ ျပင္ဆင္တည္းျဖတ္ျခင္း) အတြက္ ISO 10646 အရသတ္မွတ္ၿပီး Unicode Space တြင္ သတ္မွတ္ေပးခဲ့ေသာ စံအတုိင္း လုပ္ေဆာင္ခဲ့ၾကပါသည္။ ဤတြင္ Unicode Consortium မွ စံသတ္မွတ္ျခင္းသည္ Code Point သတ္မွတ္ေပးရုံသာမက စာလုံးေပါင္း ေပါင္းရာတြင္လည္း စာလုံးေပါင္းမတူပါက စာလုံးအတြက္ သတ္မွတ္ေပး ေသာ နံပါတ္တဲြမတူညီေစေသာ Encoding Sequence ကုိပါသတ္ မွတ္ေပးပါသည္။
ရရွိထားၿပီး စံသတ္မွတ္ခ်က္ႏွင့္ ကုိက္ညီၿပီး Unicode Technology ကုိ အသုံးျပဳထားေသာ ျမန္မာစာလုံး စနစ္ တီထြင္ရန္ ႀကိဳးပမ္းခဲ့ၾကရာ MS Windows OS တြင္ လုိအပ္သလုိ ျပင္ဆင္လုပ္ကုိင္ရန္ မျဖစ္ႏုိင္ပါေသာေၾကာင့္ ကမၻာတြင္ တစ္ဟုတ္ထုိး ျပန္႔ပြားလာေနေသာ Open Source Software (OSS) Platform မွ Linux OS တြင္ အသုံးျပဳ၍ရေသာ M17N ျမန္မာစာလုံးစနစ္ (Font) ကုိ တီထြင္စမ္းသပ္ရန္ ႀကိဳးစားခဲ့ၾကရာ၊ “လင္းနပ္စ္ ျမန္မာစာ အေထာက္အကူျပဳစနစ္ (စမ္းသပ္အဆင့္ ၁)” (Myanmar Enabling Kit (Beta Version)) CD ကုိ ၂၀၀၅ ခုႏွစ္ဇန္န၀ါရီလ ၊ စတုတၳအႀကိမ္ေျမာက္ ျမန္မာအုိင္စီတီ ရက္သတၱပတ္တြင္ ေအာင္ျမင္စြာ ျဖန္႔ခ်ိႏုိင္ခဲ့ပါ သည္။ ထုိ Distribution တြင္
(၁) ျမန္မာစာဘာသာျပန္ျခင္း
(၂) ျမန္မာစာ စာစီစာရုိက္ျပဳလုပ္ႏုိင္ျခင္း
(၃) ျမန္မာဘာသာျဖင့္ Date/Time Setting မ်ားျပဳလုပ္ျခင္း
(၅) ျမန္မာဘာသာသုံး အင္တာနက္ Browser ျဖင့္ အင္တာနက္ ၾကည့္ရႈႏုိင္ျခင္း
(၆) ျမန္မာဘသာျဖင့္ အီးေမးလ္အသုံးျပဳႏုိင္ျခင္း တုိ႔ကုိ ျပဳလုပ္ႏုိင္ၿပီျဖစ္ပါသည္။
* EMS
* Telephone Dir
* E Telegram
* About
* Video
* News
* Policy
* Photo Album
* Contact Information
|
Building No.2, Special Development Zone, Nay Pyi Taw, Myanmar
Ph: (+9567)407225 | Fax: (+9567) 407216 | e-mail: dg.ptd@mptmail.net.mm |
Copyright © 2011 Ministry of Communications, Posts and Telegraphs. All rights reserved. |