Friday, October 29, 2010

ဝိုက်ချ (ာ) နဲ့ မောက်ချ (ါ)

ဝိုက်ချ (ာ) နဲ့ မောက်ချ (ါ)

ဒီနေရာမှာ အ-သရ (ရေးချ) - ဝိုက်ချ (ာ) နဲ့ မောက်ချ (ါ) အကြောင်း နဲနဲ ဆွေးနွေးချင်ပါတယ်။ Unicode 5.1 မတိုင်ခင်က ရှင်းပာတယ်။ ဝိုက်ချ (ာ) တစ်မျိုးတည်း U102C အနေနဲ့ရှိပာတယ်။ ပုံဖော်စနစ် (Rendering) ကသာ အက္ခရာပော်လိုက်ပြီး ဝိုက်ချ (ာ) မောက်ချ (ါ) ပြောင်းလဲပုံဖော်ပေးရပာတယ်။ Unicode 5.1 မှာတော့ မောက်ချ (ါ) ပာ U102B အနေနဲ့ သီးခြားသတ်မှတ်ပေးလာပာတယ်။ အဓိက စကောကရင်အတွက် သတ်မှတ်ပေးထားတာပာ။ အဲဒီမှာ ဝိဝာဒကွဲစရာဖြစ်လာပာတယ်။ Myanmar3 မှာ ခ၊ ဂ၊ င၊ ဒ၊ ပ၊ ဝ အက္ခရာတွေနဲ့ ဝိုက်ချ (ာ) U102C နဲ့ ပောင်းတဲ့အခါ dotted circle နဲ့ အမှားအနေနဲ့ ပြပာတယ်။ အောက်က နမူနာမှာ အပေါ်လေးကြောင်းက ဝိုက်ချ (ာ)၊ အောက်လေးကြောင်းက မောက်ချ (ါ) နဲ့ ရေးထားတာပါ။

Myanmar3

Masterpiece Uni Sans

တကယ်တော့ "ခ+ာ" က "ဘ"၊ "ဂ+ာ" က "က"၊ "င+ာ" က "တ"၊ "ဒ+ာ" က "အ"၊ "ပ+ာ" က "ဟ"၊ "ဝ+ာ" က "တ" နဲ့ ဆင်တူလို့ မောက်ချ နဲ့ ရေးကြတာပာ။ ဒါပေမယ့် အဲဒီ အက္ခရာတွေနဲ့ ဗျည်းတွဲ ပောင်းတဲ့အခာကျတော့ ဝိုက်ချ (ာ) နဲ့ ရေးပာတယ်။ ဒဒွေးကတော့ ချွင်းချက်ပါ။ ဒဒွေး ရရစ် ကို ဝိုက်ချ (ာ) နဲ့၊ ဒဒွေး ဝဆွဲ ကို မောက်ချ (ါ) နဲ့ ရေးကြပါတယ်။ ဒဒွေး ယပင့် နဲ့ ဒဒွေး ဟထိုး တို့ကတော့ အသုံးမရှိဘူးထင်ပါတယ်။ ပာဌ်ဆင့် နဲ့ပောင်းတဲ့ စာလုံးတွေလည်းရှိပာသေးတယ်။

အဲတော့ ဒီအက္ခရာ ငားလုံး နဲ့ အာ-သရ ကို ဘယ်လိုစာလုံးစီကြမလဲ။ အဲဒီ အက္ခရာတွေနဲ့ အာ-သရ (ကြားမှာ ဗျည်းတွဲ၊ ပါဌ်ဆင့် မပာဘဲ) တိုက်ရိုက်ပောင်းတဲ့အခာ မောက်ချ (ါ) U102B နဲ့ စီမယ်၊ အခြားစာလုံးတွေအားလုံးကို ဝိုက်ချ (ာ) U102C နဲ့ စီမယ်လို့ သတ်မှတ်မှာလား။ ဒါဆိုရင် ဒဒွေး ဝဆွဲတို့ ဒဒွေးနှစ်လုံးဆင့်တို့ ကျတော့ကောလို့ မေးစရာဖြစ်လာပာတယ်။ စာလုံးစီပုံ တသမတ်တည်းမဖြစ်နိုင်ပာဘူး။ ခ၊ ဂ၊ င၊ ဒ၊ ပ၊ ဝ + ဗျည်းတွဲ / ပါဌ်ဆင့် + မောက်ချ (ါ) ဆိုရင် Myanmar3 ကရော အမှားအနေနဲ့ dotted circle နဲ့ မပြပေးဘူးလား။

စာရိုက်စနစ်က ရိုက်ချင်တာနဲ့ရိုက် အမှန်စီပေးဖို့ စီစဉ်ရမှာလား။ ကျွန်တော်အခုသုံးနေတဲ့ ibus-m17n မှာတော့ ဟိုအရင် ဝင်းမြန်မာလက်ကွက်အတိုင်း ဝိုက်ချ (ာ) ကို m၊ မောက်ချ (ါ) ကို g သီးခြား သတ်မှတ်ပေးထားပာတယ်။ စာရိုက်တဲ့သူက မှန်အောင်ရိုက်ပေတော့။ ကျွန်တော်ကတော့ ဝင်းမြန်မာ ရိုက်နေကျဆိုတော့ အခုစာရိုက်နေရင်း ခ၊ ဂ၊ င၊ ဒ၊ ပ၊ ဝ ဆိုရင် g နဲ့ ရိုက်ဖြစ်နေလို့ m နဲ့ ရိုက်ဖြစ်အောင်သတိထားရိုက်နေပါတယ်။ ဒီ ပို့စ်တစ်ပုဒ်လုံးမှာ ဝိုက်ချ (ာ) နဲ့ပဲ စာစီထားပာတယ်။ ဝိဇ္ဇာလို romanize စနစ်တွေမှာတော့ စာလုံးပော်လိုက်ပြီး စီပေးရင်ဖြစ်နိုင်ပာတယ်။ ဒာတောင် အပော်ကဘယ်လိုစာလုံးစီမှာလဲဆိုတာ ပြေလည်သွားမှပာ။ ကိုရာဗီ ရဲ့ NHM မှကော စည်းမျဉ်းတစ်သိန်းကျော်က ဘယ်နှစ်ခုလောက်ထပ်တိုးရဦးမလဲ :)

ဘယ်လို စီစီ မှန်တယ်ကွာ၊ ပုံဖော်စနစ်က အမှန်ပြပေးရမယ်ဆိုရင်ကော။ ခ၊ ဂ၊ င၊ ဒ၊ ပ၊ ဝ + ဗျည်းတွဲ / ပါဌ်ဆင့် + မောက်ချ (ါ) ဆိုရင် ဝိုက်ချ (ာ) နဲ့ ပုံဖော်ပေးရမှာလား။ Masterpiece Uni Sans ကတော့ Unicode 5.1 ကအတိုင်းပဲ ရှိနေပာသေးတယ်။ Unicode 5.1 ပြောင်းတုန်းက မောက်ချ (ါ) အတွက် ထည့်မရေးထားမိဘူး ထင်တာ အပော်ကနမူနာမှာ ရရစ်နဲ့မှာ ဝိုက်ချ (ာ) ပြောင်းပေးပါတယ်။ ယပင့်၊ ဝဆွဲ၊ ဟထိုး တွေနဲ့ဆို မမှန်ပာဘူး။ ကျွန်တော်အနေနဲ့ ထပ်ထည့်ဖို့ ဝန်မလေးသလို မခဲယဉ်းပာဘူး။ သေချာပြီဆိုရင်ပော့ :)

ထုံးစံအတိုင်း UTN11_3 ပြန်ကြည့်ရအောင်။ ပုံဖော်စနစ်အနေနဲ့ U102C ကို ခ၊ ဂ၊ င၊ ဒ၊ ပ၊ ဝ အက္ခရာတွေနဲ့ ပောင်းတဲ့အခါ မောက်ချ (ါ) အနေနဲ့ မပြောင်းသင့်ဘူးလို့ ဖော်ပြမထားသလို အဲဒီအက္ခရာတေွကို U102B နဲ့မှ စာစီရမယ်လို့လည်း ပြောမထားပါဘူး။ နမူနာလေးခုနဲ့တော့ U102B နဲ့ U102C အသုံးကို ခွဲခြားပြထားပာတယ်။ ပြီးတော့ "ြမန်မာသီးသန့် စာရိုက်စနစ်အနေနဲ့ သတ်သတ်မှတ်မှတ် အက္ခရာများ (ခ၊ ဂ၊ င၊ ဒ၊ ဓ၊ ပ၊ ဝ)၊ ဗျည်းတွဲများ၊ ပါဌ်ဆင့်များ နဲ့ဆိုရင် အ-သရ ရဲ့ မူကွဲပုံစံတစ်ခုခုကို လိုက်နာအောင် ရွေးချယ်စေနိုင်တယ်၊ ဒါပေမယ့် လိုအပ်ချက်မဟုတ်ပေဘူး" လို့ဆိုထားပြန်ပါတယ်။ အောက်မှာ ထုတ်နှုတ်ချက်လေးပါ။

The basic consonants and vowels are relatively obvious in how they are encoded, by examining the character charts. Thus:

စာ 1005 102C letter

Above we show the Myanmar word, the underlying Unicode codes that would be stored to represent this and an English gloss of the word. As this example shows, characters are stored in the order in which they
are read.
ခါ 1001 102B to shake
သိက္ခာ 101E 102D 1000 1039 1001 102C dignity
သဒ္ဓါ 101E 1012 1039 1013 102B faith

In this example, we highlight the code of interest. Notice how the ါ (U+102B MYANMAR VOWEL SIGN TALL AA) has a different code to the ာ (U+102C MYANMAR VOWEL SIGN AA). The Myanmar character underlying the two codes is the same, and there are rendering rules that can give the correct form, so why has the tall -aa been given its own code? The primary reason is that Sgaw Karen, among other minority scripts, only has the tall form, and so a rendering system that works for the Myanmar language is not going to work for Sgaw Karen and vice versa. A Myanmar language specific keyboarding implementation could choose to enforce a particular variant of the -aa vowel in the context of certain consonants (in Burmese following ခ, ဂ, င, ဒ, ဓ, ပ, or ဝ), medial combinations and syllable chainings, but this is not required.


ကျွန်တော်ကတော့ အောက်ကနမူနာလေးတွေထပ်ဖြည့်ပေးချင်ပါတယ်။
ခွာ(တယ်) 1001 103D 102C to peel
ကုမုဒြာ 1000 102F 1019 102F 1012 103C 102C water lily

တော်တော်လည်းရှည်သွားပြီ။ နိဂုံးချုပ်ပာတော့မယ်။ ယူနီကုဒ်ဆိုတာ စာလုံးအမြင်ကိုလိုက်ပြီး စာလုံးစီပာသလား။ Does unicode encode based on the different visual variants of a particular letter?

မှတ်ချက်။ ။ ကိုLionslayer ရဲ့အသုံးအတိုင်း encode ကို စာလုံးစီတယ်လို့ သုံးထားပါတယ်။

1 comment:

  1. >>> A Myanmar language specific keyboarding implementation could choose to enforce a particular variant of the -aa vowel in the context of certain consonants.
    Keyboarding implementation can be done straight forward typing. But not in editing. We can't know existing character by keyboard programs. We could choose to enforce Vowel Tall AA and also we should show someone type wrong sequence like Consonant Kha and Vowel AA.

    I'm pretty sure. rendering rules or shaping algorithm must not enforce particular variant of Vowel Tall AA.

    hope you may clear.

    ReplyDelete