倉頡輸入法/例外字
< 倉頡輸入法
取碼原則 | ◄ | 倉頡輸入法 例外字 |
► | 特別注意 |
95%以上的中文字,都可依據前述原則取碼,其餘約5%的字,若按同樣規則取碼,本來亦無不可,但顧及使用方便,特將一些字形做例外處理,這些字稱做「例外字」,包括:[1]
- 複合字首:做字首或次字首時,視爲一整體,只取頭、尾兩碼。
- 複合字:一律視爲一整體,只取頭、尾兩碼。
- 難字:可用「難」碼代替難取的部份。
- 特殊字:被其他部件橫貫時,先取特殊字,再取重疊於上的部件,並且可與骨幹的中豎重複。
注意以下例外字均已舉全,不可憑個人主觀自訂例外字,否則會取不到正確字碼。[2]
複合字首编辑
「複合字首」(或稱「特別字首」)在做「字首」或「次字首」時,視爲一整體,只取頭、尾兩碼。[3][4]
版本 | 複合字首 | 圖解 | 取碼 | 字例 | 補充說明 |
---|---|---|---|---|---|
三五 | 人弓 | 氣(人弓.火木)、餼(人戈.人弓木) | |||
三五 | 尸一 | 翀(尸一.中)、翍(尸一.木竹水) | |||
三五 | 戈金 | 麼(戈金.女戈)、磨(戈金.一口) | 按台灣標準字形,「魔、磨、摩、麼」等字的字首應爲「戈金」而非「戈木」,但微軟倉頡採後者編碼,詳參〈特別注意〉一節。 | ||
三五 | 戈木 | 麽(戈木.竹戈)、磨(戈木.一口) | |||
三五 | 一大 | 壓(一大.土)、靨(一大.一田中) | |||
三五 | 一女 | 蜃(一女.中一戈)、辱(一女.木戈) | |||
三五 | 一人 | 鷢(一人.竹日火) | 五代手冊未列此複合字首。[5] | ||
三 | 一木 | 歴(一木.卜中一)、厯(一木.山戈戈) | 五代:歴(一.木木.一)、厯(一.木木.戈) | ||
三 | 一木 | 歷(一木.卜中一)、曆(一木.日) | 五代:歷(一.竹木.一)、曆(一.竹木.日) | ||
三 | 一火 | 贗(一火.月山金) | 五代:贗(一.人火.金) | ||
三 | 一土 | 贋(一土.月山金) | 五代:贋(一.人土.金) | ||
三 | 戈土 | 應(戈土.心)、鷹(戈土.竹日火) | 五代:應(戈.人土.心)、鷹(戈.人土.火) | ||
三 | 戈戈 | 腐(戈戈.人月人)、焤(戈戈.火) | 五代:腐(戈.人戈.月)、焤(戈.人戈.火) | ||
三 | 亥 | 亥 | 卜人 | 賌(卜人.月山金) | 五代:賌(卜.女人.金)[6] |
五 | 人口 | 拿(人口.手)、盒(人口.月廿) | 三代:拿(人.一.口手)、盒(人.一.口廿) | ||
五 | 廿十 | 孽(廿十.弓木)、躠(廿十.口卜人) | 三代:孽(廿.竹十.木)、躠(廿.竹十.人) |
複合字首單獨使用,或用做「字身」、「次字身」時,則依一般方式取碼。例如:
- 麻(戈.十金.金),蔴(廿.戈.十金),嫲(女.戈.十金);
- 厭(一.日月.大),懨(心.一.日大),擫(手.一.日大);
- 辰(一.一.一女),宸(十.一.一女),娠(女.一.一女);
- 气(人.一.弓),汽(水.人.一弓),芞(廿.人.一弓);
- 羽(尸一.尸戈一),翅(十水.尸一.一),扇(竹尸.尸一.一)。
- 府(戈.人.木戈),俯(人.戈.人戈),腑(月.戈.人戈);
- 合(人.一.口),洽(水.人.一口),答(竹.人.一口);
- 薛(廿.竹口.十),𡤏(女.廿.竹十),𨇨(口一.廿.竹十)。
許多複合字首在書寫時會視爲整體形塊。例如「愿」、「壓」、「辱」等字,有時作撇筆一撇到底,包住下方部件,有時則較短,使兩字能上下切開,把它們定義作複合字首可避免字首應該取「厂」或取「原」、「厭」、「辰」的疑惑。
另一些複合字首是為了減少重碼。例如若不把「麻」定義作複合字首,「麻」部字得取「戈.十金.(尾碼)」或「戈.木木.(尾碼)」,許多字形只靠一個尾碼便難以區分,會產生大量重碼。同理「羽」、「气」、「薛」、「合」等皆有此作用。
複合字编辑
「複合字」不論是單獨使用或與其他字形組合使用,一律只取其頭、尾兩碼。[7]
難字编辑
有些字的部份形狀過於瑣碎,導致拆碼繁瑣。爲了方便取碼,特別規定了一些「難字」,以「難(X)」碼代替難取部份。以下是難字列表:
1.「首、難、尾」型:首、尾碼好取,其餘難取。
2.「首、難」型:僅有首碼好取
難字 | 圖解 | 取碼 | 字例 |
---|---|---|---|
竹難 | 兒(竹難竹山)、倪(人.竹難山)、臾(竹難人) | ||
竹難 | 叟(竹難中水)、盥(竹難.月廿) | ||
竹難 | 學(竹月.弓木)、釁(竹月.一金.竹) | ||
竹難 | 與(竹難卜金)、興(竹難月金)、輿(竹難十金) | ||
中難 | 蕭(廿.中難)、鏽(金.中難) | ||
弓難 | |||
女難 | |||
卜難 | 濟(水.卜難)、齋(卜難火) |
特殊字编辑
有部件重疊在以下幾種字形的中間時,可先取特殊字,再取重疊於上的部件。[8]
版本 | 特殊字 | 字例 |
---|---|---|
三五 | 末(木十)、朿(木月)、束(木中)、來(木人人)、東(木田)、柬(木田火)、秉(竹木中)、乘(竹木中心) | |
三五 | 脊(火金.月)、拳(火手.手) | |
三五 | 彧(戈大.口.一)、銭(金.戈手)、线(女一.戈十) | |
三五 | 爽(大大大大)、奭(大一日日)、夷(大弓)、夾(大人人) | |
三五 | 屯(心山)[8] |
注意特殊字的一些特性:
- 重疊在特殊字上的字形可以計入中豎,且計入中豎的取碼方式通常優先採用。例如「東」字視爲「田」重疊在「木」上,取碼「木田」;而非「日」或「曰」重疊在「木」上,取碼「木日」。
- 只有在特殊字內部重疊字形時適用特殊字的規則。例如若「央」取碼作「大月」(),則並非使用特殊字規則(因為「」不是在「」的內部),而是試圖跨越取碼(但此字不符合跨越取碼的條件,因而實際取碼是按區塊取碼作「中月大」)。
- 特殊字無絕對優先權,具體取碼仍須考量精簡、字形特徵、先繁後簡等其他原則。其中,特殊字會優先(但非必定)選擇讓橫筆對應原字最長、最突出的橫,以彰顯字形特徵。例如:
- 「未」取碼作「十木」而非「木十」(使用特殊字),而「末」取碼作「木十」(使用特殊字)而非「十木」,因如此取碼更能彰顯字形特徵(「木」橫筆對應原字最長橫)。
- 「春」取碼作「手大日」而非「大手日」(使用特殊字)、「実」取碼作「十手大」而非「十大手」(使用特殊字),因前者更符合字形特徵原則(若取「大手日」則「大」橫筆並非對應原字最長橫)與先繁後簡原則。
- 「夫」取碼作「手人」而非「大十」(使用特殊字),因前者更符合字形特徵原則(若取「大十」則「大」橫筆並非對應原字最長橫)與先繁後簡原則。
- 「毛」取碼作「竹手山」而非「竹心十」(使用特殊字),因前者更符合字形特徵原則(若取「竹心十」則「七」橫筆並非對應原字最長橫)與先繁後簡原則。
- 「尧」取碼作「十心.一山」而非「心十.一山」(使用特殊字),因前者較符合字形特徵原則(區塊分割優先)。
- 「戋」取碼作「戈十」(使用特殊字)而非「戈手心」、「㦮」取碼作「戈手」(使用特殊字)而非「戈手十心」,因前者較符合精簡原則與先繁後簡原則。
註釋编辑
- ↑ 五代手冊原文將「例外字」分為「複合字」、「難字」、「特殊字」、「重複字」,「複合字」下又分「複合字首」、「複合字」。可見五代手冊之「複合字」有廣義與狹義之別。三代手冊有「複合字」一詞,但由於三代未直接定義「複合字首」,其實質內容相當於五代的狹義複合字。由於廣義和狹義的「複合字」並存容易混淆,且廣義的「複合字」極其罕用——五代手冊除標題外未提及廣義的「複合字」;一般使用者談及「複合字」時也都是指三代或狹義的「複合字」——因此本教科書稍微調整架構,省去廣義的「複合字」,以避免歧義。「重複字」主要用於倉頡系統,但目前主流系統一般改以選字處理重碼字,本教科書遂將此部分移至〈進階知識〉一節。
- ↑ 就使用者角度而言,例外字不得新增。若站在輸入法或編碼表開發者的角度,則可考慮比照原開發者的精神,適當創造新例外字,以便為罕用字、造字編碼。
- ↑ 1994年版三代手冊未直接談及「複合字首」,但於第三章第三節介紹字首時提及「3.戊、戈、𢦏、㦰、产、麻、䧹、厭、厤、鴈、辰、厥、羽、府、鹿、亥、老、包、君‥等字,雖不能作上下或左右一次分離,然為了取碼方便,一律定義之為字首。」(1984年版之同一節字例尚有「雁」字),觀念與五代之複合字首相當。本教科書將其中可直接以漢字分割原則解釋者省略或於〈漢字分割〉一節討論,其餘則視為三代定義之複合字首。
- ↑ 五代倉頡實際上有哪些複合字首有爭議,官方五代手冊影印版和電子版列出的「複合字首」不一致,後者將「春」、「登」列為複合字首。因兩者在〈第三代、第五代改碼字〉皆把「蠢」、「凳」等相關字列為「五、取碼原則不一致者,使其統一」而非「三、增加複合字首或改變原複合字的取碼,以避免重複字者」,本教科書主要採影印版之說。其餘細節可參見〈爭議編碼〉一節。
- ↑ 《第五代倉頡輸入法手冊》(1999年版五代)附錄六〈第五代倉頡字碼表〉列出「鷢」(字形為「⿸厥鳥」)編碼為「一人竹日火」,附錄一〈第三代、第五代改碼字字碼對照表〉亦未提及相關改碼字,可見五代「厥」與三代一樣為複合字首。然而,五代手冊於介紹複合字首時未將「厥」列入,與前者不一致,對此有兩種解釋:一是五代手冊漏列此複合字首;二是五代取消了此二複合字首,唯將相關字之取碼字形由「⿸厥*」改為「⿱厥*」以致取碼未變,手冊字形則是印刷錯誤。解釋二需要較多巧合同時成立,可能性較低。 查漢文庫典「鷢」、「憠」、「橜」、「蟨」之六代編碼分別為「一廿人片」、「一廿人心」、「一廿人木」、「一廿人戈」,可見取碼所據字形為「⿸厥鳥」、「⿸厥心」、「⿸厥木」、「⿸厥虫」(若所據字形為「⿱厥鳥」、「⿱厥心」、「⿱厥木」、「⿱厥虫」,則應取碼「一廿山片」、「一廿山心」、「一廿山木」、「一廿山戈」),漢文庫典字形圖片顯示「⿱厥*」應屬錯誤。漢文庫典為五、六代共用系統,取碼所據字形相同,又漢文庫典與五代手冊皆屬五代倉頡,絕大部分取碼所據字形相同,因此五代倉頡之取碼所據字形當為「⿸厥*」,再次反駁了解釋二。 總上所述,解釋一顯較解釋二合理,五代倉頡應仍比照三代承認「厥」為複合字首;五代手冊未將「厥」列入複合字首應屬疏漏。
- ↑ 1994年版三代於字首一節有談及「亥」字特別定義為字首,並有例字「⿱亥月」。五代手冊於複合字首一節未提及此字形,改碼字一節未談及相關改碼,亦無相關字例。查漢文庫典(2003年版五代)將「賌」編碼為「卜女人金」,可見五代不將此字型認定為複合字首。
- ↑ 朱邦復於《第三代倉頡輸手法手冊》曾提及將「目」定為複合字取「月山」以免取「月一」時與「且」重碼;然而其《第五代倉頡輸手法手冊》主張「目」取「月一」不符合完整原則。本教材採五代之說,不將「目」視為複合字。
- ↑ 8.0 8.1 《第五代倉頡輸入法手冊》將「」列為特殊字,並於附表描述「屯」之取碼是採用輔助字形「七凵」,可知是比照類似「朿」的原則取碼(但有論以為視為「七屮」更佳)。有論以為此特殊字只有「屯」一個應用實例,不將「」視為特殊字也能按〈跨越分則〉解釋「屯」的取碼,且加入此特殊字會導致「毛」、「尧」等字取碼有爭議,而主張此字形不應納入特殊字[1]。該說可參,惟其所稱爭議並非不能用其他原則解釋,又考慮不將「」視為特殊字的跨越取碼方式與〈跨越分則〉的典型實例較不似,且無法排除未來處理更大字集遇到更多應用實例之可能,此仍從原說將「」列為特殊字。
取碼原則 | ◄ | 倉頡輸入法 例外字 |
► | 特別注意 |