倉頡輸入法/例外字

 取碼原則 倉頡輸入法
例外字
特別注意 

95%以上的中文字,都可依據前述原則取碼,其餘約5%的字,若按同樣規則取碼,本來亦無不可,但顧及使用方便,特將一些字形做例外處理,這些字稱做「例外字」,包括:[1]

  1. 複合字首:做字首或次字首時,視爲一整體,只取頭、尾兩碼。
  2. 複合字:一律視爲一整體,只取頭、尾兩碼。
  3. 難字:可用「難」碼代替難取的部份。
  4. 特殊字:被其他部件橫貫時,先取特殊字,再取重疊於上的部件,並且可與骨幹的中豎重複。

注意以下例外字均已舉全,不可憑個人主觀自訂例外字,否則會取不到正確字碼。[2]

複合字首编辑

「複合字首」(或稱「特別字首」)在做「字首」或「次字首」時,視爲一整體,只取頭、尾兩碼[3][4]

複合字首列表
版本 複合字首 圖解 取碼 字例 補充說明
三五 气 气 人弓 人弓.火木)、人戈.人弓
三五 羽 羽 尸一 尸一.中)、尸一.木竹水
三五 麻 麻 戈金 戈金.女戈)、戈金.一口 按台灣標準字形,「」等字的字首應爲「戈金」而非「戈木」,但微軟倉頡採後者編碼,詳參〈特別注意〉一節。
三五 ⿸广林 ⿸广林 戈木 戈木.竹戈)、戈木.一口
三五 厭 厭 一大 一大.土)、一大.一田中
三五 辰 辰 一女 一女.中一戈)、一女.木戈
三五 厥 厥 一人 一人.竹日火 五代手冊未列此複合字首。[5]
三  𠩵 𠩵 一木 一木.卜中一)、一木.山戈戈 五代:一.木木.一)、一.木木.戈
三  厤 厤 一木 一木.卜中一)、一木.日 五代:一.竹木.一)、一.竹木.日
三  鴈 鴈 一火 一火.月山金 五代:一.人火.金
三  雁 雁 一土 一土.月山金 五代:一.人土.金
三  䧹 䧹 戈土 戈土.心)、戈土.竹日火 五代:戈.人土.心)、戈.人土.火
三  府 府 戈戈 戈戈.人月人)、戈戈.火 五代:戈.人戈.月)、戈.人戈.火
三  卜人 卜人.月山金 五代:卜.女人.金[6]
 五 合 合 人口 人口.手)、人口.月廿 三代:人.一.口手)、人.一.口廿
 五 薛 薛 廿十 廿十.弓木)、廿十.口卜人 三代:廿.竹十.木)、廿.竹十.人

複合字首單獨使用,或用做「字身」、「次字身」時,則依一般方式取碼。例如:

戈.十金.金),廿.戈.十金),女.戈.十金);
一.日月.大),心.一.日大),手.一.日大);
一.一.一女),十.一.一女),女.一.一女);
人.一.弓),水.人.一弓),廿.人.一弓);
尸一.尸戈一),十水.尸一.一),竹尸.尸一.一)。
戈.人.木戈),人.戈.人戈),月.戈.人戈);
人.一.口),水.人.一口),竹.人.一口);
廿.竹口.十),𡤏女.廿.竹十),𨇨口一.廿.竹十)。

許多複合字首在書寫時會視爲整體形塊。例如「愿」、「壓」、「辱」等字,有時作撇筆一撇到底,包住下方部件,有時則較短,使兩字能上下切開,把它們定義作複合字首可避免字首應該取「厂」或取「原」、「厭」、「辰」的疑惑

另一些複合字首是為了減少重碼。例如若不把「麻」定義作複合字首,「麻」部字得取「戈.十金.(尾碼)」或「戈.木木.(尾碼)」,許多字形只靠一個尾碼便難以區分,會產生大量重碼。同理「羽」、「气」、「薛」、「合」等皆有此作用。

複合字编辑

「複合字」不論是單獨使用或與其他字形組合使用,一律只取其頭、尾兩碼[7]

複合字列表
版本 複合字 圖解 取碼 字例 補充說明
三五 門 門 日弓 日弓.口)、人.日弓
三五 鬥 鬥 中弓 中弓.卜中月)、中弓.竹難山
三五 阝 阝 弓中 弓中.人一木)、弓廿.弓中
三五 隹 隹 人土 大戈.人土)、女火.人土 當中可以被其他成份夾雜,比如)。
三五 畿-田 畿-田 女戈 女戈)、女戈竹戈 」從「𢆶」從「戍」,因此下方亦按「戍」字取碼,尾部份取「竹戈」不取「人」。
三五 虍 虍 卜心 卜心.竹山)、卜心.尸一
三  鬼 鬼 竹戈 土.竹戈)、廿.竹戈)、竹戈.十木 五代:竹山.戈)、土.竹山.戈)、廿.竹山.戈)、竹戈.十木
三  ⿱亡口 ⿱亡口 卜口 卜口.月.月弓)、卜口.月.廿弓
 五 门 门 中尸 中尸.日)、人.中尸 1987年版五代加入,1999年版移除。
無定義時:中戈尸)、人.中戈尸)。
 五 贏-貝 贏-貝 卜弓 卜弓.月山金)、卜弓.廿手

難字编辑

有些字的部份形狀過於瑣碎,導致拆碼繁瑣。爲了方便取碼,特別規定了一些「難字」,以「難(X)」碼代替難取部份。以下是難字列表:

1.「首、難、尾」型:首、尾碼好取,其餘難取。

「首、難、尾」型難字列表
難字 圖解 取碼 字例
身 身 竹難竹 弓火.竹難竹)、金.竹難竹
慶 慶 戈難水 木.戈難水)、廿手.戈難水
廌 廌 戈難火 廿.戈難火)、廿十.戈難火
鹿 鹿 戈難心 木木.戈難心)、戈心.土
𠂔 𠂔 中難竹 女.中難竹)、竹.中難竹
𣶒 𣶒 中難中 水.中難中)、女.中難中
兼 兼 廿難金 月金.廿難金)、廿.廿難金
黽 黽 口難山 女火.口難山)、土大.口難山
龜 龜 弓難山 中弓.弓難山)、竹木.弓難山
⻱ ⻱ 竹難山 竹難山)、𤒅火.竹難山

2.「首、難」型:僅有首碼好取

「首、難」型難字列表
難字 圖解 取碼 字例
臼 臼 竹難 竹難竹山)、人.竹難山)、竹難人
𦥑 𦥑 竹難 竹難中水)、竹難.月廿
學-爻-冖-子 學-爻-冖-子 竹難 竹月.弓木)、竹月.一金.竹
興-同-八 興-同-八 竹難 竹難卜金)、竹難月金)、輿竹難十金
肅 肅 中難 廿.中難)、金.中難
卍 卍 弓難
卐 卐 女難
齊 齊 卜難 水.卜難)、卜難火

特殊字编辑

有部件重疊在以下幾種字形的中間時,可先取特殊字,再取重疊於上的部件。[8]

特殊字列表
版本 特殊字 字例
三五 木 木十)、木月)、木中)、木人人)、木田)、木田火)、竹木中)、竹木中心
三五 火火(首二筆為上至下,呈「八」形) 火金.月)、火手.手
三五 戈 戈大.口.一)、金.戈手)、线女一.戈十
三五 大 大大大大)、大一日日)、大弓)、大人人
三五 七(首筆為斜)七(首筆為橫) 心山[8]

注意特殊字的一些特性:

  • 重疊在特殊字上的字形可以計入中豎,且計入中豎的取碼方式通常優先採用。例如「」字視爲「」重疊在「」上,取碼「木田」;而非「」或「」重疊在「」上,取碼「木日」。
  • 只有在特殊字內部重疊字形時適用特殊字的規則。例如若「」取碼作「大月」(Cjrm-k0.svgCjrm-b8.svg),則並非使用特殊字規則(因為「Cjrm-b8.svg」不是在「Cjrm-k0.svg」的內部),而是試圖跨越取碼(但此字不符合跨越取碼的條件,因而實際取碼是按區塊取碼作「中月大」)。
  • 特殊字無絕對優先權,具體取碼仍須考量精簡、字形特徵、先繁後簡等其他原則。其中,特殊字會優先(但非必定)選擇讓橫筆對應原字最長、最突出的橫,以彰顯字形特徵。例如:
    • 」取碼作「十木」而非「木十」(使用特殊字),而「」取碼作「木十」(使用特殊字)而非「十木」,因如此取碼更能彰顯字形特徵(「木」橫筆對應原字最長橫)。
    • 」取碼作「手大日」而非「大手日」(使用特殊字)、「」取碼作「十手大」而非「十大手」(使用特殊字),因前者更符合字形特徵原則(若取「大手日」則「大」橫筆並非對應原字最長橫)與先繁後簡原則。
    • 」取碼作「手人」而非「大十」(使用特殊字),因前者更符合字形特徵原則(若取「大十」則「大」橫筆並非對應原字最長橫)與先繁後簡原則。
    • 」取碼作「竹手山」而非「竹心十」(使用特殊字),因前者更符合字形特徵原則(若取「竹心十」則「七」橫筆並非對應原字最長橫)與先繁後簡原則。
    • 」取碼作「十心.一山」而非「心十.一山」(使用特殊字),因前者較符合字形特徵原則(區塊分割優先)。
    • 」取碼作「戈十」(使用特殊字)而非「戈手心」、「」取碼作「戈手」(使用特殊字)而非「戈手十心」,因前者較符合精簡原則與先繁後簡原則。

註釋编辑

  1. 五代手冊原文將「例外字」分為「複合字」、「難字」、「特殊字」、「重複字」,「複合字」下又分「複合字首」、「複合字」。可見五代手冊之「複合字」有廣義與狹義之別。三代手冊有「複合字」一詞,但由於三代未直接定義「複合字首」,其實質內容相當於五代的狹義複合字。由於廣義和狹義的「複合字」並存容易混淆,且廣義的「複合字」極其罕用——五代手冊除標題外未提及廣義的「複合字」;一般使用者談及「複合字」時也都是指三代或狹義的「複合字」——因此本教科書稍微調整架構,省去廣義的「複合字」,以避免歧義。「重複字」主要用於倉頡系統,但目前主流系統一般改以選字處理重碼字,本教科書遂將此部分移至〈進階知識〉一節。
  2. 就使用者角度而言,例外字不得新增。若站在輸入法或編碼表開發者的角度,則可考慮比照原開發者的精神,適當創造新例外字,以便為罕用字、造字編碼。
  3. 1994年版三代手冊未直接談及「複合字首」,但於第三章第三節介紹字首時提及「3.戊、戈、𢦏、㦰、产、麻、䧹、厭、厤、鴈、辰、厥、羽、府、鹿、亥、老、包、君‥等字,雖不能作上下或左右一次分離,然為了取碼方便,一律定義之為字首。」(1984年版之同一節字例尚有「雁」字),觀念與五代之複合字首相當。本教科書將其中可直接以漢字分割原則解釋者省略或於〈漢字分割〉一節討論,其餘則視為三代定義之複合字首。
  4. 五代倉頡實際上有哪些複合字首有爭議,官方五代手冊影印版和電子版列出的「複合字首」不一致,後者將「春」、「登」列為複合字首。因兩者在〈第三代、第五代改碼字〉皆把「蠢」、「凳」等相關字列為「五、取碼原則不一致者,使其統一」而非「三、增加複合字首或改變原複合字的取碼,以避免重複字者」,本教科書主要採影印版之說。其餘細節可參見〈爭議編碼〉一節。
  5. 《第五代倉頡輸入法手冊》(1999年版五代)附錄六〈第五代倉頡字碼表〉列出「鷢」(字形為「⿸厥鳥」)編碼為「一人竹日火」,附錄一〈第三代、第五代改碼字字碼對照表〉亦未提及相關改碼字,可見五代「厥」與三代一樣為複合字首。然而,五代手冊於介紹複合字首時未將「厥」列入,與前者不一致,對此有兩種解釋:一是五代手冊漏列此複合字首;二是五代取消了此二複合字首,唯將相關字之取碼字形由「⿸厥*」改為「⿱厥*」以致取碼未變,手冊字形則是印刷錯誤。解釋二需要較多巧合同時成立,可能性較低。 查漢文庫典「鷢」、「憠」、「橜」、「蟨」之六代編碼分別為「一廿人片」、「一廿人心」、「一廿人木」、「一廿人戈」,可見取碼所據字形為「⿸厥鳥」、「⿸厥心」、「⿸厥木」、「⿸厥虫」(若所據字形為「⿱厥鳥」、「⿱厥心」、「⿱厥木」、「⿱厥虫」,則應取碼「一廿山片」、「一廿山心」、「一廿山木」、「一廿山戈」),漢文庫典字形圖片顯示「⿱厥*」應屬錯誤。漢文庫典為五、六代共用系統,取碼所據字形相同,又漢文庫典與五代手冊皆屬五代倉頡,絕大部分取碼所據字形相同,因此五代倉頡之取碼所據字形當為「⿸厥*」,再次反駁了解釋二。 總上所述,解釋一顯較解釋二合理,五代倉頡應仍比照三代承認「厥」為複合字首;五代手冊未將「厥」列入複合字首應屬疏漏。
  6. 1994年版三代於字首一節有談及「亥」字特別定義為字首,並有例字「⿱亥月」。五代手冊於複合字首一節未提及此字形,改碼字一節未談及相關改碼,亦無相關字例。查漢文庫典(2003年版五代)將「賌」編碼為「卜女人金」,可見五代不將此字型認定為複合字首。
  7. 朱邦復於《第三代倉頡輸手法手冊》曾提及將「目」定為複合字取「月山」以免取「月一」時與「且」重碼;然而其《第五代倉頡輸手法手冊》主張「目」取「月一」不符合完整原則。本教材採五代之說,不將「目」視為複合字。
  8. 8.0 8.1 《第五代倉頡輸入法手冊》將「Cjrm-p10.svg」列為特殊字,並於附表描述「屯」之取碼是採用輔助字形「七凵」,可知是比照類似「朿」的原則取碼(但有論以為視為「七屮」更佳)。有論以為此特殊字只有「屯」一個應用實例,不將「Cjrm-p10.svg」視為特殊字也能按〈跨越分則〉解釋「屯」的取碼,且加入此特殊字會導致「毛」、「尧」等字取碼有爭議,而主張此字形不應納入特殊字[1]。該說可參,惟其所稱爭議並非不能用其他原則解釋,又考慮不將「Cjrm-p10.svg」視為特殊字的跨越取碼方式與〈跨越分則〉的典型實例較不似,且無法排除未來處理更大字集遇到更多應用實例之可能,此仍從原說將「Cjrm-p10.svg」列為特殊字。


 取碼原則 倉頡輸入法
例外字
特別注意 
取自“”