阳光肺科

 找回密码
 立即注册

微信扫码登录

[象形输入法] 象形输入法:编码规则

[复制链接]
miosolar 发表于 2020-8-26 20:59:38 | 显示全部楼层 |阅读模式

马上注册,阅读更多内容,享用更多功能!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
象形输入法的编码原则参考表形码、三维天然码4.0版和晶晶码(包括黄东航先生在此基础上改进的根形快码),因此不少字根相似,但与这三种输入法的字根和编码方式仍有较为明显的不同。三维天然码和晶晶码均存在规则较多的问题,而三维天然码更存在字根不统一的问题。为此,象形输入法尽量减少编码规则,统一字根,简化输入。
象形输入法字根表

单字编码规则
象形输入法基本上是按笔顺取字根编码,每个字的码长不等,最多四码,超过四码以上的字则按书写笔顺取前三码再取末尾一码的规则。不够四码的字,除单码让给一级简码外,其余二或三码的字均以压空格键结束。
拆字取码规则
五笔输入法和郑码输入法的拆字原则为随后出现多数输入法效仿,天然码和晶晶码也几乎没有例外。象形输入法的取码原则顺延郑码输入法、天然码和晶晶码的拆字原则,基本上是按汉字的书写顺序,取大优先,兼顾直观。码长不固定,最多四码,超过四码以上的字则采用“前三末一”的规则。
在输入汉字时,首先得将汉字拆成几个字根,汉字拆分时必须遵循下面几个原则:
1.独笔画不可分原则。即在汉字拆分时不可以将一个笔画分做几个部分。如“果”字不可以拆成“田”和“木”,而只能拆成“日”和“木”。
2.书写顺序原则。即按照“从上到下、从左到右、从外到里、先中间后两边”等书写顺序原则进行拆分取码。
3.取大优先原则。就是尽量从整字着手,选出笔画较多的字根。如“矢”是上下结构,“失”是独体字结构,前者拆为“年字头”和“大”,后者取大拆“气字头”和“人”。“天”是上下结构,“夫”是独体字结构,前者拆为“一”和“大”,后者取大拆“二”和“人”。
4.能连不交原则。即一个字如果既可以拆成两个相连的字根,又可以拆成两个相交的字根,则应拆成两个相连的字根。如“天”字,正确的拆分是“一大”,而不是“二人”。
5.兼顾直观原则。汉字拆分要直观、自然,例如“园”,拆分为囗、二、儿,全码为gzw。“且”,拆分为月、一 ,编码为nt。“具”,拆分为月、丌,全码为nk。可,拆分为丁、口,编码为jo。
万能查询键
“[”键。
在输入合法的任何外码后,键入“[”键,系统会在重码选择区显示以这个有效开始编码的汉字或符号序列。“[”代表一位编码,多位查询可键入多个“[”。与五笔中z键性能一致,但五笔因此而浪费了一个键。因考虑对Z键功能利用,因而将其转向[。而且这个键较为接近手指,只要稍抬起即可用。
在使用象形输入法编码时,如果不知道某个字的某个码位是什么字母,就可以用“[”键代替。这相当于一个通配符的作用。例如“啊”的编码是OPJO,如果你不知道其中一个码元(又叫字根)是什么字母,可打OPJ[,或OP[O,或O[JO。例如,你不知道“啊”的第二个码元是什么,那么按O[JO后,提示行中会出现一组符合条件的 词和字。这时你可以用提示的数字键选择所需要的汉字。当用模糊码混合编码出现的重码词和字超过一显示页时,可以翻页查找。当屏显提示出现所需的汉字时,用数字键来选字。若翻过了页,可向后翻页找回头。
用结合模糊码的方法来输入汉字时,至少要包含有一个字母,在windows9x/me/2000上还要以字母带头。
重码字的处理
输入法必然存在重码,需要通过较为理想的办法加以区分。象形输入法采用了五种方法进行区分。

数字序列提示选择
首先,象形输入法采用数字序列提示选择。如果你要输入的字是最前面的一个字,你除了可用该字前的数字来选字之外,还可以用按空格键来选择此字上屏。或继续输入下一个字而使该字自动上屏。
字频
其次,根据字频,象形输入法也出现同码组时,一般较常用的字是排在最前,两码字的同码组中排在第二或第三以下的字。
结构码
汉字的一个重要特征就是其结构,以结构来减少重码是非常重要的。参考天然码和晶晶码,象形输入法采用结构码来进一步区分重码字。
我们把常见字的结构分为独体字结构、上下结构、半包围和包围结构、左右结构共四种。分别以结构码A(独体字结构)、B(上下结构)、C(半包围和包围结构)、U(左右结构)代表。从字母的形状可方便记忆。
但即使如此,仍有一些两码字出现重码,我们对这类同码字可同时加上结构码和声母来减少同码。当然,这只是用于较常用字时,允许在打完两码后用结构字母隔开再打该字的声母来达到盲打而不用选字的目的。有些三码的同码字可加上声母来减少同码。有些四码的字(或词组)在打到三个码时,同码序已是排第一,可压空格结束使该字(或词)上屏。从而减少同码机会。
注意:ABCU这三个型码不是每个字都加,只是当您想打的那个单字不出来时才加,而在您打词组的时候,就根本不用型码。建议您在掌握了单字的基本打法之后,应该尽量使用词组输入。
A:表示“杂合交叉型”:包括单体字(乙、了等)。
史OXA,井zna,十xa,
B:表示“上下型”:
冬avb,旮xbb
当web,若hxo 苦hxob
C:表示“包围型”:
处arc,尼ptc,左下包围
丹ni 凡nvc,匹cwc,中间包围
囚gac,全包围。
U:表示(左右结构)
仁czu
粒xdu

当然在实际打字过程中,由于“作”出现在候选窗的第一位,可不必打识别码,而“投”打四码后就可直接上屏,不必用数字键选字,达到盲打的目的。
参考天然码和晶晶码,象形输入法采用结构码来进一步区分重码字。我们把常见字的结构分为独体字结构、上下结构、半包围和包围结构、左右结构共四种。分别以结构码A(独体字结构)、B(上下结构)、C(半包围和包围结构)、U(左右结构)代表。从字母的形状可方便记忆。
在两码字中,所有第一码字根与第二码字根为上下关系的,则是上下结构,此时识别码象形取B。
所有第一码字根与第二码字根为左右关系的,则是左右结构,此时识别码象形取U。
所有第一码字根与第二码字根为半包围和包围关系的,则是半包围和包围结构,此时识别码象形取C。
所有第一码字根与第二码字根的关系既不为上下关系、左右关系、半包围和包围关系的,则是杂合结构,此时识别码取A。
左右结构和上下结构很容易识别,现对杂合结构及半包围结构作如下详细说明:
  ①凡字根相交的字均为杂合结构。如“夫”、“隶”等字。
  ②由单点笔画字根与其它字根构成的双根字均为杂合结构。如“术”、“太”等字。
③与“辶、厂、广、疒、尸、户、勹”等字根组成半包围型的字均为半包围结构。如“边、历、库、句”等字。
以上是象形输入法的识别码,总体而言象形输入法的识别码容易、直观,学会后不需思考就可迅速击出正确的识别码来。不需象五笔字型那样,去计算出识别码的区号和位号,再找出对应的识别码来。这样大大减轻了脑力思维、加快了录入速度。

下角笔画识别码
参考自天然码。
对于单根字和偏旁部首,采用字根键位+补充码(q)+补充码(q)+数字键的方法,利用这两个“q”将单字分开。其中偏旁部首最后加偏旁补充码(p),由于偏旁部首的使用率很低,因此并不会有太多的干扰。而对于较为常见的单根字,则注意通过调整顺序,以减少重码。


所谓下角笔画就是字的最下角所在的笔画,如有双下角,优先取右下角。下角识别码分为复笔识别和单笔识别两种,其中复笔识别优先。当所需用识别码汉字的下角不属复笔识别码时,使用单笔识别码。

①复笔识别码

所谓复笔识别码是由两笔画以上组成的识别码。根形码复笔识别码只有一个:口,包括凡四角整齐的方形(包括长方形)如口、囗、日、目、白等复笔识别码均取“口”字字根编码O为识别码。

例如:

古、泪 下角识别码为 O

②单笔识别码

即由单笔画构成的识别码,一律取该单笔画字根编码为识别码。如:

V→丶(点)

T→一(横)

I→丨、亅(竖)

J→丿、、フ、乛(撇)

L→乀、∟、乚(捺)

Z→乙(折)

S→ㄅ(折)

M→ㄋ(折)

例如:

寸 下角识别码为亅→I

未 下角识别码为丨→I

有 下角(右)识别码为 →J

丸 下角(右)识别码为 乙→Z

粒 下角(右)识别码为 一→T

注意:与“辶”组成的双根字的末笔画取第一个字根的下角笔画作为识别码。如“连”字的下角笔画为“丨”。




单根字的输入
单根字即选作字根的成字。
单根字的输入有两种方法可选:
方式1 字根键位+空格结束
方式2 字根键位+结构码+空格结束(用于“已”和“己”)。
方式2 字根键位+结构码+下角笔画识别码
方式3 对于偏旁部首:偏旁定位码(u)+偏旁补充码(p)+偏旁补充码(p)++字根键位

象形输入法的单根字很少,多数是常用字。
两根字的输入
方式1:第一码+第二码+空格结束
方式2:第一码+第二码+结构码+空格结束
方式3:第一码+第二码+结构码+下角笔画识别码
结构码优先,下角笔画识别码最后(原因是转换较为复杂)。
绝大多数的两根字只有两码:第一个字根 + 第二个字根
  好:女 + 子    rz
利:禾  +  刂     pnu
粒:米 + 立 + 左右结构      xdu

三根字的输入
方式1:第一码+第二码+第三码+空格结束
方式2:第一码+第二码+第三码+结构码
方式3:第一码+第二码+第三码+下角笔画识别码
结构码优先,下角笔画识别码最后(原因是转换较为复杂)。
只有当在三码仍有重码时才加用其他码。
四根字的输入
第一个字根 + 第二个字根 + 第三个字根 + 第四个字根。
座:广 + 人 + 人 + 土    jay
有些四码的字(或词组)在打到三个码时,重码序已是排第一,可压空格结束使该字(或词)上屏,从而减少重码机会。
多根字的输入
            第一个字根 + 第二个字根 + 第三个字根 + 最末一个字根。
  输:车 + 十 + 人 + 刂    txan

一级简码字
一级简码字,是选择26个高频常用字,分别以26个字母键的编码代表,一字一码。输入时,按所代表的字母键(或符号字母键),再打一个空格键,即可输入。26个字母键所代表的26个高频汉字都是按各字首码对应的。见字母与象形输入法字根表和单码字表对照总表。

二级简码字
象形输入法有很多字是自然二码和三码字,所以可减轻了记简码的负担。编制简码字的目的,就是为了提高输入效率。使用时,只要记一下简码表中编入那些常用字就可提高输入这些字的速度。当然,如果你记不清或忘记了的简码字,可按正常的取码规则输入。二级简码字,是将一些原来是三码或四码的常用字,取各字编码的前两码作为简码。输入时,打了简码之后,再打空格键,加快简码字输入,并减少与其他四码字的干扰。
词组编码规则

词组编码是把词组分为双字、三字、四字和五字以上的多字词组。不管几个字词组,一律编为四码。词组输入和单字输入之间无需换档。

1.双字词
双字词的词组编码由所含的两个汉字各取前两码组成。如果其中的一个字为单码字,则此字重复。如今I 工、A人,则在“工人”一词中重复iiaa。
例如:
汉字:氵又宀子  srmz
思维:田心纟亻  gwwc
金属:人十尸丿  axpj
工人:工工人人  iiaa

对于可能出现重复的词,采用更改编码的形式。
如:重新(tbdl)因为与“更新”有重复,故容码为:tzdl,避免了第二个重复字,以第一个非重复字的末笔编码为第二码。

2.三字词
第一、第二字各取前一码,第三字取前两码。
例如:
国务院:国夂阝宀  gdpm
办公室:力八宀厶  dnmu
计算机:讠木几  ikln
3.四字词
取每个汉字的第一码。
例如:
科技人员:禾扌人口  tfao

4.多字词
五字以上的词,取前四个字的第一码。
例如:
中华人民共和国:中亻人民  qcap

给我们建议|手机版|阳光肺科 ( 粤ICP备2020077405号-1 )

GMT+8, 2024-11-24 19:31

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表