跳转到内容

User:中日韩越的汉字/关于排序

维基百科,自由的百科全书

排序法则:

1.先按照汉字的音序顺序(大陆普通话)来排序,拉丁字母或者数字开头的放在末尾(先数字后字母),若有非拉丁字母的文字则按照罗马化来排序;

2.按照第一个字的拼音的拉丁字母来排序(u和ü一般混同,只有混同时不能区分才ü排在u后);

3.音节相同的就按字的声调“阴平→阳平→上声→去声→轻声”的次序来排(另见关于轻声字);

4.第一个字读音相同,就按第二个字的读音来确定(不管第一个字是什么,同音字混排。若第二个字是数字、拉丁字母或其他字的就在汉字后面排序),以此类推;

5.只有读音完全相同才可按每个字的笔画数顺序排序(简体),按照《GB13000.1字符集汉字字序(笔画序)规范》。

备注:

1.这里要强调的是,读音完全相同才逐字按笔画数排序,如第一个字都读shí的,就按照下一个字的读音时间”、“食品”、“时速”、“石头记的顺序排好,而非石头记”、“时间”、“时速”、“食品的笔画次序,详细请见下文的“关于同音字”。

2.另外,对于字的读音有异读或者不易确定的,一律按照《普通话异读词审音表》规定读音来确定(如“粳米按照jīnɡ mǐ而非ɡēnɡ mǐ来确定”,“密钥按照mì yuè而非mì yɑ̀o来确定”),对于部分生僻字词以及易念错的字则会进行相应地注音;

3.下方的列表当中,翘舌音(R除外)以及音节字母为Yu开头的用粗体字表示(目的是方便排序以及查找,且可纠正方音),而对于声母J Q X而言,尖音斜体表示,团音正体表示(目的是这三个声母的字比较多,要通过方言音——《广韵》为基础——来分开,如“剑”和“箭”)。

关于同音字

[编辑]

传统词典的汉语拼音排序是一个字一个字的进行比较,只有第一个字相同时第二个字才可有排序的资格,然后是第三个字、第四个字……以此类推。

这在笔画排序上是没有太大问题的,因为字形都是固定的,不会发生变化,但在拼音排序上就容易产生问题,因为汉语的同音字有很多,而又说是拼音顺序,则不能因一个字读音确定了而直接进行字形上的排序(当然是间接,指的是每个字读音都一样时才可给字形排序)。

既然是“汉语拼音次序”,那么应当以拼音为排序的载体,像下面一些词组的排序:

平安(pínɡ ɑ̄n

苹果(pínɡ ɡuǒ

平面(pínɡ miɑ̀n

屏幕(pínɡ

萍水(pínɡ shuǐ

瓶子(pínɡ zi

前面都读pínɡ,显然要从第二个字开始排序。如果把这几个词按拼音顺序念出来的话是比较通顺的,再比较:

平安

平面

苹果

屏幕

瓶子

萍水

同样也是拼音排序,但这个排序法常出现在词典上,明显是第一个字相同才能比较第二个字(同音字常按笔画排序),念出来的话是感觉没有顺序的。

这一点日语、韩语的词典做得好,它们备注的汉字只是起到备注作用,主要还是按照五十音或者谚文排序,然后就是假名或谚文相同的按汉字字形排序。

汉语的词典产生这样排序的原因是古代主要是典,需要注解的字用大字形表示,这样的习惯也沿袭到我们现在的词典当中,显然不可能出现正规的拼音排序(因为是一个字一个字来的)。

因此,为了改掉这个影响排序的规则,我干脆直接按拼音排序,对不对,除非读音完全相同。

百度百科条目韵部排序规则

[编辑]

为便于研究音韵学的韵部及古入声字的分布情况,我将百度百科条目按照最后一个字的韵母分类,详情见User:中日韩越的汉字/百度百科条目索引