韵离合指数公式的改进

您所在的位置:网站首页 软中华一条尺寸 韵离合指数公式的改进

韵离合指数公式的改进

#韵离合指数公式的改进| 来源: 网络整理| 查看: 265

孙芬和我聊起押韵问题,说我以前用的方法是有问题的。我觉得她说的有道理,于是记录下来。

张建坤一个统计表格

如果张建坤的统计没大问题的话(当然,他这个张表格有很多小问题,暂且不表),那么霁韵完全和山攝入声屑、薛韵没有关系,即是韵离合指数等于0,但是祭韵和屑、薛韵的关系却不可忽视。其中祭薛韵离合指数超过50.

1、假如仅是霁、祭之间通押,他们不和其他韵通押。霁韵自押韵次24,祭韵自押韵次43,霁祭通押韵次26,那么根据朱氏韵离合指数公式计算出来的霁祭韵离合指数是59.2。

2、假如仅是霁、祭之间通押,祭韵还能和第三个韵通押。除此之外,祭、霁不再和其他韵通押。暂且把第三个韵叫山入。假设祭山入通押的韵次为54,其他数据同1。那么计算出来的霁祭韵离合指数66.8。

第一种情况和第二种情况霁、祭之间通押的数据完全一样。而第二种霁不和山入押韵,祭和山入有比较多的押韵,理应第二种情况霁、祭关系更远一些。朱氏韵离合指数公式很不合理,韵离合指数不降反升。

可以改进公式来衡量两个韵的押韵相似度。用 Z_{x} 表示x韵的字次, Y_{xy} 表示x,y的韵次。字次、韵次用朱的定义。用 R_{xy} 表示全部押韵数据中,x韵字连着下一个韵字是y韵字的总次数。所以

Y_{xx}=R_{xx}

Y_{yy}=R_{yy}

Y_{xy}=R_{xy}+R_{yx}

把所有与a韵或b韵有押韵关系的R按照相同的顺序列出来,构成a的押韵向量 V_{a} = (R_{aa},R_{ab},R_{ac},...) 。b的押韵向量 V_{b} = (R_{ba},R_{bb},R_{bc},...) 。可以把a,b两韵的押韵相似度定义为 V_{a} 与 V_{b} 的角相似系数 Sim_{ab} 。

Sim_{ab}=1-\frac{2}{\pi}\times arccos(\frac{R_{aa}\times R_{ba}+R_{ab}\times R_{bb}+R_{ac}\times R_{bc}+...}{\sqrt{R_{aa}^{2}+R_{ab}^{2}+R_{ac}^{2}+...} \quad\times \quad\sqrt{R_{ba}^{2}+R_{bb}^{2}+R_{bc}^{2}+...}})

理论上如果a与b的押韵完全无别,则 \frac{R_{aa}}{R_{ba}}=\frac{R_{ab}}{R_{bb}}=\frac{R_{ac}}{R_{bc}}=...

南朝韵文的押韵,一般都是避免同一韵段中出现相同的韵字。这使得建立百分百适合一种数学方法来计算是非常复杂的,甚至几乎不可能。白一平卡方属于不放回模型的。如果用放回模型的,会比白一平卡方稍微适合一点用在南朝这类韵文的押韵。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3