3.1.1 固定搭配字符 ......................................... 28
3.1.2 共现字符 ........................... 33
第四章 规则的总结和验证 ............................ 44
4.1 规则的总结 ........................................ 44
4.1.1 相关概念 ......................................... 45
4.1.2 流程设计 ............................................. 48
第五章 结 语 ........................... 57
第四章 规则的总结和验证
4.1 规则的总结
上文中一共总结了四种类型“你看”的 17 个规则,分别为:
1.规则一:“你看”的固定搭配形式若符合行为义“你看”固定搭配字符集1,则为行为义“你看”。
2.规则二:如果符合“你看”+行为义“你看”固定搭配字符集 2,则“你看”是行为义;如果文本中固定搭配是“你看”+行为义“你看”固定搭配字符集 2+行为义“你看”固定搭配字符集 3,则“你看”是话语标记;如果文本中固定搭配是“你看”+行为义“你看”固定搭配字符集 2+行为义“你看”固定搭配字符集 3+行为义“你看”固定搭配字符集 4,则“你看”是行为义。
3.规则三:当固定搭配“你看问题”后加“就是、在于”时,“你看”是话语标记,否则为行为义“你看”。
4.规则四:当“你看”后的固定搭配字符符合排歧字符集时,“你看”是话语标记。
5.规则五:当“你看好”“你看上”后为语气词/y、代词/r、人名/nr、姓氏+名词/snr+n时,“你看”属于行为义;当“你看中”后接语气词/y、代词/r、人名/nr、姓氏+名词/snr+n、助词/u 时,“你看”属于行为义。
6.规则六:当“你看”下文中的共现字符符合行为义“你看”共现字符集 1 时,“你看”属于行为义。
7.规则七:当“你看”上下文的共现字符中出现“给+/r、/nr、/snr(+n)+看”时,“你看”大概率上是行为义。
................................
第五章 结语
本文主要描述了日常交际中“你看”的四种使用类型,通过观察语料特征,总结出各种类型“你看”的使用规则,根据这些规则设计相应的规则集和流程图,最后使用验证语料人工验证规则的准确率。
本文将“你看”分为行为义“你看”、认知义—征询标记、言语义—话语标记、其他类四种类型。从语言学的角度来看,“你看”的类型有行为义“你看”、认知义—征询标记、言语义—话语标记三种。本文分别总结了三种类型“你看”的义项和使用特征。行为义“你看”具有一定的概念意义,表示让对方用眼睛看,多表祈使。表认知义的征询标记“你看”处于“你看”的行为义和言语义的过渡阶段,常接有疑而问的问句,要求听话者做出相应的回答。征询标记中,动词“看”的意义由行为域发展到认知域,“看”的意义发生虚化,“你看”可看作一个标记使用,但因其保留认知义的义项,不可看作完全意义上的话语标记。因此,作征询标记的“你看”兼具行为义和话语标记两种类型的特征。表言语义的话语标记“你看”是动词“看”由行为域虚化到言语域的产物,“你看”已经没有任何概念意义,在句子中只有程序意义,具有灵活性强、可删除等特征。话语标记“你看”存在的意义主要体现在其语用功能上。本文面向中文信息处理,结合实际语料,增加了其他类的“你看”,包括“你看”的介词短语、兼语短语、连谓短语等用法。
通过观察语料,本文从词性和词串两方面分别总结了行为义“你看”的共现字符集和固定搭配字符集,征询标记“你看”的共现字符集和后连接字符集,话语标记“你看”的前后连接字符集,其他类“你看”的前连接字符集,共制定出十七条可供使用的规则。为提高识别准确率,本文将这些规则的顺序打乱,重新设立规则的优先级,通过实验得出查全率、查准率、F 值均在 90%左右,实验证明识别结果比较理想。对实验结果进行反思,得出行为义“你看”中现场性极强的一类规则的提取是提高机器识别准确率需要特别努力的方向。
参考文献(略)