基于认知机理汉字智能造字探讨

更新时间:2024-04-20 点赞:20988 浏览:94695 作者:用户投稿原创标记本站原创

文字信息化是信息化的重要内容,现有的中文信息处理主要基于字库方式。基于字库方式的中文信息处理系统,以汉字作为信息处理的基本单元,这种方式基本满足了社会的主要需求,但还存在以下不足:(1)难以形成规模适度又长期稳定的国家标准和国际标准;(2)不符合汉字造字规律和不能很好地传承中华文明;(3)不符合汉字教学认知规律,与现行的汉字教学脱节;(4)不能全面满足社会的应用需求,(5)信息熵高,信息处理效率低。信息化智能化是时代的特征,认知科学是探究人类智能本质的学科,智能科学和认知科学的发展,为解决汉字信息处理存在的问题提供了可能的研究方法和解决途径。本文将智能化技术与认知科学的研究成果相结合,对汉字智能造字的理论和方法做了深入研究。主要研究内容和研究结果如下:(1)在对汉字传统造字理论和汉字认知机理深入分析基础上,把传统造字理论和认知心理学的原型理论结合起来,提出了基于认知机理的汉字智能造字理论,指出汉字智能造字的内容和研究任务。在上述研究基础上,以点集拓扑学为数学工具,建立了汉字智能造字模型,并设计了汉字智能造字的计算机体系架构。(2)深入分析了与汉字原型相关的研究,得出汉字部首和汉字部件是汉字原型主要来源的结论。在此基础上,提出了兼顾传承文化,方便使用和兼顾计算机处理效率的汉字原型提取原则。结合汉字原型提取原则,以独体字和《辞海》中的部首为汉字原型的初次试验集,通过汉字原型拼组实验,采用实验、分析调整、再实验的循环优化流程来研究汉字原型的提取。依照上述流程,以GB18030-2000中的27484个汉字为实验集,进行汉字原型的提取实验,得到覆盖全体实验集的汉字原型阶段性集合一个。实验结果表明本文提出的汉字原型提取流程可行并具有推广性,可推广到其它实验集的汉字原型提取研究。原型提取实验的成功,在一定程度上验证了基于认知机理的汉字智能造字的可行性。(3)在对汉字结构相关研究进行深入分析的基础上,针对现有的汉字结构分类方法的不足,提出了一种以图形层次为基础的汉字结构分类理论。根据上述汉字结构分类理论,以原有13种汉字结构类型为基础,提出18种汉字结构分类方法.以GB2312-80和GB18030-2000为实验集,进行汉字结构分类实验,实验结果表明18种汉字结构分类方法的有效性,完全覆盖实验集。从计算机信息处理的角度出发,建立了用于汉字结构的识别的网格数学模型,并以GB2312-80为实验集,结合本文提出的18种汉字结构分类方法,设计了基于网格数学模型的汉字结构的计算机识别实验,实验结果表明了汉字结构分类的正确性。(4)结合编码理论,深入分析了汉字认知机理和汉字的传统使用习惯,制定了汉字编码的研究目标。在上述研究基础上,提出“汉字结构+汉字原型”的汉字编码方案。方案采用汉字结构分级编码的方法,符合汉字学习者的“先整体后局部、先大后小,从上到下,从左到右,先外后内”的认知结构。按照上述汉字编码方案,以GB18030-2000收录的27484个汉字为实验集,结合计算机辅助实验软件,采用优化调整的实验流程进行汉字编码实验研究。实验结果表明,按本文提出的汉字编码方法进行编码,得到的汉字编码结果集无重码,汉字编码的均匀码长少于5,汉字编码包含汉字的所有特征信息,达到预期的目标。(5)根据汉字智能造字实验的需求,分析了汉字智能造字实验平台的系统需求,给出了汉字智能造字实验平台的技术方案,在Linux操纵系统上实现了汉字智能造字实验平台。【关键词】:认知智能造字汉字原型汉字结构汉字编码
【论文提纲】:摘要5-7Abstract7-18第一章绪论18-291.1认知科学181.2汉字信息处理发展及述评18-261.2.1基于字库的汉字信息化19-241.2.2基于造字的汉字信息处理思想萌芽24-251.2.3智能造字思想的产生25-261.3本文的主要思想26-271.4本文的主要研究内容及结构安排27-29第二章智能造字理论研究29-432.1引言292.2汉字传统造字理论29-312.3汉字认知机理31-342.3.1汉字的认知心理学解释312.3.2汉字教学认知机理31-322.3.3汉字认知学习机理32-342.4基于认知机理的智能造字研究34-352.5智能造字数学模型35-392.5.1点集拓扑学知识简介35-372.5.2智能造字数学模型37-392.6智能造字的体系结构39-422.6.1造字知识库40-412.6.2造字处理模块41-422.6.3外部接口422.7本章小结42-43第三章汉字原型研究43-553.1引言433.2与汉字原型相关的研究述评43-453.2.1偏旁部首43-443.2.2汉字部件44-453.3汉字原型的实验研究45-543.3.1汉字原型的提取原则463.3.2汉字原型的提取实验方案46-493.3.3实验结果及分析49-543.4本章小结54-55第四章汉字结构研究55-844.1引言55-564.2汉字结构相关研究述评56-604.3汉字结构分类研究60-684.3.1汉字结构分类理论60-684.4汉字结构的计算机处理研究68-824.4.1网格数学模型68-714.4.2基于网格的汉字结构分析71-724.4.3基于网格的汉字结构计算机描述研究72-814.4.4实验及结果分析81-824.5本章小结82-84第五章智能造字的编码研究84-985.1引言845.2编码基本理论84-885.2.1编码任务84-855.2.2编码的性能要求85-885.3汉字编码的认知机理88-895.4汉字编码研究89-975.4.1研究目标895.4.2编码规则89-935.4.3汉字编码实验流程93-945.4.4汉字编码实验94-965.4.5实验及其结果分析96-975.5本章小结97-98第六章基于LINUX的智能造字实验平台98-1076.1引言986.2系统方案98-1016.2.1功能要求98-996.2.2技术方案99-1006.2.3体系架构100-1016.3实验平台基本系统方案设计101-1056.3.1显示子系统101-1036.3.2输入子系统103-1046.3.3编码处理子系统104-1056.3.4造字子系统1056.4智能造字实验操纵举例105-1066.5本章小结106-107结论107-109参考文献109-118附录1汉字原型118-119附录2汉字编码119-120攻读博士学位期间取得的研究成果120-125致谢125
相关文章
推荐阅读

 发表评论

共有3000条评论 快来参与吧~