10.3969/j.issn.1674-3202.2012.02.001
如何让电脑真正懂汉语?——一种以许慎的“六书”理论为母型的汉语处理模型
哲学家塞尔曾指出,任何一台处理汉语输入的计算机都不能够像真人那样理解汉语,因为计算机无法获取汉语表达式的语义内容。他的这个论证,既预设了语义学和句法学之间的二分,而且也预设了一种外在论式的语义学观点。上述两个预设在本文中都会受到挑战。首先,本文将采纳一种内在论的(并且是准整体论)的语义学进路:根据此进路,意义完全可以在不直接牵涉到和外部对象的关系的情况下而被带入语义网。此外,本文所试图构建的语义学模型也不是句法驱动的——换言之,在该模型中,并没有任何语义中立的原则可以告知系统,复合语义是如何从“原子”语义中生成的。毋宁说,“原子”语义之间的亲和性,便己然在复合语义的构成中扮演了枢纽性角色。需要指出的是,关于语义融合的语义学难题,绝非当代语言学家和语言哲学家的专利。实际上,它早在东汉学者许慎的“六书”论中就己得到触及。根据许论,只要一个汉字的构件的语义得到了其它汉语表达式的恰当注解,该汉字本身的语义也便可得到确认。在本文中,许慎的“六书”论将以一种可计算的方式而得到系统化的重构,而该重构的技术基础则是王培先生发明的“纳思系统”(非公理化推理系统)。在这种重构基础上,现代汉语中语词的语义复合方式,也可以得到一种新颖的理解。
自然语言处理、纳思系统、六书、汉字
5
B81(逻辑学(论理学))
王培先生认真审读了本文初稿,并提出了很多批评意见.本项目研究,得到了霍英东教育基金会第12届青年教师资助项目121095;复旦大学“985工程”三期整体推进人文学科项目201IRWXKYB038;以及全国优秀博士论文后续资助项目200701
2012-12-01(万方平台首次上网日期,不代表论文的发表时间)
共49页
1-49