ChatGPT掌握现代汉语书面语的句长规律了吗?
本文用兰卡斯特汉语语料库中15种书面语体的文本研究了汉语整句、小句单位长度的关系,并比较了其中3种语体文本与ChatGPT生成文本的句长分布.结果表明:现代汉语书面语的整句和小句符合语言中相邻层级单位的长度关系规律;ChatGPT生成的汉语文本基本符合自然语言句长的概率分布与单位层级规律,但在遵循省力原则、语体区分能力等方面同真实文本尚有差距.大语言模型已经获取了一些自然语言中的统计规律,但还没有完全掌握真实文本中一些细节特征.
现代汉语、句长分布、语言普遍性、语体差异、ChatGPT
TP391(计算技术、计算机技术)
教育部人文社会科学研究项目22JJD740018
2024-09-26(万方平台首次上网日期,不代表论文的发表时间)
共11页
124-134