数据驱动语言学的理论基点
成果类型:
期刊论文
署名作者:
刘海涛(1)
署名单位:
(1)复旦大学外国语言文学学院,上海200433
刊物名称:
中国社会科学
ISSN/ISSBN:
1002-9779
发表日期:
2025
页码:
184-203
关键词:
语言
数据
线条性
系统性
概率性
摘要:
数智时代的语言学研究应基于真实的语言数据,从人类语言的本质出发,并充分吸取已有语言研究中的可用成分。通过语言数据挖掘语言规律具有必要性和可行性,而线条性和系统性则是数据驱动语言学的两个基点。数据驱动语言学将语言视为人驱概率系统,围绕人类语言的概率性特征,挖掘语言的线性规律与系统结构模式,探究线性词链和二维网络结构的关系,秉持数智时代语言研究同时关注人与机器的语言观,在“数驱”和“数基”的双轮驱动下,采用系统科学的方法,力图发现人类语言系统的运作规律并考察这些规律在人工智能等领域的适用性,进而形成科学的“言语动力学”。这可以为构建可解释的人工智能和深入理解人类语言系统的运作机理贡献力量。
来源URL: