科普对话 | 与AI共舞的语言学
发布时间:2025-12-15 10:11:14 浏览量:34
“语言学的学科经验,让我能更轻松地理解人工智能的一部分原理和问题”,在北大中文系语言学实验室博士生葛睿祺看来,语言不仅是人类沟通的工具,更是解读人工智能当代发展特征与问题的重要“密码”,为探寻智能底层逻辑、理解AI提供了不可或缺的视角。从高二暑假参与北京大学夏令营时对语言学产生的朦胧兴趣,到决定直博满足自己对于语言学更多的求知欲,再到实习时选择与自己研究课题密切相关的“数字人”领域进行业界实践,她的专业实践轨迹始终致力于探索语言学与人工智能的深度共鸣。语言学基石:从语言现象中探寻普遍规律睿祺对语言学专业的兴趣萌生于高二暑假参加北京大学夏令营时。从中文系古典文献学的漆永祥老师那里,她了解到北京大学语言实验室在进行唇腭裂儿童的治疗与语音康复项目,这使她对语言学产生了浓厚的兴趣。同样是基于对语言学的兴趣和探索欲,在本科和直博阶段,她选择了语言学方向。“在读博的五年时间内找到一个自己感兴趣的语言学领域进行研究,让自己的好奇心得到更多的满足,是一个比较理性的选择。”在她看来,语言学解读文本的方式不同于中文系其他专业,它更多是根据现象总结规律,再基于规律去解读更多的现象。葛睿祺曾与老师同赴云南西双版纳、德宏等地进行民族语言的田野调查。通过调查与比较,他们发现当地存在汉语与民族语言逐渐融合渗透的情况:阿昌族60岁的语言者,更加完整地保留着少数民族语系统;但在30岁发音人的语言表达中,母语词出现得更少。“在调查的过程中,我实际地看到了语言是人类生活载体的作用,语言的发展情况和人们的生活发展情况息息相关。”语言承载着民族对世界的认知模式,也是一种文化思维密码。语言学应用:数字人的“手势贫瘠”与“语调生硬”当前兴起的人工智能行业同样映射了语言学的发展程度,在修读林幼菁老师开设的“语篇分析”课程时,葛睿祺了解到人类是如何在自然口语中进行语言使用的,也因此对语言对话中的手势研究产生了兴趣。在她看来,即使目前AI数字人的发展如火如荼,大部分数字人依然处于“手势贫瘠”的困境中,还无法与语义进行耦合。“在剥离了语义的情况下,我们会发现批量商用的数字人的手势动作大部分都不够自然。”在日常生活如图书馆、博物馆的数字人引导中,语言学研究已经证实了在长对话的情境下加入更自然的手势,有助于听众去理解,肢体语言提供的信息可以丰富语言信息本身的信息量。针对“AI发声为何生硬”的问题,葛睿祺指出病根在于训练材料的先天不足。语调存在两种含义:一种是词汇意义,重音位置承载了词汇意义,同样一句话因重音的不同会改变含义;另一种是情绪意义,语调曲线传递情绪信息,体现出开心与悲伤不同情绪时声学参数的整体差异。目前的商用产品或多使用独白的语音来训练声音合成模型,这使本身的录制材料就不够丰富,训练数据缺乏真实、丰富的语境,导致在真实对话中存在的语调变化、起伏无法呈现。语言学发展:人工智能与新文科的破界之路通过语言学的学习,葛睿祺对人工智能语言大模型的底层原理更加清晰。“它为什么可以实现上下轮的对话?从经典语言学角度来说,人类的语言都有一定的基本规则和结构,AI学习了语言单位的联合出现概率,并根据过往的对话轮次,希望复刻真实的人类对话。”进行语言学的研究,可以更好地理解AI能做到什么、目前AI不能以及为何不能做到什么。作为国内交叉学科的前沿探索,北京大学语言研究实验室正在酝酿设立“语言学-AI”交叉专业,葛睿祺认为“人工智能需不需要我们这批文科生?”这个问题尤为关键。由于人工智能的发展结合了语言学、心理学、数学等多方面的研究背景才发展到今天的地位。作为面向人的应用,人工智能无法脱离文本语言,语言学研究在未来人工智能的推进中具有特殊性作用。而要进行“语言学-AI”的本科生培养,葛睿祺认为业界实践和编程课程非常重要。“一定要让同学们了解到现在业界模型的发展现状,带大家去入门了解当前的AI进展”。最后,对于文学创作、新闻写作当前面临的人工智能冲击,葛睿祺对于人类特有的原创体验性、材料即时性进行了肯定。对AI替代文科的忧虑,她给出锋锐见解:“新闻现场采访、作家个体经验转化等‘符号-现实’强关联创作,仍是AI难以逾越的壁垒——它只能重组既有符号,但当下还无法即时接入幽微的生活现实,因此也无法产出基于特殊经验的新认知。”符号世界与现实世界的关联和转化是人类在生活中体验、感悟的成果,这部分是AI抢不走,也无法替代的一部分。本文来自【北京大学】,仅代表作者观点。全国党媒信息公共平台提供信息发布及传播服务。
