AI的话题近来大热。拥有不同知识背景的人纷纷从各自理解出发,尝试探索其工作原理,揆度其辅助人类开展各类搜罗资讯、归纳要点、编制文档的能力。按我的理解,人工智能与语言的关系,大抵是工具与对象的关系,而且这个关系同时可以理解为技术与人性的深度结合。
在人类过往的历史中,信息技术的每一次进步,都深刻地改变了人类的生存处境。有人认为,随着人类语言能力的趋于成熟(约10万年到5万年前),人类社会的模型就大致按照“社会协作强化—生存空间扩张—生态干预升级”的路数发展。为了克服语言的局限性,人类克服种种困难,发挥各自聪明才智,先后发明了象形、表意和表音等不同的书写系统,使得“口说无凭”的语言有了符号化的形式。诚然,文字是一宗伟大的发明。没有文字技术,光靠口头传承知识,小到纳米技术大到航母巡游都是不可想象的。不过话说回来,人类思想的深邃程度和知识的深广程度,也是和语言共生的,“语言和思维是同一件事的两个方面”。没有语言的发展,就没有文明的进步,也不会有今天科学技术和社会进步的成就。
人类说话的能力(体现为“口头性”)很不简单,不过学术界对口头性的认识,是书写性形成之后很久的事情。有了书写技术,人们才重新认识口头性,研究口头传统逐渐成为人文学术的一个专门领域。至于文字,作为从语言中生长出来的符号系统,它的独立性和系统性都是相对的。当然,语言和文字的媒介属性不同。雅各布森说,音声符号在时间维度中展开,视觉符号在空间维度中展开。这种彼此不同的时空属性,就让这两种不同的信息技术具有不同的运作规则。它们之间的密切合作,极大地促进了人类知识的积累和创造力的涌现。
在以往的人文学研究中,学者对语言的认知,倾向于注重其工具性维度,多少忽略了使用者在语言使用中留下的痕迹。比如语言的文学性使用。伟大的作家通常都被认为是语言的巨匠,他们在文学作品中呈现出来的个性化语体风格,往往成为他们艺术造诣的重要表征。在个人风格之上,有时还会呈现出地域性聚集现象,如20世纪上半叶的京派和海派文学的形成。民间口头文学则呈现出不同的样貌,在学术研究中,其地域的、方言的语体风格会被仔细标注,但极少有人会认为在无文字社会或口头性占据统治地位的社会中,口头诗人也可能拥有其个人化的语体风格。思想家本雅明说,一个民间的故事讲述人就如同一个陶器工匠会在陶坯上留下痕迹一样,会在其故事讲述中留下自己语体风格的痕迹,所以故事讲述人本质上是一个“匠人”。本雅明的高明之处在于,他敏锐地意识到,即便是社会成员共享和通用的工具如语言,仍然会因为使用者的不同,而具有其工具的标准化和通用化之外的个体性因素。这触及语言的另外一个属性:语言是思维的外化形式,而思维是语言的内化运作。人的大脑不是一个容器,听到什么就能够复述什么。听来的信息要经过内化,消化吸收之后,才能再讲述出来。语言表达是身与心的同步调用。既然每个个体都是独特的存在,每次讲述当然也就是独特体验和感悟的表达。这也就是“帕里-洛德理论”所说的,口头诗人每次演述的都是独一无二的“这一首歌”。
在漫长的语言演化进程中,无数使用者的艺术创造力和诗性智慧都渐次沉淀在口头传统中,极大地丰富了人类语言传统的宝库。所以,迄今为止的人类语言,以其难以想象的丰富性和复杂性,在承载人类一切思想和知识成果的同时,也给人类带来了诸多困惑。语言是人类的创造物,但又似乎是外在于个体的存在物,它以多种方式对人施加种种影响。“萨丕尔-沃尔夫假说”就推定,语言会影响使用者的思维模式和对世界的认知。这就是说,语言不仅是“载体”,是“物质外壳”,还是“塑造者”。
当人们把脑海中的想法以文字形式写在纸上时,就是通过将语言符号化和外化,进入了信息传递流程。那么,在推进脑机接口的今天,语言的规律、符号的特性、介质的形态都发生了新的变革。语言能力是人类生物进化形成的信息交流方式,而书写技术和印刷技术则更偏重工具和技术进步层面。来到数字媒介技术时代,生物性和技术性之间的界限重新变得模糊了——脑机连接在方向上是打通生物性与技术性之间壁垒的试验。至于能否成功,在我看来,很大程度上取决于我们对语言的深刻理解。人工智能的核心交互媒介是语言,语言在丰富性上是远大于文字的。举个例子:在口语交流中,特定表情和腔调配合特定语词,就会产生多种不同的意思。光靠识别和读取文字,人工智能无法正确理解说话者的意思。长期从事口头文学研究的学者都有这样的经验:在语词艺术的演述中,那些言近旨远的表述,比兴的精妙用法,“传统指涉”(traditional referentiality)的抽象法则,“俭省”(thrift)的构造轨范,程式性“大词”(bigger word)的随时调用,都是口头艺术家的拿手本领。在这种本领的加持下,艺术家所营造的是一个多彩斑斓的世界。在这个世界里,意义是在“协商”和“共谋”的关系中完成传递的。表演者或旁敲侧击,或直抒胸臆,或皮里阳秋,或爱憎分明,听者或莞尔,或颔首,或捶胸顿足,或前仰后合,演述人的个中委曲,受众已悉数了然,交流达臻化境矣,这种了无滞碍的交流之默契,目前的AI显然还无法做到。
总之,人工智能目前主要通过文字材料来理解世界,这面临很多挑战。人类的语言更侧重口头性、听觉、过程性、互动性等维度,而文字与视觉、空间、符号化等相联系,所以在言与文的两种交流之间还有鸿沟。若是让我展望的话,我认为AI的未来,在多模态AI(multimodal AI)系统中,通过大量视觉(如识别表情)和听觉(如分析语气)的训练和积累,应该能逐渐弥补目前AI在解读“弦外之音”等微妙处时的短板。
(作者系中国社会科学院学部委员、内蒙古大学特聘教授)
《人民政协报》2025年9月29日第12版 学者笔谭