在匹兹堡和逻辑与语义一起旅行
(这是袁陈杰逼我写的,微笑脸)

NASSLLI是什么暑期学校?
每两年开展一次的NASSLLI是北美语言学、逻辑学界非常重要的暑期学校,课程围绕形式语义、形式语用、逻辑学与计算机理论的,在欧洲地区有个对应的一年一度的暑校ESSLLI(European Summer School of Logic, Language and Information)。这个暑校一般有一到两个星期,课程从从早上九点到晚上六点,课业密集且难度较高,每天的课程之间会有1~2个小时的coffee time和student session,可以供博士生们和大牛教授们社交。NASSLLI几乎所有课程对基础的逻辑学与计算机理论都有一定的要求,包括但不限于:命题逻辑(propositional logic)、一阶逻辑(first order logic)、模态逻辑(modal logic)、模型论(model theory)、证明论(proof theory)、算法与算法复杂度(algorithm and computational complexity)等等,所以与会者大多是在读博士以及大学教授。
今年的NASSLLI在卡内基梅隆大学(Carnegie Mellon University)举办,卡内基梅隆大学是北美乃至全球最重要的计算机科学与人工智能的研究中心之一,坐落于五大湖地区的匹兹堡,所以这次的暑期课程都在阴雨绵绵中度过,天气略糟糕。

要问我是如何知道这个暑校的?
嗯,就是因为它太有名了,这个圈子里面几乎无人不知无人不晓;为什么要去?因为大牛教授多,还有各个学校的博士博后,课程内容也非常和我心意,形式逻辑化的同时又贴合语言、对话与认知的实际,也可以了解到在计算机应用时的可行性。这个暑校可以让我好好利用暑期的时间为未来的学习和科研做准备,我是非常开心能够集中一个星期学习这样的内容的。我也会去参加八月的ESSLLI,第三十届ESSLLI在保加利亚的索菲亚的大学(University of Sofia)举办,感兴趣的朋友现在还可以报名,I would be really glad to meet you this summer!
今年的课程安排是什么样的呢?
NASSLLI的主要课程分为四个板块:逻辑与认知(Logic & Epistemology),逻辑与计算(Logic & Computation),计算语言学(Computational Linguistics)以及语义与语用(Semantics & Pragmatics)。除了这四个板块以外,还有周末四门课程的bootcamp,以及学术前沿话题的拓展 workshops。
逻辑与认知:逻辑与认知一块关注认知逻辑(Epistemic Logic),学界以由范·本森(Van Benthem)教授带领的阿姆斯特丹大学(University of Amsterdam)的逻辑、语言与计算研究院(Institute of Logic Language and Computation)是此领域的先锋研究团队。认知逻辑关注用逻辑刻画人的认知,描述个人或者多人在不同场景和应用下是如何获取信息的,新信息对他们现有的知识体系会产生什么影响,新的知识体系如何促使和影响他们作出决定、进行下一步的动作,在信息不完备的情况下如何做决定等待,这其中的影响参数也包括时间、对过去知识的记忆、团队合作、共同知识背景等等,是个非常复杂而有趣的话题。认知逻辑将人的认知形式化处理之后,计算机就可以依据此作出推演与计算,这个领域在目前的人工智能、人机交互中有较多应用。这个领域的相关知识包括逻辑学(几乎所有逻辑框架)、认识论(epistemology)、概率论、拓扑学、算法与算法复杂度等等。

逻辑与计算:逻辑与计算关注逻辑学和数学对信息处理与传递的刻画,以及信息处理的复杂度。这里的信息处理可以是关于如何处理noisy data,如何用数学工具处理不确定性;这里的复杂度来自于用逻辑刻画问题后找到问题的答案、或者验证一个答案是否正确所需要的时间与空间,算法的时间复杂度是指给出一个问题,算法计算这个问题所花时间相对于问题长度之间的相对增长速度,算法的空间复杂度是指算法在运行过程中临时占用存储空间大小的量度。这个领域的相关知识包括逻辑学(几乎所有逻辑框架,尤其是证明论)、统计学、概率论、算法复杂度等等。

计算语言学:计算语言学是时下非常火爆的一个领域,语言学系下的计算语言学在很多大学有着对应的计算机系下的名称:自然语言处理。由于语言超强的灵活性,很多语言学家、计算机科学家包括数学家都在放弃以规则的方法处理语言,而转向大数据与统计。传统的语言学对自然语言进行规律总结,形成规则形态的知识库;而目前计算语言学则建立可以反映语言使用情况的语料库,在语料库中通过统计(尤其是机器学习)对自然语言建立统计模型,训练语言模型,利用得到的模型建立算法从而处理语言。这个领域所需要的知识:大量编程、统计学(机器学习)、概率论等等。

语义与语用:语义和语用是本次暑校的核心关注点,关注解释、建模、处理自然语言与对话(或者纯形式语言,比如说罗素)的语言学家、逻辑学家、计算机科学家、哲学家、数学家各显神通,用不同的方式处理自然语言。语义学关注局部含义的组合性质、真值条件等等,研究语句的字面含义,逻辑学是形式语义学最核心的工具;语用则从更广的角度考虑语句在实际应用时产生的“语义”变化,这些变化常常是context-sensitive的,所以上下文、对话双方的认知、目的等等都在讨论围之内。语义和语用曾经界限分明,它们的区别可以归结到乔姆斯基的能力与表现的区分(competence vs. performance)上,语义学研究一种语言能力,而语用学则研究人类的具体语言表现;而八十年代开始语义学有所转向,慢慢讲语境等等考虑进语句的“含义”当中。现在的语义学理论明显分为两支,一支完全不允许语境的影响,要求解释者除了指称词和消歧义以外完全靠拢字面所述,这一类理论称为minimalist semantics。还有一支则允许语境的影响,认为语境在语义解释里有着不可磨灭的作用,甚至有学派认为“完全跟从字面意义的语义含义是不存在的,语境无论如何都会影响语义”,这一类理论被称为contextualist semantics。目前的形式语义学也大量地用逻辑系统刻画语境等等。

今年最喜欢的一门课程是逻辑与认知版块下的“多模态系统的认知与策略逻辑(Logics for Epistemic and Strategic Reasoning in Multi-Agent System)”,讲师是来自斯德哥尔摩大学(Stockholm University)的哲学教授瓦伦丁·葛兰科(Valentin Goranko)。

多模态系统常用来刻画计算机与社交网络、机器人、动态市场等常见现象。理论上而言,多模态系统是一个包含了多个自主(autonomous)且理性(intelligent)的agents的交互系统,这些agents互换信息、规划和设计个人或团体策略以实现目标。逻辑学在多模态系统当中的应用相当广泛,它可以刻画知识、交流以及策略性推理。多模态系统的逻辑最基础的需要多模态认知逻辑(multi-agent epistemic logic),比single-agent的认知逻辑多了三个算子(operator):K_A, D, C




模态、可能性、策略方案、时间、状态记忆等等信息都可以基于这个逻辑发展刻画出来,多模态系统在完备信息(complete information)和不完备信息(incomplete information)下的不同策略,完全记忆与不完全记忆下的策略,策略与变动信息与知识的交互,等等等等,都是这个系统关注的问题。
它可以刻画一些epistemic puzzle,例如“三个脏小孩(three muddy children)”问题:假设A、B、C三个人的脸上都可能有泥,第四个人对他们说:“你们三个至少有一个人脸上有泥”,这三个人看不见自己只能看见对方,问他们会知道自己脸上有没有泥吗?需要多长时间?
也可以刻画策略性puzzle,例如:假设有n个线性排布的洞穴,有一个小偷为了躲避追捕躲,躲在其中一个洞穴,每天他可以换到紧挨着的左边的或者右边的洞穴,警察可以每天随机抽取一个洞穴检查,只有小偷恰好在警察当天检查的洞穴里警察才算抓到小偷,问警察最少需要多少天可以抓到小偷?n有上限吗?当n大于多少的情况下小偷永远不可能被抓住?
其次比较好玩的课程还有逻辑与计算板块下的“刻画自然语言的逻辑、以及自然语言本身的逻辑(Logic for Natural Language, Logic in Natural Language)”,讲师是来自印第安纳大学伯明顿分校的数学教授劳伦斯·莫斯(Lawrence Moss)。我们在Consem读书会的读书会活动中曾经读到过他的论文《Natural Logic》。

语义学家一直关注自然语言是如何做推理的,逻辑学家和语言学家们一直在创造不同的逻辑系统刻画自然语言,不断更新不断修补,试图将自然语言翻译成合理的逻辑语言,在我们定义的逻辑语言上做推理得到符合自然语言的结论。最初的逻辑系统是三段论,三段论逻辑是非常简单的,只包含所有(all)、没有(no)这两个量词(quantifier),它的充分与完备定理的证明也很容易,算法复杂度非常低,是log-time-complete。当我们加上“一些(some)”、“大多数(most)”、数词等不同量词,再加上及物动词、ditransitive verbs、relative clause等等更复杂的语法结构,只要这个逻辑系统没有到达包含超过一个变量的一阶逻辑这个逻辑系统,它都是可判定的,当然了,算法复杂度会随着语法结构的复杂化而增高(我们下篇文章会详细阐述这个问题)。

以上的逻辑系统中,我们会关注这些逻辑系统的是否充分且可靠、是否完备、算法复杂度多高,逻辑系统本身产生的理论会非常复杂、问题也多。但是讲自然语言翻译成符号语言做推理是唯一的方案吗?劳伦斯·莫斯教授目前从语言的极性(polarity)与单调性(monotonicity)开始,不再进行繁复的翻译自然语言的工作,而是通过parse的方法标注语句中词汇的极性,然后根据这个来做一些基础的集合论推理。例如:虽然目前,这样的推理完全无法解决很多自然语言的推理问题的,比如说无法解决常见的free choice phenomenon、modus ponens等等,但是这个方案的好处就是不再进行繁复的翻译工作,而只是通过标注给出可能的合理推理。目前我们需要知道这个方案可以如何进行扩展,可以覆盖多少自然语言的推理,这是个有趣的话题。
剩下的课程,计算语言学板块下的“计算语用学(Computational Pragmatics)”关于理性语言行为模型(rational speech act model)非常有趣,用贝叶斯概率来模拟对话场景下的对话双方的语言表达,讲师是来自于斯坦福大学的语言学教授茱蒂丝·迪根(Judith Degen)。“形式语义及其语用的哲学起源(Formal semantics and pragmatics, and their origins in philosophy)”,讲师是来自密歇根大学的哲学教授里奇蒙·托马森(Richmond Thomason)以及来自耶鲁大学的哲学系教授佐尔顿·萨博(Zoltan Szabo)。