结语 计算困境

披览述书思万载,有为行事对国民。——集《东汉·张迁碑》字
从计算复杂度的分析中可以看到,计算起来困难的问题,对人的视觉系统却是容易的,计算的困难程度的次序跟人的知觉的困难程度的次序相比,令人困惑地正好相反。拓扑性质检测的困难提示,把人脑的全部思维活动看成“计算”是不恰当的。有可能,决定人类思维过程的原则是跟决定计算机中进行的信息处理过程的原则不同的。[1]
——陈霖
20世纪70年代末全国上下“向科学进军”,尽管在我们媒体的语境中常常不区分“科学”与“技术”以至“工程”,当时的含义可能主要是属于基础研究的。徐迟的《哥德巴赫猜想》发表后,还有不少感兴趣者想将“哥德巴赫猜想”研究推向最终目标,并不时耳闻问题已解决之“喜讯”。为了减少盲目性和不必要的浪费,有前辈指出,那事几十年内无望:尚没有合适的工具,好比我们现在砍伐大树靠电锯,拿切菜刀不行,刀口很快就会韧了。
进入21世纪,随着认识的不断提高,也由于我国社会生活出现了更多迫切需要借助科技解决的问题,“需求牵引”“以企业为主体”被不断强调,而这本身也交织着反复和争论。强调基础研究之重要,自然不能不及其余,何况现在的问题是所谓的基础研究不时“变味”,有些情况下已不符合科学发展规律。而重视工程应用,也不意味着可以“怠慢”基础理论,没有核心方法的突破,就没有本质竞争力。前者以探索自然为使命,甚至由“好奇心驱动”;后者则应该面对生活、面向社会。两种工作有分工,也有交叉。科研工作既要解决问题,又要注意投入产出,尤其技术工作者应面向社会、面向生活。
由于任何根本问题的解决都需要良好的、持续的积累,这使得基础研究、应用研究与最终实现目标相互之间会有很大的距离和空间,往往难以在一开始理清路线和全面把握。于是,如何评判某项工作是否属于朝向既定方向的征途中的一步,抑或是偏离的一段,甚至“指东言西”,就成了现实的尴尬;而眉毛胡子一把抓,滥竽充数、鱼目混珠,以至浑水摸鱼、尔虞我诈的情形,似乎也难以区分。那些不在正常轨道上的“推进”是一种浪费,但“曲折前进”“螺旋式上升”是客观规律,并无“仙人”可轻易指点迷津。这里出现了现实的“悖论”。舆论中不同意见者各执一词,似乎难分伯仲。
爱因斯坦说过:“有些科学家拿着一块木板,寻找它最薄的部分,然后在这些钻孔容易的地方钻了大量的孔,我对这些人是没什么忍耐性的。”[2]诺贝尔奖得主德迪韦(Christian De Duve)说:“我们中的大多数人缺乏洞悉宇宙奥秘的超凡才智,而只能做些为既有科学大厦添砖加瓦的工作。”[3]无论钻厚板还是添砖加瓦,一要真实,“伪科学”不在其中;二要切实,是社会需要的,或者符合科学规律的;三要如实,即使失败也可以有借鉴意义,可怕的是没有任何效果。“所以,选择一个课题不仅要能预见某种隐蔽的但又不是可望而不可即的东西,而且还要对调研者(及其协作者)的能力和这个课题的预期难度进行对比评估,并从人才、劳动和金钱方面对这一课题的成果是否值得所花的代价做出一个合理的预算。”[4]社会对大量那样的“钻了大量的孔”者迟早会失去耐心的。目前的情况是,所谓问题似是而非甚至不切实际,而大家对真正的“骨头”又熟视无睹。
由于人的素质的差异,一定程度上法制的虚设和不同角色利益的捆绑使得科研过程及其评价以一种非直接的,甚至无关联的形式呈现。例如,我国房地产市场,从大片空房可知泡沫的存在,这与政府的视野、开发商的利益、百姓的心理密切有关,但它对就业、经济增长率有积极意义。再看得具体一点,比如建房需要大量的合格的建材,有人在知道钢筋、水泥是现成可用的情况下,可能提出要研制“强度”更高的建材,未雨绸缪当然不坏。不过不失普遍性的是,建材不是强度越高越好,而是要“性价比”高。结果是,符合性价比要求的“强度”更高的材料没有出现,或者只在实验室有少量演示品。此时别人的房子已造好,但隔热材料效果不好,可是别无选择,只能退而求其次沿用原来的——需要关心的“隔热”问题明摆着但没人理睬,而其解决对于舒适度、环保低碳、节能减耗等都有直接影响。科研活动的“允许失败”如果就是这样,纳税人只能摇头了。再如,建造高原高速公路,目的是用公路连接两个高原地区,技术问题涉及气温环境、岩石冻土等,基本要求是克服这些因素带来的困难,而不能忽略这些基本问题而本末倒置地考虑设计上的美观、优雅,因为功能的实现及其可靠性是基本的,即使局部建模及其优化做得很好,但总体不协调,没有实用价值,或实施起来代价太高,纵然是不同于以前的创新工作也只能是“样板”。
美国麻省理工学院的一项研究成果是:由于司机未经协调,总体上会使拥堵“雪上加霜”;从整体上考虑,则平均能将大家浪费在交通堵塞上的时间减少30%,代价是一小部分驾驶者做出牺牲,选择花费更久时间的路线。我们知道,“各选各的”本来就与整体优化无关,而只可能导致更加无序;整体上考虑当然能部分缓和矛盾,但如何或通过什么途径指导大家从全局出发?假设有一部分人愿意做出牺牲,谁来统筹?因此,该项成果的结论是显然的,“效益”是理论上的,而其前提在现实生活中是没有头绪的。当然我们不能怀疑这是一项研究成果。
社会生活中有太多有待切实解决的问题或任务,对此,首要的是有的放矢,而“的”则是解决问题。有可能的话,可以专门花点时间琢磨,与随时的感想相结合,从用户需求开始一步步推进。大到百度,小到小小计步器,有的有其前期的长时间的积累和反复,有的有别人不可复制的地方。有意义的事情不必都要是那种少有的示例,若能最终解决某个问题,则都有值得的。当然,技术只是其中一个部分而已,政策导向、资金投入、团队合作、市场开拓等缺一不可。2015年2月,IEEE的旗舰杂志Spectrum有一个对卷积神经网络的实现者勒昆的专访,勒昆说对于人工智能他是一个乐观主义者,但也是一个现实主义者。他的感触是:“人工智能的研究就像在雾中驾车。看到一条道路并沿其前行时,突然会看到一道砖墙横亘于前。”[5]而宋代的罗点说:“当论其心。心苟不正,才虽过人,亦何取哉!”[6]当然,这里的“心”已非拙著所讨论的内容了。
毛泽东曾这样评价苏联的《政治经济学教科书》的作者:“这本书说的是书生的话,不是革命家的话。他们做实际工作的人没有概括能力,不善于运用概念、逻辑这一套东西;而做理论工作的人又没有实际经验,不懂得经济实践。两种人,两方面——理论和实践没有结合起来。同时作者们没有辩证法。”[7]这种情况远非止于经济学领域。李泽厚曾说:“学院里的时髦理论呢,很大一部分根本与现实生活毫无关系,特别有些所谓后学,玩语言嘛,文本就是一切,对现实生活呢,并没多大影响。中国玩语言,现在我觉得太过奢侈了。”[8]他还说过:“我以为在治学中,选择和判断是很重要的,要培养识别能力,知道什么是真正有价值的,什么是虚有其表,并无价值,不能公说公有理,婆说婆有理,自己没主见,跟着风头跑。”[9]
毛泽东还表示:“对已发表的东西,完全满意的很少。如《实践论》就是比较满意的。”[10]在《实践论》中,毛泽东指出:“实践的观点是辩证唯物论的认识论之第一的和基本的观点。”“而在我为间接经验者,在人则仍为直接经验。因此,就知识的总体来说,无论何种知识都是不能离开直接经验的。”“认识开始于经验——这是认识论的唯物论。”“人类认识的历史告诉我们,许多理论的真理性是不完全的,经过时间的检验而纠正了它们的不完全性。许多理论是错误的,经过实践的检验而纠正其错误。”“社会实践中的发生、发展和消灭的过程是无穷的,人的认识的发生、发展和消灭的过程是无穷的。”“实践、认识、再实践、再认识,这种形式,循环往复以至无穷,而实践和认识之每一循环的内容,都比较地进到了高一级的程度。这就是辩证唯物论的全部认识论,这就是辩证唯物论的知行统一观。”[11]今天读来,无论对于人们普遍的科研活动,还是重视经验的思维建模,都是深刻而富有远见的,一位自称自然科学的“外行”,对科学实验的见解是透彻的。
回到人工智能。在科学探索和社会实践过程中,如果说人类以前制造的工具是其双手的延伸,那么计算机作为代替人脑进行信息处理的工具,是其大脑的延伸,而传感器则是感知器官延伸的深化和具体化。即使有了更为符合人脑思维特征的新型计算结构问世,并不见得就能解决问题。仅有思考机器,没有感知能力,智能模拟在某种程度上就是一个伪命题:有假设,在具备已知条件等前提下可以解题,若假设不成立,解题就是空谈。在实际场景中,大脑可以敏锐地指挥感知器官捕获有用的信息并处理之而使其恰到好处,而迄今为止,关于这样的机制并没有被多数人理解。从物理符号系统到人工神经网络,到进化算法,或者所谓的“智能计算”,有时候实际效果不如经典的统计方法,比较好的统计学习方法就吸收了统计方法的优势。所以,“新东西”未必都有效。比如现代控制理论,论文铺天盖地,方法难计其数,体现了大批数学功底优良、理论基础扎实的科研工作者的智慧和汗水,不过据专家说在不少场合有效的还是经典控制理论的一些方法。方法论对于人工智能的影响抑或就像经典的统计方法在人工智能领域的作用。曾与一位在控制领域做了出色研究的教授谈起中医诊断系统,他说数十年前他就注意到有这类专家系统,现在有大数据,应该不难吧。我说以切脉模拟为例,现在缺乏的是有效的传感器,采集不到有效数据,后面的工作无从谈起,现在所见很多所谓“脉诊仪”就是面临这样的问题,因而实质上与医生的指下感觉相去甚远。这位教授还是认为脉象数据的表征应该不难,将这些数据拿来就可解决问题,我说非常复杂,医生自己都难以说清楚,远非幅度和频率可概括,即便是这样不符合真正要求的数据,目前也很有限。这从一个侧面表明,学界对现实问题的观点与态度均有偏差,而且较为根深蒂固。理论研究做模型当然无可厚非,但“丰满”与“骨感”到底不是一回事。
从实际情况看,目前对下棋、定理证明、计算圆周率等不必与环境交互的任务,计算机的优势非常明显;而对艺术创作、宗教感悟等视觉、直觉,人工智能系统还差很远。不过这种情形并非普适。以计算机辅助诊断疾病与自动驾驶汽车(实际上也是辅助驾驶)为例,他们都与经验有关,显然后者积累所需的时间远少于前者,虽然老驾驶员与新手比是不同的,但他们之间的差别远没有新、老医生之间的差距大。容易被掌握的驾驶技术由于与环境交互频繁,机器模拟确实不易,但与环境无特殊交互的医疗诊断,计算机做起来与人学起来类似,并不简单。是否与环境交互未必是唯一分界线,是否需要很多年积累经验则是非常关键的。
马希文先生说过:计算机不应是也不会是最终的智能机器。人工智能要向前迈进,就不应该把自己局限于计算机的应用。这里指的是以图灵机和可计算理论为背景的现代通用数字计算机。[12]德雷福斯在“计算机不能做什么”中说到,如果有一位高级棋手和计算机搜索能力有效地结合在一起,可以胜过任何人间棋手和计算机棋手。马希文先生还以语言学研究为例指出:……许多研究者都想撇开语言学家的工作,独出心裁,另搞一套。因此,也没有被语言学家接受:你走你的阳关道,我走我的独木桥。真正的问题是:语言学界真正关心的东西恰在河对岸——阳关道到不了的地方。
心电图分析是医疗和生活中常见的、基本的工作,书法创作模拟如书法本身一样是“雕虫小技”。王飞跃先生曾表示:未来的人工智能发展,不应再是只关注“高大上”的工作,而是应讲究实效,面向社会民生,让社会普通大众的智能充分地发挥出来,使智能技术进入生活与工作的每一个角落。[13]
拙著讨论的问题明确、结果直观,只是所谓的计算理论不限于经典的逻辑推理和“计算”而同时关注形象思维和经验。[1]计算机采用的是一套类似于人类语言的形式符号处理系统,首先,问题要能“形式化”,即将用人类的语言描述的用户需求转化成计算机可理解的“话语”,它比平常语言严格,要规范地、一致地、不矛盾地、无冗余地表述。接下来,要“可计算”,即有符合计算机系统要求的计算方法进而描述之,这需要借助各种计算机语言。比如人们每天的生活涉及衣食住行,住在家中,早上起来穿衣、洗漱、吃早餐等,然后出门,走路要符合交通规则,交通工具也要选择。计算方法涉及处理对象、调度流程、存储空间、运行速度等,否则无法一个一个步骤地推进。此外,“复杂性”也是相关联的实际问题,有一个在象棋盘64个格子上按照先后次序从一开始以等比级数(即1,2,4,8,16……)递增摆放米粒的故事,乍听似乎是件简单的事情,实际没人能完成,因为它所需的时间是个“天文数字”,远远超出人的寿命,遥遥无期的计算,理论上可行,实际上无解。超出一定复杂性范围的计算自然就没有实际意义。
“正是每个神经细胞之间的非连续性,这些无数的开关,无数像火车编组站一样的岔道口,使我们的大脑以巨大的变化的可能性为基础,实现了极其复杂的自我组织。”[14]已有的大量“计算”方法,不乏“创新”,也就是不同于以往,但所跨出的步子往往不能缩短与目标间的距离,既对应不了脑内过程又难以解决面临的问题。也许就像本来要向北走,免不了遇到恶劣天气,比如会遇到风沙,气温也较低,就朝东方海边过去了,那里阳光明媚、景色宜人,但距目的地越发遥远。“飞机”能飞行的前提是有空气动力学理论支撑。如果知道关于人工智能的“空气动力学”,相信定会“大异其趣”。然而“道在何方”,当“请循其本”。我们不能离开大脑思维过程本身说事。
陈霖院士指出:“人类视觉系统却具有轻而易举地在视觉过程的初期抽提大范围拓扑性质的功能,人类视觉系统对外界图像的知觉更像是首先从大范围性质出发的,先有图形的大范围性质,比如图形和背景的关系的知觉,然后才有图形局部性质的进一步的识别。”[1]思维不是普通的计算,而是一种高阶的计算。“视觉判断的层次是从整体性开始,越整体的越在前;先拓扑,然后投影几何,而后仿生几何,最后才是欧几里得几何。但人的逻辑思维,以及数学发展却与此相反,拓扑是几何的最新发展。”[15]陈霖院士提出的关于视觉计算与拓扑结构和功能层次模型、认知和智力较之认知的计算理论可能存在基本区别的结论是极富启发意义的。我们现在理解或运用的计算还是初步的。即便如此,就简单的、可理解的思维表现而言,其神秘和美妙已令人心驰神往、心仪不已。
钱学森先生指出:“如果说形象思维是思维学的突破口,那视觉中信息处理及判断就是突击点了。”钱学森先生强调的思维模拟的瓶颈在于形象思维模拟等思维科学论述有待我们后人的具体化、实例化,而领域经验是沟通形象思维与抽象思维的一个“抓手”。我们当不能指望超越历史发展阶段和技术进步水平的方法。但如古代伟大的都江堰工程,李冰父子以火烧山,极大地提高了开发效率,这是智慧的体现,而没有要求特殊的技术手段。智能模拟若干关键过程的相互关系如下图所示,有待不断深化和完善。它以实践(面向实际问题的实验)为基础,在知与行不断交互的平面上螺旋上升,从而在立体空间中获得一个个阶段性成果。其基本要素是应用需求、领域专家、有代表性的数据和知识工程师,研究者据此实践进而解决问题。

以专家系统为中心的智能模拟各关键过程的相互关系。箭头框表示发展过程,实线箭头表示由下而上的支撑,双向虚线表示互相的或明或暗的影响:人工智能面临的困境以及这种困境引起的对人工智能的反思。从人工智能出发的一个经典应用领域是专家系统,它逐步发展为知识工程。知识工程中的知识获取、表达和推理是瓶颈问题,这与经验密切相关。从经验出发,隐性知识的形式化是核心问题,它决定了完整的思维模拟的可能与否,这里强调整体思维的特征与作用,那是计算机辅助分析得以有效的保障,从而是人工智能显现其作用的具体化。人工智能的困境,既是研发而致的现实问题,也是其本身固有的矛盾
当下,科学技术日新月异,与计算机、人工智能密切相关的量子计算的突破过程正在加速,人们有望看到以崭新机理与面目出现的计算机,若有那么一天,对计算本身、对承载其上的人工智能而言那都将是革命性的。“有人说大脑可能是量子计算机,它的直觉、意识和问题求解能力可能依赖于量子计算。这也许是对的,但是我没有看到任何证明以及任何令人信服的论证。我的赌注是,如果把大脑看作计算机,那么它应是传统的计算机……”[16]我们现在能依靠的依然是冯氏结构计算机。
我们不会停步。分析面临的问题,寻找不同的道路,探索可能的方法,获得崭新的启发,既是我们的期待也是我们的义务。
王安石有《登飞来峰》诗:
飞来峰上千寻塔,闻说鸡鸣见日升。
不畏浮云遮望眼,只缘身在最高层。
登高不仅为了望远,更重要的是努力把握本质、抓住核心、统揽全局而不让一叶障目。
《往生论注·上》有句“智断具足,能利世间”。人工智能的终极目标也是利世益民。