本文旨在讨论当前流行的大数据驱动AI技术之局限。建基于神经网络(Neural Network)技术的机器学习(Machine Learning)和深度学习(Deep Learning)驱动应用程序, 在相对正常的环境下获得持续性的数据供应时,能够准确地模拟和预测快速变化的动态世界。 可是,当罕见的突发状况破坏了正常规律并终止了可靠训练数据供给时,机器学习和深度学习模型便无法再准确地预测世界,并为下一步行动布局提出可靠的建议。

谷歌人工智能科学家兼深度学习开发框架Keras创建者弗兰科伊斯科勒(Francois Chollet),好几次尝试通过各种传播媒介警惕世人:算法(Algorithm),或被统称为“AI”的技术,将逐渐成为我们与日益充塞资讯的世界接口的唯一界面。

他在半年前的一次播客访谈中,对当前以深度学习(Deep Learning)为主干的人工智能风潮发表了以下看法:

1.深度学习模型非常脆弱(brittle)、非常耗费数据(extremely data hungry)、并且不能推广来概括(generalize)数据分布(data distribution)以外范围的演算。

2.认为现有的深度学习技术代表了人工智能所有的潜力和发展结果是错误的。不论是从构造(construction),或者是建模的训练(training),深度学习要做的是查找过去的数据并执行数据的“插值”(interpolation)。这充其量只能实现局部的概括。这些深度学习系统可以稳健地完成它们训练有素的工作,可以理解它们之前所看到的内容,可以解决创建者计划之内的不确定性。但是,真正的智能需要的不仅仅是“插值”,它更需要外推来实现广泛甚至极端范围的概括(extrapolation)。

或许,弗兰科伊斯的见解,已经对日益倚赖数码科技进行风险评估和日常决策的各国官方和私营机制,无力稳妥应对新冠病毒对经贸供应链所带来的冲击,做出了最好的诠释。

《麻省理工学院科技评论》就屡次指出过度依赖数据的人工智能系统之短处,包括在近期的每周人工智能通讯中以《即便拥有海量数据,人工智能无法预测所有事物》做为标题,也在同期通讯的结尾部分引述一位纽约大学教授的看法:“人工智能算法的短处是,它们无法理解在危机爆发时刻,世界已经发生改变。往好的方面来看,贪婪的算法对已发生的改变无所畏惧。”

在前些时候,《麻省理工学院科技评论》每周人工智能通讯也摘录了《纽约时报》一篇报道的评论:“没有算法能够预测到这由新冠病毒恐慌所引发的超乎异常抢购时刻,以致酿成了几百种家庭必需品的供应短缺。”

封闭系统凌驾人类

我以为,前国际象棋世界冠军卡斯帕洛夫(Garry Kasparov)认为人工智能只能在明确定义问题的封闭系统中表现卓越甚至是凌驾人类,是对当前人工智能系统能耐的中肯评价。

卡斯帕洛夫曾在2018年一项由国际商用机器(IBM)赞助的对谈会上点出,许多专家认为可以自动把机器在一个封闭系统(closed system)中所积累的专业知识,轻易的转移应用到其他开放式的系统(open-ended system)的看法是错误的。

他表示,在每个人类已经清楚定义问题参数(problem parameter)和问题边界(problem perimeter)的封闭系统中,无论是下象棋、玩围棋、玩电子游戏(如Dota),还是其他任何事物,机器都将表现得格外出色。但是,如果面对的是一个诸如现实世界般的开放式系统,那么机器将无法确定要问(解决)的正确问题是什么。

综上所述,我认为现有的人工智能技术在新冠病毒持续肆虐全球的非常时刻显得患得患失,仍在尝试寻找适当的立足点是有迹可寻的。

第一、人类通过所采集和供给人工智能系统的数据,把自己的视野局限、主观认知、偏好和偏见内置(build in)在人工智能的算法(algorithm)和建模(model)里。因此,由于人们在全球瘟疫爆发的初始阶段都低估了新冠病毒的连锁效应,大多数的人工智能系统也就没有及时获得有助于做出正确判断结论的数据。

第二、如我去年8月曾撰文指出的那样,大数据或许能够帮助人工智能精算出下一步决策布局的最佳选项,但无法准确精算出最终结果。与系统封闭、边界明确、条件相对稳定的一般人工智能系统截然不同的现实世界,本就是多原一果和多原多果的混沌生态;再加上这是光速年代,变数太多、变幻太快,我们很难以传统实验室里头的假定(譬如一些常态永不变化,一些条件不会对实验对像起作用等),来准确区隔(isolate)现象、条件、成因和结果。

第三、《世界经济论坛》一篇题为《AI可以帮助解决冠病危机─但人类正确的提示是关键》提醒,人工智能有潜力协助人们解决由新冠病毒引发的燃眉危机。然而解决方案不会仅是科技,还包含负责驾驭人工智能系统之人类的知识与创意。文章作者不留情面的表示,新冠病毒危机将会暴露人工智能的重大短处,这是因为当前主流的人工智能形式──机器学习,以发掘过往训练数据的规律为操作方式。这类的人工智能系统需要大量高度相关的针对性数据,并假定以往应验的方案在未来同样会收效。

新冠病毒疫情却早已把我们引入前所未有、 没有先例可循的变局。我们每一刻所面临的处境,很可能与几周前的状况截然不同。换言之,过去行之有效的方案今日很可能已不再成立。

虽然人类与人工智能所面临的局限性没有什么不同,但是人类具备从多变的环境中吸取教训,将其应用于新状况的快速学习与实践优势。 反之,人工智能不具人类见微知著、举一反三的能耐;每当设置或任务发生微小变化时,人工智能系统必须大费周章从新学习来掌握具体的状况。

因此,在瞬息万变的危难时刻,人工智能系统需要更多人类专才的介入与调整,并综合其他渠道的结论,来达到“人机互补”的协同效应。

余福祺

7字辈,毕业自马来亚大学电脑科学系,从事软件测试工作,喜爱钻研人工智能以及互联网科技最新动态,也是隆雪华堂民权委员会委员。