人工智能(AI)领域有一句戏言,“有多少智能,就有多少人工”。因为当下AI算法的数据,依然必须靠人力标注,简单而言就是输入了怎样的数据,就会得到与之相应的结果。因此人工智能也可能出现类似人类对性别、宗教、种族的偏见,也就是所谓的“算法偏差”。

我国政府近期针对疫情,启动的预警系统──“动态参与热点识别系统”(HIDE),通过数据推算,预测特定地点或场所是否为潜在疫情热点。然而,新措施的一推出,即引起社会的热议,这不只是因为执法上的仓促和混乱,更有一些质疑HIDE系统存有疏漏和瑕疵。

譬如,马来西亚购物中心协会、零售商公会等组织就指出,政府根据过去7天所收据的MySejahtera数据,把一些商场列为潜在热点,是有所偏差的。因为现实中,有部份民众是没有使用MySejahtera系统登记,而是手写登记,这部份数据无法反映到系统里,进而将影响整个结果。

同时,这些组织也表明,从感染群上言,商场的感染率比工厂、社区和工地的比率还低。依据卫生部的数据,工厂、社区和工地比率分别为48%、12.5%和11.6%,反之,商场的感染率为4.78%。https://www.orientaldaily.com.my/news/nation/2021/05/06/409807

此外,一些批评指出,HIDE系统设计若有问题,其所做出的假设也将存有错误,这不仅无法阻止病毒传播,反之对已受到严重打击的企业和人民的生活,雪上加霜。

这也是为何尽管国防部长宣布列为HIDE热点的商店暂时关闭3天时,沙巴州政府却宣布,他们会在加强管制,确保商场的民众遵守防疫的标准作业程序(SOP)下,允许该州3个列入HIDE的商场继续运作。

不过,从更宏观层面而言,只要运用得当,人工智能在新冠疫情当下,的确能在维护公共卫生安全、辅助医疗诊治方面,发挥重要的作用。如许多国家就通过人工智能、大数据等技术对民众的交通、出行等数据进行分析和追踪,进而建构出疫情发展的趋势,从而采取应对措施。

在美国更有一家生物科技公司Biobot Analytics通过“废水”数据的采集和分析,快速预测新冠疫情在某地的发展趋势,进而让公共卫生机构可以提前做好防范的措施。目前,在美国就有超过400个的城市,大学和工业区使用该公司的服务,检测范围覆盖了美国10%以上的人口。该公司更因此获美国著名的商业杂志《快公司》(Fast Company),评选为全球最具创新力的50家公司。

这也表明了,在人工智能运用上,须与人类有“智慧”的结合,反之将陷入因数据缺乏关联,资料无法兼容的“数据孤岛”困境,甚至结果上的偏差。因此,我国HIDE系统引人非议,除了有执法上的仓促外,是否也反映著我们长期以来在种族、宗教和官僚主义笼罩下的“算法偏差”?

林建荣