近年来,基于深度学习和机器学习等人工智能技术赋能许多科技产品强大的智能化功能,许多老牌公司和新创企业纷纷加入开发人工智能驱动产品的行列,深怕落单、被竞争对手拉开距离,甚至是被时代淘汰。然而,对人工智能的投资一般无法在短期内获得财务报表上的回报,个中缘由究竟为何?

来自美国矽谷Andreessen Horowitz风险投资公司的马汀.卡萨罗(Martin Casado)和马特.博斯腾(Matt Bornstein)撰文分析,人工智能业务一般具有较低的利润率,并且面对扩展性(scaling)和防御性(defensibility)挑战。无论如何,这类局限往往起源于业务所欲著手解决的客户问题,而非AI技术本身所促成的结果。

“驯服”数据长尾效应

文章指出,数据驱动人工智能(data driven AI)当前最大的挑战是──真正的人工智能企业在扩大人工智能模型的应用时,大多数的资源都需要投注在“驯服”数据的长尾效应(taming the long tail of data)。

根据《中文维基百科》,“长尾”或“长尾效应”(The Long Tail)一词,最初由著名美国科技类杂志《连线》(Wired)的总编辑克礼斯·安德森(Chris Anderson)于2004年于自家的杂志中,引用来描述诸如亚马逊(Amazon)、奈飞(Netflix)和Real.com/Rhapsody之类的网站之商业模式。“长尾”指的是那些销量小但种类繁多而不受到重视的产品或服务,由于累积起来的总量巨大,总收益超过主流产品的现象。

据报道,当前的机器学习技术不能很好地处理长尾数据分布(long-tailed distribution)。 最广泛应用的机器学习技术--监督学习模型(supervised learning model)往往在处理常见输入时(即数据分布的开头部分─the head of the distribution)表现良好;但在遭逢示例稀疏,处于数据漫长尾端分布(the tail of the distribution)状况的时候,表现不佳。

避免错失潜在客户

由于数据分布的长尾部分通常构成输入数据总和的绝大部分,因此,机器学习开发人员陷入了一个无止尽的循环──不断地收集现实操作环境中的新数据来对模型进行再培训,以便应对稀疏的边缘情况(edge case)。这些用户输入状况虽然相当细琐和罕见,然而,忽视数据的长尾分布却可能是致命性的,导致企业错失潜在客户、让用户沮丧等。

追根究底,这一切源于拥有庞大用户的AI活在漫长的长尾分布中(AI lives in the long tail)。 许多AI应用程序都有开放式界面,并且能够处理杂乱的非结构化数据(例如图像或自然语言等)。 更糟糕的是,用户通常对产品缺乏认识,假定产品具有人类水准,甚至是超越人类的能力。 这意味著用户倾向输入不常见的指示来试探AI系统的能耐,造成边缘情况无处不在。

马汀.卡萨罗和马特.博斯腾认为,以严格的传统定义来说,现下大多数的人工智能系统不全然是软件。其结果是,人工智能业务不是纯粹的软件业务,不享有“一次制造,多次销售”(build once, sell many times)软件商业模式。它们还需要仰赖持续性的人力支持,以及可观的可变成本(material variable cost)。这些特征在某种程度上使AI驱动业务感觉上更像是服务业。

更准确的说,AI驱动系统的商业模式,很大程度是由软件和服务(运营)所组成的业务。这与传统的软件业务不同──输入的范围和输出的结果可预期,营运、销售还有获利的模式稳定性高。长尾效应对AI系统所带来的种种边缘状况,需要人类员工及时插手纠正,或促使公司成立机器学习营运团队(MLOps)全天候待命处理或回应系统问题,才能使AI系统健壮(robust)。

纵使投资和经营AI科技的公司得面临许多难以预见的产品开发以及业务营运方面的挑战,许多企业仍旧决意保持投资力度,这是因为数据驱动人工智能的能耐:它能够让不同企业迎合扩大规模(scale)和不扩大规模(unscale)的商业动机。

《麻省理工学院斯隆管理评论》(MIT Sloan Management Review)近日在推出2020年夏季阅读清单时,重提一篇发表于2018年,题为《规模的终结》之评论报道。评论称,一个多世纪以来,规模经济(economies of scale)的盛行使得大型企业成为理想的业务引擎。 但是现在,在人工智能的推动下,一大批重要的崭新技术正在翻转规模经济。未来世纪的业务或许将由小规模经济主导,规模经济侧重以大占优的局面将会逐渐消失。

该篇评论建议,企业可以通过以下三种方式在无规模经济(economies of unscale)中继续发挥作用:

1.成为平台。文章举例电力公司可以采用平台思维方式,并将其电力网(power grid)转变为能够支援数千个小型能源生产商的系统。大型银行则可以成为小型、具针对性金融服务应用程序的平台。无论如何,文章也澄清并非每家公司都必须成为平台,否则便消亡。反之,成功的平台策略为企业在不再讲究规模的时代提供了一条突围的路径。

还有就是,客制化的平台能够为平台的参与者(platform participants)提供实用的资讯系统前后端架设,让众多使用平台的企业倚靠平台便捷的功能维持日常营运,产生强大的用户粘性(customer stickiness)。这也是为什么AWS云服务成为亚马逊的利润引擎的原因。 事实上,AWS云服务的营业利润率超过20%,比起亚马逊零售业务的个位数营运利润率表现更佳。

另外,著名科技趋势评论人本尼迪克特.埃文斯(Benedict Evans)在分析了亚马逊的获利方程式后发现,亚马逊网站上60%的销售额是其实是通过第三方市场业务获取的。亚马逊的第三方服务允许其他公司在其网站罗列产品,并通过亚马逊的仓库运输商品。亚马逊再向使用这项第三方市场平台的商家征收费用。

2.绝对的产品聚焦(Instill absolute product focus)。在无规模时代,大公司应该看起来更像是一个由众多小型企业组成的网络,每个企业都绝对致力于制造出适合其市场份额的产品。

3.通过动态重组来取得增长。无规模经济中的赢家,能够让每个客户感觉自身像一个独一无二的市场。公司为每个个体户量身定制的产品和服务,将击败放眼大众市场的一般消费商品和服务。一旦公司了解某个产品的特定客户,公司可从其产品组合中,为该客户准确筛选、推介并提供其他符合顾客意向的产品。而大公司可以通过AI演算法,为每个客户把量身定制的产品捆绑在一起,提供一揽子个性化的产品或服务。

综上所述,基于统计学的机器学习和深度学习AI技术的强项是涉猎广和深还有细,如果应用得当,能够帮助企业灵活的游刃于规模经济与无规模经济之间。

余福祺

7字辈,毕业自马来亚大学电脑科学系,从事软件测试工作,喜爱钻研人工智能以及互联网科技最新动态,也是隆雪华堂民权委员会委员。