AI核心研究是否取得突破进展存争议

2020-06-24 13:45:49    来源:科技日报

“目前人工智能论文数量激增,泥沙俱下,导致部分论文质量不高,但这并不能说明人工智能发展停滞不前,而是表明目前有更多的研究人员投入到了这个火热的研究方向。”

最近几年,在人工智能领域,从基础算法到落地应用研究成果不断涌现,其中致力于人工智能落地的应用成果尤其突出,目前人工智能许多子领域的系统在性能上已经满足了具体应用场景的落地要求。

但这能说明人工智能领域的核心创新存在明显进步吗?近日,《科学》杂志刊登的一篇标题为《人工智能某些领域的核心进展一直停滞不前》的文章,对目前人工智能的研究成果提出了质疑。作者马修·赫特森指出,研究员声称的核心创新只是对原算法的微改进,新技术与多年前的旧算法在性能上相差不大。

近几年人工智能领域快速发展,其应用场景不断拓宽,为何该论文却认为人工智能某些领域的核心进展停滞不前?当前人工智能的核心创新是否已经触及了“天花板”?就此,科技日报记者采访了有关专家。

AI核心研究是否取得突破进展存争议

具体来说,《科学》杂志上刊登的这篇文章指出的现象主要有哪些呢?

该文章引用了近期在神经网络推荐算法、对抗性训练、自然语言模型等领域的批判性论文,指出这些年来一些人工智能算法发展中面临的问题。

作者马修·赫特森认为,当前部分子领域算法核心的改进并未取得突破进展。同时,当前多数论文倾向于提出新算法而不是在旧算法上调优,这样做的主要原因是更容易发表论文,尽管在旧算法上调优的效果和新算法的效果相差无几。

“目前人工智能论文数量激增,泥沙俱下,导致部分论文质量不高,选题跟风甚至论文灌水的现象确实存在,但这并不能说明人工智能发展停滞不前,而是表明目前有更多的学者和研究人员投入到了这个火热的研究方向。”微众银行人工智能首席科学家范力欣在接受科技日报记者采访时表示。

范力欣强调,尤其需要指出的是,年轻学子中的佼佼者,包括博士、学士甚至高中生,都有了登上人工智能顶会顶刊崭露头角的机会。面对这样的形势,以偏概全地以“核心研究停滞不前”来总结是不合适的。

事实上,近几年,人工智能某些领域的创新,包括算法核心创新,还是取得了较为明显的进步。

如在自然语言处理领域,《科学》杂志这篇报道中提到的长短期记忆网络(LSTM)是1997年提出的,而当前,Transformer架构在速度和性能方面,比长短期记忆网络要更优越;预训练模型方面,以BERT为代表的预训练模型不仅在很多任务上获得成功,更带来了自然语言处理研究和应用范式的变化。更重要的是这些改进已经在相对比较公认的数据集上测试过,有的还在实际的产业应用中获得成功。

对此,南京大学人工智能学院教授俞扬也指出,近几年人工智能国际顶级会议的投稿数量持续上涨,如近期神经信息处理系统大会会议的投稿接近一万篇,其中技术“催熟”、审稿随机的现象确实存在。同时,革新性的工作往往容易遭受质疑,在海量投稿中真正的技术进步也容易被淹没。

核心创新要瞄准“痛点”

当前,在人工智能领域“汹涌”的浪潮中,研究人员的成果如何称得上核心创新、突破进展?

“能够克服以往的局限,在我看来就是突破。克服的局限越关键、越深刻、越普适,突破就越巨大。”俞扬举例说,例如,以往在国际象棋上战胜人类的搜索算法,无法扩展到搜索空间更加巨大的围棋上,而广为人知的阿尔法围棋便利用机器学习技术减少了巨大的搜索空间,从而取得成功。

范力欣认为,虽然人工智能领域的研究很火热,但该领域现在仍然处于积累实践观察的初级阶段。现在的核心创新, 就是通过观察与分析新的现象,不断提升现有方法的实际性能,并收集数据、证据。长期大量的观测后,真正有价值的是无数小的观察结果。

那对算法进行创新需要哪些条件?“首先是要找准问题,特别是关注制约算法性能的‘瓶颈’问题,这也是目前人工智能算法改进最难的。”厦门大学人工智能系副教授陈毅东说。

找到问题之后,需要提出合适的应对方法。一方面,新方法可以来源于对目标任务领域知识的结合,这需要研究者对目标任务和相关领域知识有全面的把握;另一方面,新方法还可以来源于其他学科,仿生技术就是常用的方式,这需要研究者对跨学科知识有一定的涉猎。

“除此以外,由于现实条件的限制,如数据、算力等,算法改进要成功还需要根据现实条件进行各种折中和裁剪。这又需要研究者具有相当的工程能力和实践经验。”陈毅东说。

科技日报记者了解到,2015年诞生的阿尔法围棋组成部分中,搜索树方法发表于2006年,策略梯度强化学习发表于2000年,卷积神经网络的提出则更早。“科学发展常常是证伪的过程,而不是一次性提出一个开创性的新理论。只有集量变为质变, 才能为即将到来的理论突破打下坚实可靠的基础。”范力欣说。

“人工智能基础研究要取得突破,很有可能需要做长期并且有争议的工作。”俞扬指出,如何为这样的研究工作、研究者提供足够的生存空间,对热点之外的研究方向有独立清晰的判断力,尤其是在人工智能热浪一波接一波的环境下保持对基础研发的投入,可能是为推动人工智能基础研发、产生原创性基础成果需要考虑的重要问题。

还无法做到全领域创新评价标准统一

根据上述论文的观察,不少研究工作都夸大了其改进的效果,而其中的根源问题之一,是当前人工智能相关领域的创新评价标准不统一,那么目前有无解决措施?

事实上,当前有不少解决途径,如代码开源、公开模型、公开实验结果等手段,都能够加强研究工作的可复现性和可对比性。

不过,作为一个还在不断发展变化的领域,新问题、新领域、新现象、新关注点层出不穷,全领域范围要做到评价标准统一十分困难。但在一些已经成形的领域,有组织地制定统一评价标准是有可能而且很必要的。

陈毅东认为,首先制定评测标准需要一定站位高度,也面临相当的难度和工作量,还需要根据研究前沿的变化不断进行调整更新。因此,必须有组织地开展,建议可以由相关学会的专委会、学术与产业联盟有组织地引导领域学者、产业界研究人员来共同完成。

“其次,真实的场景和数据往往来源于产业界,建议学术界和产业界更加密切地配合,共同研讨相关领域的前沿动态、发展方向和应用痛点,制定相应的标准数据集、搭建平台,并面向科研开放数据、接口甚至计算资源。”陈毅东说。

从应用的角度看,当前人工智能技术仍然处于积累实践观察的初级阶段,面临着在许多实际环境条件下无法奏效的困境。

近期的学术会议在论文的评价标准上,也越来越强调研究工作的可复现性。俞扬建议,要把基础研究与国内的实际生产需求结合,一方面在特别的需求牵引下容易产生原创成果;另一方面,来自实际需求的正反馈容易形成闭环激励,有利于不断创新,形成自主技术体系。

“实践是检验真理的唯一标准,任何算法是否是真正的创新都要接受实践的检验。坚持不懈就会收获美好的结果, 我个人是持乐观态度的。文章作者其实也认同这一点, 提出各种方法必须经过严格的验证, 只是文章中没有全面反映现在人工智能发展的总体态势,存在以偏概全误导公众的可能。”范力欣说。