4月11日, 2020中国人工智能产业年会在苏州举行。会上发布了《中国人工智能发展报告2020》,产业年会的报告着重强调了中国的人工智能领域专利申请是世界第一,央视新闻频道以此为标题做了报道。
这份报告在2021年1月就已经在aminer平台上公开,AMiner是清华大学的一个科技情报分析与挖掘平台,里面详细统计和分析了人工智能在全世界的重大科研进展、成果产出以及科研热点,在这份报告中,揭露了中国在人工智能专利申请量上遥遥领先美国,已是美国的8倍,但在其他指标上却又远远落后美国,例如美国的AI高层次学者数量是中国的6倍,全球500强创新城市,美国有128个,中国只有32个。
为何中国在AI领域的高层次学者数量不如美国,专利申请量却如此之高?
韩一星在北京的专利代理机构工作了12年,是知识产权行业的资深人士,他透露,人工智能的核心专利其实在google手中,最开始AI的很多核心算法是开源的,结果Google的一个核心算法在美国获得了专利权,引起了行业震动,同时也引发了国家的担忧,AI的核心专利被美国“卡脖子”了,所以就加大了对AI应用型专利的鼓励和布局,AI应用型的专利的范围很广,很多企业都可以进行布局,所以导致了AI应用型专利申请的迅速增长,特别是在2016年,google的核心算法被授权专利后。
同样的答案也在SPY那里得到了印证,SPY是在深圳企业工作多年的专利代理人,处理和分析过很多人工智能相关的专利,对此他解释道:
“人工智能领域的核心技术还是在 google手里,国内的很多公司,他们直接用的google的模型,说是有算法改进,但是实际上还是在输入的数据端进行了数学和算法的前期处理,核心内层算法是直接应用的。
例如,图像识别的时候要用到卷积网络,卷积网络有很多,人工智能工程师,可以根据选择不同的卷积网络做应用。数学上是提取图像的特征变量,按照自己组件的选择和组件的卷积网络按照多层的方式实现计算过程,但是卷积网络内部的算法对工程师来说是黑匣子,卷积网络大多数都是在谷歌手里。
各种计算网络模型,都不在我们手里,我们就是应用,就是对前端输入到计算网络模型中的数据处理,然后再对数据的有效性进行统计,一般是多次计算后的稳定模型参数的确定,也只是确定参数,他们叫做“快速收敛””
其中,所谓的Google的这个核心技术应该就是所谓的Dropout。
Dropout是一种预防过拟合的神经网络训练方法。通常神经网络的最后一层是全连接层,参数非常多,容易过拟合,只根据其中的某些显著的输入特征得到输出。
为了避免这种情况,Dropout采用了每次随机丢弃一部分神经元的方式,迫使网络综合考虑所有的输入特征,从而缓解了过拟合的问题。
这个方法最早是2012-07-03发表在论文Improving neural networks by preventing co-adaptation of feature detectors 中,论文的第一作者和通讯作者是大名鼎鼎的Hinton,深度学习教父,2018年图灵奖得主之一,加拿大多伦多大学教授,从2013年开始在Google Brain工作。
论文对应的专利为US9406017B2:System and method for addressing overfitting in a neural network:一种防止神经网络过拟合的方法和系统。(简称017专利)
通过检索可以发现,017专利最早是基于2021年12月24号递交的一件临时申请,2016-08-02号被授权。
其中,Hinton的论文发表时间为2012-07-03,临时专利申请的时间为2012年12月24号,离专利不丧失新颖性的宽限期6个月就只差几天了,说明是否申请专利,Hinton和Google也有过犹豫,然而在最后的几天,他们还是递交了专利临时申请。
017专利的主要内容为通过提供一个训练神经网络的系统,其大多数的神经网络特征检测器会连到一个开关上,这些开关会随机关闭特征检测器。这也就是说,主要保护的是训练中用到的Dropout方法。
2013年12月23日,以017专利为基础,Google又申请了一件PCT国际申请,目前017专利相关的家族专利已经在巴西和澳大利亚公开。这意味着017专利的保护范围并不局限于美国。
Dropout技术是训练神经网络的基本技术,现在已经被广泛应用。但是在我国现行的专利法中,纯算法本身其实是不受专利保护的,算法解决了一个技术问题,才有可能是一个专利所要求的“技术方案”。
因此,在2016年后,我国人工智能领域相关的专利申请快速增开,这其中大部分是应用型的专利申请。
通过简单检索专利申请文件中是否包含“人工智能”关键字,发现自2016公司专利授权后,中国的人工智能专利申请急剧增加,其中大部分是和图像识别与分析有关。
最后,路漫漫其修远兮,我们万不可简单根据专利申请量超过美国,就忽略了中美两国科技领域的现实差距。