百度副总裁王海峰在演讲中表示百度从2012年就开始用语音来解决深度学习的问题。随着技术的不断进步,同时随着数据的计算能力不断增强,语音识别的准确率在不断上升。目前在很多场景下语音识别其实已经超过人类识别的准确率。在谈到认知层语言和知识方面的技术时,王海峰对其中涉及到的知识图谱进行了介绍,并表示,随着深度学习技术的发展,知识图谱对人工智能具有很大的推动作用。
虽然互联网上有海量的数据,但这些数据都是没有标签完全开放的,因此需要用自然语言处理技术去分析,也需要进行各种网页结构分析,同时基于属性聚类进行指示体系的扩展,最后从这些数据中挖掘出很多知识来,此外,还要基于语义空间的变换来做知识的整合,知识图谱就是通过这种大数据挖掘,现在已经达到千亿级的规模。