证件、人脸,扫描对比,绿灯亮,通过,在经过高铁安检闸口的这一流程时,你也许会想:机器认识我。而实际上,并不是。
“当前的人工智能(AI)识别做的只是比对,缺少信息进入大脑之后的‘加工、理解、思考’步骤,因此仅仅停留在‘感知’,而并非‘认知’。”6月18日,纪念吴文俊诞辰一百周年活动的“认知智能行业应用大会”举行,中国人民大学高瓴人工智能学院执行院长文继荣表示,要让AI有类似大脑的活动,走到认知阶段,需要让它掌握知识、进行推理。AI从“感知智能”走向“认知智能”的实践目前在通用状态下比较困难,但在一些诸如反洗钱、侦察等领域正在应用。
AI“大脑”长成要先建知识库
“现在的AI处于弱人工智能状态,它没有大脑,要让它形成大脑,最核心的是要有‘知识’。”
微软亚洲研究院前研究员、北京一览群智数据科技有限责任公司首席执行官胡健表示,如果现有的算法、模型是神经或脑结构,那么知识是大脑能够运转起来的原动力。
让AI获得知识的知识库在业界称为“知识图谱”,它不仅要关注知识点还要关注知识点间的关联。这些关联将赋予AI联想力。“提到水,它要反应到密度、透明等多个性质,还要和浇水、能喝的功能联系起来,更高级的是计算出用多大力道去取水。”胡健说。
知识图谱的建立非常困难,人类海量的知识如何翻译成机器的语言,并与之建立联系,很成问题。尤其是之前这项工作一直是人工完成的,例如谷歌词库、百度百科、维基百科等都可以转换为知识图谱,但工作量大、内容异常庞杂。
“关联密度不足是另一个难以达到应用的‘瓶颈’。”胡健解释,一个知识点可能最多出现在几个关系中,能解决比尔·盖茨的爸爸的邻居的妈妈这种单维度的问题,但离反映现实世界中“蝴蝶效应”里的相互影响还差很远。
在关联密度不足的情况下,AI的“大脑”即便拥有一个上千万词条体量的通用知识图谱也难以达到应用的级别。
行业知识图谱能达“认知层面”
知识点的关联密度更像是一个AI大脑皮层,越复杂密集AI将越“聪明”。
“聚焦到行业,AI可以做到相对聪明一点。”胡健说,一些行业本身就有自己的基础关联图,这为其制定图谱提供了帮助。例如公安系统有一套体系,包括人、地、事、物、组织、机构以及关联,将出入境数据、第三方物流数据等加入进来之后,可固定成知识图谱。
中国人民公安大学公共安全行为科学实验室主任丁宁介绍,在做入室盗窃、公交扒窃等一些行为规律的研究时,知识图谱中除了引入历史数据的发展态势、风险感知之外,还逐步加入了环境、天气等数据,包括PM2.5的值,结果发现PM2.5的值对公交扒窃是有影响的。
“我们也提出虚实网络结合的方向,在掌握了实际的社交网,和资金流、社交流联系之后,我们对于团伙的刻画就比较准确了。”丁宁说,这将大大提高AI通过分析辅助决策的能力。
越密集越准确,AI知识图谱的关系图要做到像“福尔摩斯”一样综合分析,要形成凝集大量信息的知识图谱,这对传统的人工建立知识图谱的效率提出了挑战。“为此,我们研发出人工智能的解决方式,能够自动从海量的多源异构数据中抽取知识构建关系、理解语义以及与业务场景有效结合,更标准化、效率更高、关联密度能做到更高。”胡健说。
“在此基础上,我们研究出来跨境资金网络可疑交易的一套AI模型。”中信银行反洗钱专家沈可生说,它习得“认知智能”后每年的可疑交易预警量从50万份下降到10万份,减少80%人工甄别的工作量,同时把结果的准确度提升了80%。记者 张佳星