靠近北京西北四环的一栋写字楼里,韩景维掏出手机拨出一个号码。很快,他的号码显示在对方的来电提醒里。这样一个司空见惯的场景,其实在短短数秒钟内,就已经经过一系列复杂的查询、识别和过滤。如果打来的是一个骚扰或诈骗电话,智能手机上便会出现相应的标记,看似简单的小事,背后却需要一个庞大的数据库和一套完善的模型来支撑。
打算购房的人刚看完一个楼盘,便收到密集的房屋推销电话;签完购房合同没几天,各类询问贷款需求的电话频频打扰;接到大学录取通知书后,一个个假冒提供助学措施的诈骗电话紧随而至……生活在骚扰和诈骗电话不断来袭的当下,我们靠什么来守住一片宁静的空间?
大数据与科技运算已经提供了解决方案。多年来,腾讯手机管家安全专家韩景维和团队成员一直致力于此。如今,这个团队建立的数据库,已经储存了1300多万个被标识为骚扰或诈骗等有问题的电话号码。
“每呼叫一次,便在数据库里经过一次查询,每天的查询量在15亿次,其中能查到的骚扰或诈骗电话在4000万次左右。”韩景维介绍说。
据介绍,完成上述任务的核心是一个储存有庞大问题号码的数据库。一部分数据来源于手机用户的主动标记行为,频繁被标记的问题号码就会上报到数据库里。
另一个重要的数据来源,则是通过腾讯手机管家团队建立的模型运算出的结果。腾讯手机管家首先把一套安全系统部署到手机运营商,然后对运营商提供的海量拨号信息数据进行格式化、标准化,通过模型的运算精准识别出哪些是有问题的号码。
韩景维举了这样一个例子,公安部门在破获一起电信诈骗案后,把查出的一批诈骗电话号码提供出来,比如有50个诈骗号码,腾讯的安全系统会对这50个号码进行多维度的数据运算,机器学习模型会对GPS坐标、通话记录、通话频次等号码信息展开归纳学习,摸索出这些诈骗号码的规律后,再挖掘出尚未被查获的其他诈骗号码。
无论是用户主动上报的问题号码,还是经过系统运算识别出的诈骗号码,都会被储存在一个数据库里,在人们接到陌生号码的那一刻,立即做出相应的标记提醒。
在为人们守护宁静的同时,用户通话信息的隐私如何得到有效的保护?据介绍,互联网公司把手机安全系统部署到手机运营商,是为了识别、收集骚扰或诈骗等问题号码,因此取回的数据不涉及正常的用户号码,在模型运算中也不会涉及用户的通话内容等隐私信息。
另外,为了防止一些正常的号码被恶意标记,上述数据库里还建立一个白名单,政府、企事业单位等部门的号码会被纳入到白名单内。用户的正常号码,一旦遭恶意标记或被误操作标记,在用户申诉后,腾讯手机管家团队会通过数据库进行审核,把相应的标记取消。(完颜文豪、颜之宏)
(责任编辑:宋雅静)