探索“智能语音”未来的香港“王博士”

2016年04月28日 15:15   来源:新华网   陈寂

  当香港科技大学博士王昕决定离校赴深圳创业之时,她已投身语音识别研究10年之久。那是在4年前,30岁出头的王昕曾权衡再三。

  身处香港科技大学计算机科学及工程学系,浸淫国际前沿的科研环境与开阔的学术视野中,王昕本可选择留校,享受优渥待遇,但做事喜欢做到极致的她却觉得,自己研究的东西没能很好地实现产业化运用。

  “语音识别技术落地变成消费类产品的前提是要和产商结合,而深圳这点很厉害,技术从实验室到产品的过程很快。”她说。

  于是,王昕做了一个自称“很欠揍”的选择,在2012年与几个创业伙伴北上深圳,在深港产学研基地成立了“深圳语音搜索及应用工程实验室”,希望凭借车载语音识别产品迈进内地车联网市场。

  “我感觉,开车时的语音识别不是锦上添花的应用,它必将成为一种必需品。”王昕说。深港产学研基地给了王昕一个免费的理想创业场地,在这个由深圳市政府、香港科技大学和北京大学共同创建的基地里,很多人都叫她“王博士”。

  因为这一研发方向契合深圳市的产业发展方向,“王博士”的实验室还获得政府数百万元人民币的资助。

  “机遇大,但挑战也是分分钟的事情。”王昕创业之初,零经验运作一个企业,招兵买马,做计划书,与政府、市场打交道……面临许多未知,吃过许多闭门羹。数年间,创业团队陆续有人离开,“不像在港科大,带团队都有学校支撑。现在每一年都要想着怎么找钱,养活这么多人。”

  在各种新型智能化设备日益广泛地走进人们的工作和生活的今天,作为人机交互最自然的方式,语音识别成为了当今最便捷的人机交互使用方式。

  “以前很多人不习惯对机器说话,而微信语音和siri服务改变了这点,现在手机上所有的语音功能,车上都能用了,并已发展到了随心所欲的程度。”王昕解释说,车载语音识别最大的挑战在于控制噪音环境下的识别率,而这正是她公司的技术优势所在。

  现在,王昕的企业已拥有逾100名员工,年盈利数百万元人民币,产品覆盖车载语音识别、政府部门人工客服等多个领域。与此同时,王昕的企业还借助大数据服务,搭建面向证券领域的高端商情服务系统,覆盖近900家拟上市企业,实现对拟上市企业从初审到上市这一敏感时期全天24小时、多种信息来源的舆情监控。

  “当一个社会热点事件发生之后,互联网相关的新闻会涌出很多,人看到的只是一个一个片段,但机器会搜索和呈现完整的一个时间轴和发散途径。”王昕以天津港爆炸事故为例解释说,机器会在事故发生后立即挖掘数据库,会发现停放有汽车的企业是哪些、背后涉及哪些保险公司、居民楼又是哪些房地产商的……机器会分析连接起所有的线索,形成完整的知识图谱。

  “人下一秒会说什么,人工智能是通过对之前说的很多话的大数据积累来预测的。股票也是一样,人工智能也可以根据大数据来预测。”王昕说,她的实验室将会把大数据的挖掘与证券行业和金融行业做结合。

  国家“十三五”规划里提到“人工智能”,也让王昕对未来充满期望。“我们的发展还是和国家大局契合的。”她告诉记者,语音识别不仅要能“听清说了什么”,还得“理解说了什么”,这方面提出的挑战,今后将从后台数据上发力应对。

  在她看来,有了“深度学习”能力的人工智能,将来在语音识别上不仅能回答“今天天气多少度”,还要能回答“今天天冷么”这样的问题。

(责任编辑:石兰兰)

精彩图片