广告

思必驰突围之战

2017-04-25

  张岩的知乎签名是“不折腾不舒服斯基”。这位“不折腾不舒服斯基”先生,在互联网浸淫多年,可谓资深互联网草根“牛人”。他曾在优酷、百度、滴滴等巨头公司任职资深产品经理,后与人联合创立了当下风头正劲的摩拜单车。

  不过,折腾并未止于此。张岩希望做一些能改变世界的事情,转机发生在2016年的1月。经友人介绍,张岩认识了一位智能语音公司的创始人,在与其畅谈一番后,张岩毅然决定加入团队并与其共同发展。

  这家公司就是苏州思必驰信息科技有限公司(以下简称“思必驰”)。思必驰是一家基于智能语音交互技术的软硬件一体化解决方案提供商。从2007年成立至今,思必驰已完成多轮融资。目前,思必驰正处于快速上升期,整体估值约20亿元。

  据了解,从创立至今,思必弛进行了多次业务调整和转型,后随着物联网的发展,公司最终确立了三条业务线:智能车载、智能家居和智能机器人。目前,张岩在思必驰担任产品副总裁一职,主要负责车联网事业部。作为一个互联网资深从业者,张岩喜欢用“图”说话。在《世界经理人》此次进行采访的过程中,他总共画了三张图,讲述了思必驰跑马圈地的故事。

思必驰产品副总裁张岩先生

  抢占入口

  2017年两会期间,“人工智能”首次被写入总理政府工作报告,上升到了国家战略层面,而这也预示着人工智能行业将会进入黄金发展时期,行业爆发指日可待。

  这是一个收入可观的新兴市场,全球的智能语音产业已经步入应用的快速增长期。国际著名市场研究公司Research and Markets发布《全球及中国语音产业报告2015-2020》中显示,随着语音在智能产业的应用不断加深,全球以及中国的语音市场在接下来的四年仍将维持显著的增长。根据中国工业和信息化部电子科技信息情报研究所数据显示,预计到2017年,全球智能语音产业规模将达112.4亿美元,复合年均增长率达35.1%。

  政策支持、市场潜力巨大为智能语音行业带来了好消息,但也同时加剧了行业竞争。想要在这片巨头林立、创业公司百花齐放的行业中,切下一块蛋糕并非易事。而作为一家深耕行业十载有余且技术过硬的老牌智能语音公司,思必驰选择了另辟蹊径——先抓用户后做大市场。

  目前,智能语音的商业化应用中,握有巨大用户流量的主要是软件应用,诸如现在的输入法、社交软件等;另一面,随着硬件的发展,越来越多联网设备为智能语音创造了新的市场机遇。智能硬件市场是一个新兴领域,入口抢占正在进行时,也为思必驰抢跑留有空间。然而,巨头的介入让这片蓝海逐渐被“染红”,想要在这片“虎口”抢食,形势无疑十分严峻。

  为了解释思必驰的“圈地”思路,张岩拿起笔,画了一张象限图,解释道:“以车载市场为例,这里有前装市场和后装市场。在这个领域里,也就是拥有巨大收入的前装市场,已经有Nuance等巨头占领了。而思必驰的切入角度则在后装市场,这里虽然收入回报没那么大,但是却可以培育我们的用户。上市公司讲求市值盈利,思必驰作为一家技术型创业公司,最重要的是讲求技术实力和产品体验。通过占领后装市场的用户,思必驰将不断改善和优化体验,让用户对我们的产品产生粘性,然后逐渐进入前装市场。”

  思必驰目前在国内智能车载后装市场占有率第一,约为60%的市场份额,智能后视镜领域达70%左右,在智能HUD(抬头显示)领域达80%左右,车机市场份额在不断攀升之中。在智能家居和机器人领域,思必驰已与腾讯、360、小米、联想、海尔、美的、大华、魅族等领军企业建立了深度合作关系。“思必驰的商业模式是为客户提供‘语音技术License+定制+芯片模组’,借由这一盈利模式,并通过在智能车载、智能家居和智能机器人领域的深入布局,思必驰市场前景极为广阔。”张岩说道。

  求破

  微创新提出者金错刀曾说:“找到价值锚,在一厘米宽的地方,做到一公里深。”依循这一产品逻辑,思必驰正在不断“求破”,通过产品的快速迭代来实现用户体验的优化。

  在语音识别这一技术上,业内巨头均声称语音识别准确率达到97%,这个是理想状态下达到的水平。张岩坦言:“事实上,在技术上,各家的差距不会太大。甚至有些数据,与巨头相比,思必驰的识别率会更好。”

  据了解,思必驰设立了上海交大语音实验室,负责前沿的技术研发,拥有唯一的成果转化使用权。公司拥有剑桥源生语音技术团队和近两百名研发人员,是在国内拥有人机对话技术,国际上极少数拥有自主产权、中英文综合语音技术的公司之一。

  然而,问题是识别技术差距不大,思必驰怎样才能进一步改善用户体验?张岩称,语音识别的真正意义是应用到实际的场景中,因此思必驰深耕垂直场景下的自然语言交互技术,至今已拥有数十年的技术积淀。张岩认为不同场景下有不同的技术侧重点,语音技术在不断进步,只做到“语音识别”是远远不够的,未来应该是“语音交互”的世界。于是,张岩和团队不断寻找思必驰语音技术上所存在的“一厘米”不足,并针对此做到“一公里”的深度优化。

  假设一个情景:你是一个患有路怒症的老司机,你对着车载智能语音系统说“我要听一首刘德华的歌”,然而,天在下雨、路边的车在鸣笛、你在车里吹空调,场景中充斥着乱七八糟的杂音和噪声,这让所谓的“智能”语音系统一下子懵了:哪个才是你的声音?于是,它并没有为你播放刘德华的歌。此时你不得不再次尝试,可是他并没有听清你的指令,结果它播了一首刘欢的歌。这个时候,或许你已经感到有一点不耐烦了。过了一会儿,你又想问智能语音系统“深南大道该怎么走”,于是你对着它发问,但是,它却没有任何回复,因为它还在播着歌呢!相信此时此刻的你,肯定已经想掀桌子了。“一个啰嗦、听不清话、听不懂话的机器人并不智能,相反还会让人感到烦躁,因此我们必须要解决在实际场景中所出现的一系列问题。”张岩说。

  为了解决上述情景中的问题,思必驰自主研发了AEC适应化回声消除,该技术可以达到将非指令人的声音进行消除。“比如机器本身在放音乐的时候,你要跟它说话,它会听不到,AEC技术可以把机器自己发出的声音进行消除。就像降噪耳机一样,把外面的噪声消除。你可以随时打断它,进行交互。”据了解,这也是思必驰于业内首发的可打断、可纠正、基于上下文理解的自然语言多轮交互技术。

  那么,如何让机器分辨出你的声音并排除其他干扰呢?“这个问题主要可以拿‘麦克风阵列’来举例说明。”为了解释这一核心技术,张岩再次画了一张图阐述:“当用户与产品进行交互的时候,麦克风阵列中的每个麦克风同时拾音,思必驰独有的算法降噪和语音增强技术以及阵列排布,能够有效定位用户位置,误差在±10°以内,有效辨别噪音和消除回声,环形6麦阵列的5米远场交互能力高达92%以上。”据了解,这一技术被称为亚马逊echo核心功能的“中国版”技术。“人工智能是未来的发展趋势,借助深度学习,思必驰可以改善人与机器沟通的问题。”张岩说。

  探索

  2016年,“互联网女皇”玛丽·米克尔(Marry Meeker)曾公开表示语音应是最有效的计算输入形式。张岩深以为然。张岩勾画了一副图,在他的笔下,计算机发展史就缩影这张坐标图上。“从一开始的CLI(COMMAND LINE INTERFACE,DOS命令),到GUI(GRAPHICAL USER INTERFACE,图形化界面),再到现在和未来的VUI(VOICE USER INTERFACE,自然语言交互界面),这是一个从简单过渡到复杂输入的演变。语音的发展会经历一个逐步智能化的过程,随着运行能力的增强,未来可以做到像真人一样具有听懂别人说话的理解能力。”

  张岩认为,在未来,语音交互将会进入到生活的方方面面。“比如,你可以对着你的智能音箱说你中午想吃什么,然后就会有人送外卖过来。”为了实现和本地业务的连接,思必驰已经与大众点评等O2O应用进行了连接,以便让用户可以用语音的方式来完成生活服务。“这一项目我们从去年就开始进行,今年我们会加大力度去开拓。”

  一个未来世界的面貌跃然纸上:在这里,人们用语音来预约行程,向机器人下达指令,在云端中所有的智能硬件的数据将会打通,而这些数据将会通过语音进行调用……也就是说,未来的语音交互将会迎来巨大的变革。这个过程或许要等20、30年,也或许它并不会朝着这个方向发展。为了让这个想象的画面能够落地,张岩带领着公司团队正在跨出自己的一小步。

  图 / 张岩

相关推荐

评论

评论共0条,参与评论
扫描二维码,移动端浏览手世界经理人机版更方便