吉宁讲师观点 / 培训讲师谈管理 / 培训讲师谈管理:Siri之父:跨越创新的“死亡之谷”

培训讲师谈管理:Siri之父:跨越创新的“死亡之谷”

吉宁博士 2015年12月12日 培训讲师谈管理

在设计和完善产品的漫长过程中,往往会出现一个时刻,那就是努力方向中碰到的疑虑因一位潜在客户的反馈而轻松化解。对于目前已然是苹果iPhone中不可或缺的虚拟个人助理Siri来说,那个时刻是在2009年的一次航班上。当时,我所乘的航班晚点了,我刚登机坐下时,一位乘客问我航班抵达目的地的时间。由于我是几个可以测试Siri的人选之一,我就拿出手机,问道,“Siri, 联合航空98航班预计什么时候能抵达?”当Siri回复我最近更新的抵达时间时,这位乘客震惊极了。他说道,“我只有一个问题:你为什么会坐在这个舱位里?你应该是位亿万富翁!”

我一直致力于应对来自风险投资企业、科技、战略以及财务方面的挑战,因此根本没有注意到Siri技术已演变得如此惊艳。那位陌生人的吃惊程度提醒了我:我们已研发出一款不仅能听懂,而且能够运用人类语言回答问题的智能手机应用程序。我们将会把人工智能技术推广到上百万用户手中。

创新的摇篮

死亡之谷

斯坦福国际咨询研究所(SRI International)成立于1946年,前身是斯坦福研究所(SRI),后于1970年脱离斯坦福大学。作为该组织的总裁,我领导的团队主要利用SRI的技术,创造、构建以及衍生商业创新项目。

但是发明和创新之间存在着一个死亡之谷。这是风险投资领域的一个暗喻,因为大多数发明会因缺少一个庞大且不断增长的市场,未能制定一个强有力的价值定位和商业计划,或着缺乏充足的资源,在进入市场之前就悲惨夭折。

我的工作就是帮助团队越过这个死亡之谷,有时我们的成功远远超出我们的想象,Siri可谓是一个惊人的突破。

催生Siri的市场愿景可以追溯到2003年,那时,手机的主要应用仍局限于铃声和短信。我们意识到,手机日益增长的功能会最终让所有人能够随身携带一个可沟通的超级计算机,而且我们相信斯坦福国际咨询研究所是这场必然发生的科技和市场革命的最佳领路人。

我们成立了一个团队,命名为先锋(Vanguard),用来发展市场概念。一些前期概念是把智能元素注入手机,因此用户可以通过短信或语音方式向它委派一些任务需求,比如安排一个多方的电话沟通、拨打电话或订购日用品。

几乎就在先锋团队成立的那个时刻,美国国防部高级研究计划署(U.S. Defense Advanced Research Projects Agency,简称DARPA)投资了一个耗资1.5亿美元的项目,用于研发“认知”软件助理。(DARPA的概念促成了先锋团队的想法,并最终启发了Siri项目。

创建一个独立的风投项目并非我们在接下来4年里的目标。我们与几十家电信运营商和手机供应商进行过沟通,目的是为了成立一个联合项目,为我们的技术获得许可,并在商界配置一款智能助理。这个项目很难做,不断传来各种各样的异议,我们曾经与那些已经在实践我们部分愿景的公司合作了一些项目,但最终决定从SRI拆分出来做一个风险项目,创造一个全新的产品系列。

四大要素

SRI业务和技术创始团队的领导者们几乎每天都会面,讨论市场和产品的可能性。我们很清楚若想取得成功需要具备四大要素,那就是:重大问题或痛点的解决方案,以及快速增长的市场潜力;竞争中出奇制胜的差异化技术;执行能力异常出色的团队;阐明风险项目战略和价值的价值定位和商业企划。缺失了这四大要素,成功的几率几乎为零。

我们也很清楚,在我们耗尽资金或出现其他竞争对手之前,我们进入市场并取得成功的时间非常短暂,而且财政资源也十分有限。

痛点。好几个月团队都瞄准这一市场机遇:智能手机上实现任务所需的键盘点击操作太繁杂,令人沮丧。(2007年,触屏智能手机并不常见。)市场调研发现,每当用户需要通过点击屏幕来操作某项任务,20%的人会选择弃用这个应用程序或取消购买计划。

Siri背后的重大突破性想法简单而且强大:相较于搜索引擎,Siri将是一款语音识别的“行动引擎”。它会理解你的需求,自动搜寻所需信息,并提炼出一个答案。所有这些都由Siri为你生成,无须用户耗费任何精力。它将成为一个虚拟个人助理,帮助人们购买球赛门票、预定晚餐座位、获知天气预报,或仅需一两下点击就找到你想看的电影。

差异化技术。尽管投入几十年的研发,攻克痛点所需的技术依然让人望而却步。将语音转换成数据文本是容易的部分:1994年,SRI已正式推出了世界领先级语音识别软件Nuance。文字分析是其中最困难的部分,之所以如此,是因为要弄清楚用户的意图,然后探寻其中原因,并回复他们的请求。计算机必须要识别出文字中的概念以及与概念相关的词群。这些任务对人类来说非常容易,然而大多数人都认为计算机无法做到这点。

机器理解人类语言的技术,广泛基础是基于SRI语音识别技术和研究实验室,与DARPA 进行项目合作的SRI人工智能中心,以及SRI内部投资开发。这个产品的具体实施是由亚当·奇耶(Adam Cheyer)和迪迪埃·古佐尼(Didier Guzzoni)牵头,我们因此打造出配置到上百万个用户手机中的Siri。将近20年来,奇耶是SRI最具远见的计算机科学家之一,他设计并实施了委派计算和“代理系统”,让人类能够与网络程序和设备打交道。在他的博士生古佐尼的帮助下,他研发出能够理解并推理人类语言的方法,简化了机器对语音请求的响应。

团队。我们很幸运请到杰出企业家戴格·吉特劳斯(Dag Kittlaus)担任新风险项目的CEO。奇耶选择离开SRI,加入这个项目。智能化用户界面领域创新领导者汤姆·格鲁伯(Tom Gruber)在几个月后加入,并最终成为项目CTO。SRI信息与计算机科学学院院长比尔·马克(Bill Mark)和我也是这个项目的创始人。我们两人并没有离开SRI,而且我还是新项目的董事会成员。

价值定位。在接下来的6个月里,整体价值定位成了大家关注的焦点:我们将打造出一款强大产品,为上百万用户解决一个主要问题,同时这款产品能带来数十亿美元的收入。更确切地说,Siri能够减少繁杂的点击程序,节省人们的时间和精力,通过语音识别、人类语言理解以及人工智能提供一个具有差异化和突破性的技术,产生收益并取悦消费者。我们确定下来Siri的商业模式是,如果用户在Siri推荐的页面中完成了交易,Siri将收取一定费用。我们发现从Siri推荐的酒店、餐馆以及机场线索中能获得巨额收益。

2007年晚些时候,在历经6个月的价值定位后,我们决定为这个衍生项目寻求外部资金。我们很清楚找到赞助人并非易事,因为Siri仰赖的突破不仅是技术上的,还有市场领域的突破。许多风险投资家已经见识过对人工智能的大肆炒作以及糟糕的现实,并对此心存疑虑。他们担忧的不仅是价值定位中的每个元素和商业企划,还有市场、科技以及竞争对手。

这些担忧后来有所缓减,但是它并没有被消除。Siri将会是一项大胆且风险极高的投资。在其颠覆性技术的作用下,Siri必将对手机行业产生明显的影响。这项颠覆性技术带有明显的全球趋同趋势,包括智能手机的出现、计算与存储能力和通信速度的加快、网络服务和接口的增长,以及新人工智能系统的发展,它出现的时机刚刚好。

我们筹措的资金有850万美元,足够维持风险项目运作18个月。这个融资过程给我们带来的不仅是资金,慕名而来的还有很多勇敢且富有洞察力的投资者,他们成为了我们的合作伙伴,帮助我们明确商业模式,发展策略,以及与客户建立联系等等。

SRI资料与数据

产品问世

最终,在经历了从2009年11月至2010年2月(我在飞机上展示Siri功能也是在这段时期)的用户测试后,我们准备在苹果应用商店正式推出Siri。(Siri一词的拼写与SRI很相似,这只是一个巧合。我们选择这个名字是有一些原因的,其中包括它只有4个字母,以及在任何语言中都不具有消极含义。)我们也请了一些来自诸如Scobleizer 和 TechCrunch等网站的顶级博主,他们准备了相关演示和测评。产品演示获得巨大成功,拜媒体所赐,消费者对此兴趣高涨。Siri的用户免费下载量以天文数字计,它位居苹果应用商店里所有应用的前50名,生活方式应用居榜首。

Siri推出两周后,吉特劳斯意外接到一个电话。“嗨,我是史蒂夫·乔布斯。”那边如此说道。他以为是个恶作剧,就把电话挂断了。不久电话又响起来,说道:“我真的是史蒂夫·乔布斯。”那的确是乔布斯打来的。他们聊了一会儿,乔布斯祝贺吉特劳斯在Siri上的成就,并邀请吉特劳斯、奇耶和格鲁伯去他家做客,在那里他们谈论了很多关于Siri技术的事情。乔布斯了解人工智能引擎的价值,他也很清楚技术的本质,比如在识别人类语言领域就常常会出错。但他并不因此而沮丧。这点看起来似乎很不寻常,因为几乎所有的苹果产品都被冠以为“完美”而生。

接下来的几周里,乔布斯和吉特劳斯谈到了Siri的收购价格。我们并不急于出售,因为我们相信企业的价值几乎肯定会随着成功测试和新的分销协议大幅增长。但是乔布斯开出的条件是这些投资者和管理团队无法拒绝的。(因为合同的规定,这个价格恕不公开。)团队也非常开心能够与乔布斯和苹果一起共事。

一年后,Siri成为苹果新产品iPhone 4S核心平台中受欢迎程度最高的服务应用。2011年10月4日,苹果公司全球营销高级副总裁菲尔·席勒(Phil Schiller)介绍说,Siri是“iPhone 4S最为炫酷的特色。”第二天,史蒂夫·乔布斯病逝。我很感激他看到了这场演示。产品推出最初的几周,分析家报告称,Siri的出现增加了数十亿美元的销售。Siri一直是所有苹果iOS设备中的核心元素。

苹果以及许多其他公司,包括SRI如今都在争先恐后的发展既能技术领先又能服务新市场的产品。这个领域大有可为,语音和语言识别以及机器学习能力尚在发展初级阶段。新的虚拟个人助理将在文字和语言理解方面更为出色。它们将能维护语境、展开真正的对话、向用户学习以及成为帮助消费者查找健康记录和银行账户之类信息的“专家”。例如,SRI近期启动了一个新的风险项目Kasisto。Kasisto不仅具有对话的能力,而且能够通过语音、文本和触摸界面重新定义手机银行体验。毫无疑问,虚拟个人助理的未来是非常有保障的。(时青靖 | 译   牛文静 | 校  李剑 | 编辑)

About 吉宁博士

真正的实战派企业培训师,长期致力于人力资本、公司行为、市场营销、企业战略及领导力发展等组织实践与研究,数十年来参与及主持过的管理咨询项目累计逾千次;受邀主讲过的各类企业培训课程累计逾万次。