搜狗在纽交所上市已经一年了。
这家在 PC 时代以输入法、浏览器和搜索为"三级火箭”的公司,现在正“致力于推动以语言为中心的人工智能技术的发展”,通过自然交互、知识计算两个关键手段,在语音、问答、对话、翻译等方面去落地。
人工智能方面的布局还未给搜狗带来多少收入,2018 年 第三季度财报中,核心的搜索及搜索相关业务营收占全部营收的 92.3%。但对王小川来说,人工智能是不得不做、且值得长期投入的事情,因为这体现了“文明演进”中搜狗的使命。
第五届世界互联网大会”乌镇峰会“期间,PingWest品玩(微信号:wepingwest)创始人骆轶航和搜狗 CEO 王小川围绕“搜狗的历史使命、人工智能、科学精神和看世界的方式”等进行了一场对话。
在王小川看来,搜狗做人工智能,是人类社会迈向智能文明背景下的顺势而为。人类社会已经经历了几个文明,分别是农业文明、工业文明和信息文明,接下来是智能文明,而智能文明的核心是人工智能。
“在信息文明中,有个堡垒还未被攻破,那就是翻译。"王小川认为,“全球以中文为母语的人口数量虽然是最多的,但全球互联网 85% 的内容以英语为沟通语言,大多数的商贸活动都用英语,而以英语为母语的人口数才排第四。”
这是信息文明很大的一个堡垒。在信息文明中,中国人要与全球沟通、获取全球信息变得简单,这让搜狗做翻译这件事产生了”使命感“。
信息文明之后的智能文明,能让每个人变得更强,做到以前做不到的事。以搜狗与新华社合作的案例——AI合成主播为例,以一个真实主播为学习样本,提前把视觉的东西拍摄出来,再通过人工智能技术使AI合成主播说出新闻。原来真人主播只能播几个小时,现在AI合成主播可以 24 小时不停工作,播出一些简单的内容,将真人主播解放出来,去做一些更高级的事。
以下是骆轶航和王小川对话的精选:
搜狗的人工智能使命
骆轶航:搜狗现在的核心是 AI,围绕着人工智能应该搭建出怎样的产品矩阵?
王小川:首先要正确认识人工智能这件事。AI 不是一个商业模式,也不是一个产品,甚至不是一种技术,只是技术中的一种算法,还得有燃料(数据)。其次,要在历史进程中找到位置,思考这个位置和自己的核心能力有什么关系?
人类社会经历了几个文明:农业文明、工业文明和信息文明,接下来是智能文明。农业文明最核心的是轮子,工业文明是蒸汽机,信息文明是计算机和互联网,智能文明是 AI。
信息文明有几个关键的应用:通讯工具、搜索工具、输入法工具。信息文明中,有个堡垒还没被攻破——翻译。
很多人问,搜狗为什么要做翻译。这是由搜狗的使命使然。搜狗做输入法、做搜索,目的是让中国人表达信息、获取信息更容易,但我们最终的使命是让中国人与全球沟通、获取全球信息。
全球来说,以中文为母语的人口数是最多的,以英语为母语的人口数才排第四,但全球 85% 的互联网以英语为沟通语言,大多数的商贸活动都用英语。这是信息文明很大的一个堡垒。
从这个角度来讲,搜狗比 Google 更有使命来做翻译这件事。我们现在就能做到用中文搜索全球信息,并且用中文来阅读。
信息文明的下一阶段是智能文明。智能文明的核心是人工智能,给每个人赋能,使每个人变得更加强,做到以前做不到的事。这其中包含两个内容,第一是自然交互,第二是知识计算:计算机能够理解互联网上更多内容,在垂直领域给出解决方案。
搜狗在互联网大会上发布了和新华社合作的AI合成主播。我们以一个真实主播为学习样本,提前把视觉的东西拍摄出来,通过人工智能技术使合成主播说出新闻。原来真人主播只能播几个小时,现在合成主播把前者从重复劳动中解放了出来,让他们去干一些更加高级的东西。
骆轶航:它解放了”主播“这个角色,延展了一个人的能力。
王小川:对,延展了一个人的能力。所以我觉得,智能文明最终是让人工智能给人当替身和助理。替身是帮你做东西,助理是为你提供服务。
去年搜狗IPO上市那天,我收到了 3000 条祝福微信。有的是记者,有的是同学,有的是领导,不回不太好,拿语音回也不合适。你需要一个助理帮你打理这些简单的事情。比如说有的教育公司,有 8000 个客服,数据量很大,话术也不统一。这些客服也是用搜狗输入法,这时候我们就想能不能把输入法智能化:敲两个字整句话就自动出来了,或者给出几个选项。
骆轶航:这个有点像 Gmail 的自动回复功能。
王小川:对,Google 今年 I/O 还推了一个可以帮你打电话的人工智能程序。
骆轶航:你觉得为什么做搜索和输入法的公司比做语音和翻译的公司更适合切入”以人为本“的人工智能?
王小川:因为有场景驱动。我们输入法会慢慢变成人对外的助理,搜索变成人对内的助手(问答机器人)。搜索和输入法并没有消失,他们潜在的能力反而扩大了。
人工智能应该是一种创业现象吗?
骆轶航:中国在人工智能与美国差距不像很多其它前沿技术领域那么大。那你觉得目前这个阶段中国人工智能领域有什么问题?
王小川:问题在于很多投资人并不是真的懂人工智能,他们很多投资人对人工智能都抱有幻想。技术本身很难有壁垒,要么靠数据,要么做芯片算力,但在世界范围之内,掌握这些东西的其实都是大公司。
骆轶航:搜狗是一家上市公司,有财务方面的压力;狗又是一家技术公司,工程师和科学家密度比较大,对科学技术的投入不会那么快变现。这两件事如何平衡?
王小川:我觉得做科学和科学精神是两回事。做科学是去发现世界运行规律的,而科学精神是对自己的要求。我觉得企业办研究院做科学成功率不高,不仅要跟高校充分合作,钱也要大量投进去。谁能投得起这钱?微软和 Google。
一般企业是没有能力做底层基础搭建的,这始终也不是搜狗的使命。搜狗思考得更多的是,如何将科学成果转化成应用。底层科学研究的事情,还是让高校来做,搜狗做上层的东西。
人工智能的物理视角与生命视角
骆轶航:你把人工智能置于人类文明的四个阶段(农业文明、工业文明、信息文明和智能文明)的框架当中去理解,思考以人为本的人工智能,你的这个理解框架是怎么建构出来的?
王小川:之前我是技术出身的,数学好、物理好、计算机特别好。我考数学,一卷试题从头写到尾不用草稿纸。这个时候,看问题主要是物理视角,是中性无偏见。
研究生阶段对我改变特别大。我研究生阶段待的实验室是做高性能计算的,当时实验室老师对我们说,“现在最新的东西是生物信息学(bioinformatics),你们做这个去”。所以我研究生论文是做基因测序的,我从物理视角跨入生命视角,这两种视角不一样。
骆轶航:通俗来讲,就是死的和活的区别。
王小川:对,我问了很多生物学家,到底生命的定义是什么?什么是生命?最后找到两句话:第一句是性状相对稳定,第二句是自我复制。这两样东西满足了,就是生命。
性状相对稳定是指,面对环境冲击自我复原的能力。这不是指被刮伤一道口子痊愈了,而是说如果被人拿刀砍,会躲避逃跑。
这是生命为了保持稳定的能力。从这个角度来看,共产主义和基督教都是有“生命”的。这个事情对我来说是极有冲击力,我重新树立了对世界的认知。我现在也把搜狗也看作一个“生命体”,让它在历史中不断地成长和演化。