如果有一个初创团队告诉你,他们的创业项目是做一个搜索引擎,你会是什么反应?
上周我就接到了这么一个项目,这款名叫Magi的搜索引擎背后的团队,是之前做猛犸浏览器和Rasgueado的季逸超和他创立的Peak Labs。那么,Magi相比普通的搜索引擎有什么特别之处呢?
简单点说,Magi是一个全新的自然语言搜索引擎+知识图谱服务。普通的搜索引擎,不论是Google还是百度,都只能返回给用户一些可能相关的网页链接。要解决用户搜索的问题,还需要用户自己动手点击网页链接去挖掘和寻找真正有用的信息。而Magi帮助用户跳过了这一个中间环节,直接为基于自然语言搜索的问题给出答案,而不是网页链接。这个答案同时附有一个可视化的逻辑图谱,最后还会有一些参考链接(在产品越来越好之后考虑完全不给出网页链接)。季逸超表示,Magi类似于民用版的IBM Watson或非学术版的Wolfram Alpha。
说了这么一大段,我决定用一个最“直观”的例子告诉你Magi的特别之处。假如你想了解这么一个事实:苍井空有多大的胸?胸比她还大的女优有哪些?你可以把这个问题直接打在Magi的搜索框上,然后一个回车,Magi就会直接告诉你,是G,然后列出一张胸比她还大的女优名字清单。
这个例子在下面这个视频里有提到(顺便说一下,比苍老师还大的女优原来还不少)。
季逸超说,这个让答案变得更性感的例子其实挺难实现的。Magi是利用机器学习自主解答出的问题。在这个过程中,Magi通过自然语言处理+网页爬虫,理解用户的问题,再从海量数据中学习并得出答案返回给用户。要在短时间内完成这些工作,对算法的要求非常高。为了保证答案靠谱,Magi将每一个输入问题都分发到标准知识图谱、概率统计、神经网络这三种不同的策略,然后进行互相比对和投票,最后确定一个答案。
那Magi和IBM Watson、Wolfram Alpha又有什么不同?
季逸超先说了三者的共同之处:
都是严肃的知识逻辑引擎服务。它们不是娱乐向的问答机器人,对于无法回答的问题,无论是Alpha 还是 Magi都不会回复你一个抠鼻子的表情;也不是个人助理,不会帮你设闹钟或唱歌讲笑话;也不是Web App入口或框计算,不会有非统一的结果呈现,也几乎没有人工定向优化介入 (至少Magi 是这样, Alpha有一定的人工成本),所有输入都利用在本地的数据用统一的表达结构和自动化的逻辑处理生成能够作为中间值的输出。
对于不同之处,季逸超则是这样解释的:Wolfram Alpha 是计算性引擎 (Computational Engine) + 一定的一般性知识,精髓在于计算知识,Watson则强于信息处理,而Magi,精髓是数据学习。另一个很重要的不同点是,Magi是针对中文的。中文的自然语言处理要难得多,Wolfram Alpha的创始人Stephen Wolfram曾经来36氪演示过他们的中文功能,不过效果似乎并不理想,可能是因为大神自己不懂中文。
不过有一个好产品还不够,怎么把这款更智能的搜索引擎推广出去也是一个难题。季逸超的想法是先通过两种途径:第一,他们开发出了一款插件,只要浏览器装上这个插件,使用Google或者百度等搜索出的结果里会自动嵌入Magi更智能的搜索答案,以此让更多的人知道Magi;第二,通过和第三方APP合作,由Magi免费开发部分技术推广自己的搜索服务。比如,Magi和一款健康应用的合作,就是用开放的语音搜索技术交换对方使用Magi的搜索服务。
Chris Dixon曾经在博客里写过类似的观点:随着越来越多的人拥有连接互联网入口的终端设备,这个时代的一大创业机会就藏在如何分享和保存用户的精神创造成果(比如智慧、经验和知识)里。维基百科、问答网站这样的形式其实对知识只是一个粗加工的过程,而Magi提供了有逻辑的结构化知识,是一种深加工过程。
用搜索引擎的形式做这件事情更有趣的一点在于,加入用户账号系统之后,每个人都可以依据搜索历史自动产生一个结构化的逻辑知识库,这个库对于用户将是一笔宝贵的财富。当你搜索越多,系统就帮你整理出越完善的知识体系。现阶段Magi还没有做这件事,季逸超告诉我,他们目前的顾虑主要是用户的隐私问题。
除了逻辑化的知识体系,Magi其实也代表了搜索引擎的一种发展趋势。现在上网的人年纪越来越小,新一代网民通过关键字使用搜索引擎的能力也在慢慢退化。因此搜索的倾向应该是更人性化的自然语言搜索。
Magi将于今天正式上线公测,有兴趣的同学发挥的你们聪明才智向Magi提问吧!
除非注明,本站文章均为原创或编译,转载请注明: 文章来自 36氪
36氪官方iOS应用正式上线,支持『一键下载36氪报道的移动App』和『离线阅读』立即下载!