搜索引擎 - 世界的知识窗口

Posted 困倦小笼包的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了搜索引擎 - 世界的知识窗口相关的知识,希望对你有一定的参考价值。

时隔一年没更新, 最近和老友聊天偶然被催更,OK,让我们继续前进吧!

之前的几篇文章都是英文的, 这次写一个中文的试试看。


今天我想用一个俯视的视角,总览一下搜索引擎是如何工作的,最近又有哪些新的技术和应用场景。


首先,谈到搜索,大家可能会想到百度,但除了百度,在微信中找一个之前的聊天记录,在美团上找个好吃的餐厅,链家上找个南北通透的学区房等等等等,都要用到搜索。那么搜索应用如此广泛,搜索又是如何工作的呢?


为了避免使用太多术语,我们用图书馆的工作方式来介绍搜索引擎的大致结构:

  • 图书馆要作为一个好的图书馆,需要以下三点:

    • 首先,图书馆需要有书,很多书,书越全,去图书馆的人就更有可能找到自己想找的东西

      • 同样,搜索引擎也是一样,他需要有信息,大量的信息。百度搜索就像国图,需要包罗万象;美团搜索就像专门的餐厅目录,只要涵盖尽可能多的餐厅就可以满足人们的需求。

      • 那么这些信息怎么存到搜索引擎中,就需要搜索引擎有一个数据录入系统。对于百度来说,他作为网络的窗口,需要时时刻刻从互联网上收集信息,录入自己的图书馆,那么这个录入系统就会比较复杂,数据量会比较大。像美团中餐厅搜索,可能只需保证餐厅信息变更的时候即使更改自己的信息就好,相对来说数据量就小一点,可能做起来也容易些。

    • 第二,图书馆要能把所有的书分门别类排个顺序,这样读者快捷方便地找到书

      • 同样,搜索引擎对于自己存储的这些信息,也需要分门别类排列起来,这样人们来搜索的时候,他帮忙找信息也会方便很多

    • 第三,图书馆需要有个前台或者电脑,人要搜索什么书,要去问前台在第几排第几列,或者要在电脑上找

      • 这就是搜索引擎最后一步,帮助人们完成搜索,您输入什么,他就给您什么


做一个总结,搜索引擎总体来说,就需要有信息录入的渠道,有给信息分门别类的能力,最终当人们想找什么的时候,告诉他,他能帮您找到。

听起来还挺简单的,是不是?


总揽完毕,最近搜索方面又有什么新的创新呢?这里稍微列举几个我觉得比较重要的方向。


首先,近几年语音搜索的方向也带来新的挑战。之前人们搜索需要打字,得到的内容也多以图文形式回来,有一系列的信息返回,第一页没有,我们还能看第二页,第三页。最近家庭智能音箱也好,打语音客服也罢,人们问个问题,需要一个准确的答复,而不是一系列的答案,这就比较困难。举个例子,以前您下班回家堵在路上,要思考晚上吃什么的时候要么就干想,要么就开车用手机查,不知不觉前面车动了也不知道,后面人按喇叭您才恍然抬头意识到自己在开车。现在有汽车语音助手或者手机语音助手,您可以问他们说附近有什么好餐厅,或者问他们附近有什么现在开着的,吃印度咖喱,又不特别辣的人均价格200以下的纯素食餐厅,这些语音助手就需要找到匹配的一个或少于三四个,念给您听,您选一个。


另外,问答形式的搜索也是AI火起来大家开始试着能做一做的方向。之前我们搜索,往往搜的是例如“北京 中国移动 资费”这种关键词搜索,要支持本来人们心理的问题:“北京中国移动5GB套餐一个月多少钱?”这个问题,搜索引擎就比较吃力。现在有了AI,我们可以通过分析,直接告诉您答案“128元” (我也不知道是多少钱,随口一编,请见谅)。


还有,就是搜索除了搜索,还要发展探索功能。就拿我上面举的图书馆例子,搜索引擎现在还不完全像真正的图书馆,因为您没法看里面他怎么分门别类的。举个例子,您在图书馆里找一本诗经,找的过程中您还能看到同一个书架上旁边的离骚,宋词,唐诗。您要今天心情好,多拿两三本儿回家欣赏欣赏也是好的。但搜索引擎不是这么回事,您找啥他回啥,简单直接。这对于找书啊,学习知识,或者网上逛街的需求来讲,就不是那么恰当。很多时候,人们还是想来回来去多逛逛,多看看的。


除此以外,还有很多有趣的方向,例如多语言夹杂着搜索啦(没错,就是又很多people喜欢不好好talk),图文搜索啦(不光是搜图搜视频,要的是您照一张照片放上去他告诉您这是个嘛玩意儿),知识图谱啦(有点像知识的格子,每个知识点都连着其相关的知识点,一个连一个延伸出去),还有搜索在不同专业领域的应用啦(金融,法务,医疗等等等等)都还是有好多新东西要做的。


您看看您对什么感点兴趣,咱们下回再接着聊?



以上是关于搜索引擎 - 世界的知识窗口的主要内容,如果未能解决你的问题,请参考以下文章

知识图谱基本概念

攻防世界 robots题

知识图谱概述之笔记1

怎么自己做我的世界插件

编程随笔-ElasticSearch知识导图:全景

知识图谱学习之综述