物联网时代的搜索引擎演进思考

Posted 中国计算机学会

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了物联网时代的搜索引擎演进思考相关的知识,希望对你有一定的参考价值。


随着物联网时代到来,搜索引擎的功能与形式正在发生演进。本文从搜索引擎的输出结果呈现形式、输入方式以及搜索内容计算三个方面探讨了物联网时代的搜索引擎正在发生的变化,对其下一步的演进方向进行了深度思考。


物联网时代的搜索引擎演进思考

前言


在信息化时代,搜索引擎逐渐成为人们获取信息最便捷的方式,在人们的工作学习、交通出行、旅游娱乐等过程中发挥着重要作用。从PC时代到移动互联网时代,搜索引擎的功能与形态已发生极大变化,搜索内容从早期单纯的网页链接延伸至目前精准的文本、图片、音乐、视频等富媒体内容;搜索方式也从用户主动式框搜索发展到目前被动接收的个性化智能推荐方式。


社会正在进入万物互联的物联网时代,基础设施、应用场景与搜索载体进一步发生变化:云端计算与存储资源极大丰富,边缘化AI技术程度加深,终端种类与形态空前繁荣;同时,用户对于信息与服务的需求与时俱进,都将推动搜索引擎的内容与形式发生深刻变革。物联网场景中,人们的搜索需求更加具现场属性,从对互联网空间的信息需求转变为身边的生活服务需求;搜索结果呈现方式更依赖移动终端,搜索计算进一步去中心化等。最近全真互联网的概念被推出[1]表明虚实融合技术得到深度推广应用,线上与线下信息互动需求发展到了新阶段。


结合物联网时代的云、边、端信息互动特点,我们将下一代搜索引擎分解为输出呈现、搜索输入方式以及搜索内容与计算三个方面,如图1所示。本文将对这些方面以及未来可能发生的变化进行思考与展望。

 

物联网时代的搜索引擎演进思考

图1 物联网搜索引擎的云边端架构


搜索结果的输出呈现


搜索结果首先具有多样性特点[2]。对于多样性的搜索结果如何呈现出来是搜索引擎的一个重要指标,直接影响其搜索体验。搜索结果的呈现可以从视觉力、信息力和有效力三个维度进行评价[3]。视觉力主要体现是否有视频和图片的表达,物联网时代的信息呈现方式未来可期。全息投影、有形触感(Tangible)表面等新型技术和材料的实际应用将大大增强视觉效果和沉浸感。信息力则体现在结果文档的标题、摘要与搜索需求的匹配度如何。有效力则从信息的时效性与权威性所具有的可参考程度进行评价。


在传统PC场景下,可以依据上述指标组织搜索引擎返回的所有结果信息(包括实体推荐内容),按照一定的策略推送到屏幕端,由用户选取点击[4]。而在物联网场景中,需要对搜索结果的评价增加维度,其显著变化是计算单元和展示单元的边缘化、移动化和小型化。一定程度上,一些功能性APP充当了搜索引擎的作用。一方面,由于移动版搜索引擎被嵌入很多数字营销内容,使得其搜索结果的集中化程度进一步降低;另一方面,一些功能性APP往往由于显示屏尺寸受限,无法同屏提供足够丰富的搜索结果和展现方式,使得用户在多屏显示、多款APP甚至多个智能终端间进行切换和对比浏览,在一定程度上降低了信息呈现的集中程度。比如对于一次外出就餐的需求,用户首先在手机上通过百度或美团等APP确定一家目标餐馆,然后使用滴滴呼叫出租车或者扫描共享单车二维码,通过汽车/单车方式到达目的地,最后使用移动支付买单。而在物联网场景中,用户身边的电视机、广告屏幕、LED设备等都有可能成为输出终端。因此,对物联网搜索引擎进行评价,应该增加聚合力评价维度。搜索结果呈现的评价指标如表1所示。


从表1可以看出,所有评价指标都对物联网场景中的搜索引擎提出了新的挑战,如何在现场资源条件下提升搜索结果的命中率和准确度,精简结果呈现的方式,是物联网搜索引擎面临的首要问题。可行之路是对用户输入进行更多维度的理解,加强“需求识别”精准度,进一步减少搜索结果的歧义性,从而降低对移动端资源的依赖程度。

 

物联网时代的搜索引擎演进思考


搜索引擎的输入方式


搜索引擎首个环节即要基于用户的输入进行精准“需求识别”。早期搜索引擎以文本框关键词输入为主。由于基于关键词的搜索引擎接收到的输入信息有限,自然语言理解容易产生多义性解释,无法做到在第一时间进行精准的“需求识别”。常用的做法是根据机器语义理解的所有可能,向用户返回多样性搜索结果,由用户自主选择来获得真正想要的内容。随着输入方式不断拓展变化,后续出现了图片、语音等输入方式,以期更加方便、准确地返回搜索结果;百度公司也曾推出“框计算”概念,试图统一搜索入口、通过后台的海量数据以及高强度计算能力,全面解决“需求识别”问题。


进入物联网和AI时代,人、机、物的信息互动形式与内容已发生巨大变化。由于用户的搜索需求多发生于手机、平板电脑、手表等移动终端,搜索输入已不再局限于文字方式,摄像头和麦克风等传感器成为了新型“键盘”,用户通过语音、图像或者视频即可表达搜索意图。在AI技术的支持下,一个手势,甚至是一个眼神也可表达搜索需求。AI技术的应用使得搜索引擎对输入的解析从早期的数据流匹配发展到语义流识别阶段。


图2展示了从PC时代到物联网时代的搜索输入维度不断扩展的过程。传感器在物联网场景中大量使用是必然趋势,搜索引擎借此感知获取的信息来源必将足够丰富,用户意图能够通过语义识别,并被应用到辅助搜索中来。多源感知与融合计算技术在近年来得到快速发展并被成功应用于信息与服务推送。其中,时空大数据信息协同是辅助识别用户真实意图的重要维度。时间属性在信息过滤的过程中已得到普遍使用,许多搜索引擎已经默认将时间作为搜索输入条件。而空间维度的价值随着数字空间与定位技术的发展有待深度开发。由于物联网场景的高动态特性,输入维度的一致性无法保证,因此机会感知计算模型将得到广泛运用[5]

 

物联网时代的搜索引擎演进思考

图2 搜索引擎的输入方式演进


搜索输入的维度扩展也反映了内容资源供给侧的同步变化,包括跨媒介内容的表达、内容理解和索引构建等技术方面的变化,也包括在搜索内容方面从文本检索走向多模态检索,再到服务检索的过程。


搜索内容与计算


搜索内容与搜索计算是搜索引擎的核心构成部分,主要完成对用户的搜索输入进行内容识别和结果推荐。搜索内容与计算领域的不断发展反映了人们的生活需求不断朝向多样化与智能化演进,也是物联网时代技术进步的体现,具体呈现以下几方面趋势。


搜索架构出现去中心化特征


物联网条件下的终端连接能力极大提升,边缘存储能力、计算能力同步加强,这使得面向“服务”的局部网络生态系统日趋完善。2020年10月5日,英伟达发布最新芯片技术BlueField-2 DPU,并将其用于扩展其边缘计算平台NVIDIA EGX Edge AI平台。全球各大行业都可从中获益,包括制造业、医疗保健、零售、物流、农业、电信、公共安全和媒体等,各行业可根据需求快速高效地大规模部署AI服务器。企业数据中心将被分散部署在不同位置,包括办公大楼、工厂、仓库、基站、学校、商店和银行等,而非集中部署在某一个中心地点,因此搜索引擎对于云端依赖性减弱。这将促进计算资源前置,直接助力物联网智能边缘的数据分析、管理与检索,对搜索领域格局产生深远影响。


去中心化趋势不仅体现在技术架构上,在内容的传播方式上也有显现。目前大量自媒体内容,包括抖音、快手短视频等,逐渐出现由个人创作、个人发布、个人收看、个人点评的传播链条。这些内容已然成为互联网新闻资讯、视频传媒、文化学习等媒体的重要组成部分。而其中优质内容的传播,完全不需要中心化的专业传媒机构的支持就可以获得极大的阅读量以及广泛传播。内容的去中心化也代表了用户流量的去中心化,将会给基于“头部流量”的网红经济带来一定的改变,为数字营销领域提供新的研究课题。


从搜静态信息到搜即时服务


PC环境的搜索业务往往是为了获得大量信息来源,然后浏览所有的链接信息,选取最终所需。在物联网搜索场景中,用户更多的是通过随身终端感知周边的服务和基础设施,选择其中所需服务,诸如居家、购物、选餐、找人、找车等。例如在搜索引擎中输入“麦当劳”,PC端推荐的内容侧重于与麦当劳相关的百科知识、企业状态、产品特点等;而在移动终端,用户更大概率上是想搜索到附近的麦当劳门店和打折券进行消费。这种“所见即所得”的即时服务需求代表了物联网场景的典型特色。像百度推出的轻应用、微信打造的小程序等功能形态,都是通过一种更方便的方式满足人们在移动端的即时需求,从满足用户对文字信息的搜索需求升级为对即搜即用的“服务”需求。


基于物联网的“服务”还可表现为制造力。我国的智能制造产业正在经历从数字化到网络化再到智能化的过程[6],物联网和信息物理系统(CPS)最终将并轨连通,形成强大的制造力网络。制造者在物联网空间提交的海量功能与服务成为社会基础设施,个性化创意活动将得到激励和繁荣。人们按照个性化需求提交订单,并由场景中的服务设施即时生产出来。比如要定制一款个性服装,用户仅需提供描述说明即可由边缘计算服务器进行交互式设计,实时渲染3D模型。模型一旦确认,即可提交至服装流水线自动生产并快递给用户。这一变化使得物联网搜索引擎较之前具有全新的即时交付能力。


从用户主动搜索到被动推送


传统的搜索引擎使用方式以用户主动发起输入搜索为主,而在移动端的信息获取方式日渐转变为用户的被动感知、接受推荐。随着人工智能技术的发展与应用,个性化推荐的精准度日渐提升,加强了用户黏性。这不仅适用于日常信息搜索,也适用于广告内容推送。抖音、快手、拼多多等APP能够异军突起,获得可观的DAU(Daily Active User,日活跃用户数量),其中一个重要原因就是其信息获取模式不再单纯地由用户主动发起搜索请求,而更多转变为机器分发,同时通过AI技术进行用户画像分析,实现信息内容的精准投放,大大扩大了用户群体以及用户对新闻资讯、商品广告等信息内容的接受空间。


数字孪生提供搜索新维度


地理信息领域的最新发展正在重构信息的数字空间。2020年8月18日,两院院士李德仁在全球地理信息开发者大会(WGDC2020)上表示,基于数字孪生的智慧城市将实现在网络空间对物理空间的现实城市的智能运控与管理,为城市交通、电力监测、公共卫生管理等能力均带来提升与突破。这一论断再次助力数字孪生概念的推广与应用。


数字孪生的一项关键操作是为所有信息打上空间位置标签。事实上,用户在物联网场景中的信息搜索需求具有极强的位置相关性。传统搜索引擎也尝试提供区域化搜索功能,但目前的区域化搜索更多的是通过获取所处经纬度位置信息,对结果进行距离排序。比如在使用百度搜索引擎搜索“停车场”的时候,百度可以根据距离远近将所有“停车场”进行排序。但数字孪生场景中的位置服务并不仅限于现有的定位功能。近几年,室内定位技术得到快速发展,基于Wi-Fi、蓝牙、UWB等无线信号的定位应用日渐成熟[7],使得位置服务能力从室外环境扩展至室内环境。以前例中的停车场搜索为例,相比之下,物联网搜索引擎可以搜索感知到具体的某一空车位,并通过数字孪生服务实现车位预定、引导和反向寻车等。


数字孪生空间的近场定位能力并不局限于为用户提供定位导航服务,还将为传统的LBS(基于位置的服务)带来新的变化与形态。首先,室内感知定位有助于搜索引擎对场景进行语义理解,进一步推理用户的搜索输入与场景之间的关系,完成精准服务筛选。如在电子城和写字楼这两个场景中搜索“打印”,搜索引擎应返回不同的服务内容,前者是推荐打印机售卖服务,后者更大概率是推荐打印店服务;其次,室内近场感知能力提供了社交属性的新维度,为商场、地铁、展会等近场条件下的社交沟通、信息互动创造了新模式,使得内容创作和传播在去中心化方向上有了更多推动力;在数字营销领域,通过对用户、群体的驻留、动线情况进行统计分析,有助于品牌商家进行流量获取与转化,最终用于提升搜索引擎的推送精准度。


展望


在2020年华为开发者大会上,华为面向海外用户正式发布通用搜索引擎Petal Search。和传统移动版搜索引擎相比,Petal Search更倾向于“服务”,能为用户提供本地化的分类搜索服务,如受欢迎的本地餐饮、景点、活动等内容;Petal Search还支持多种搜索方式,用户可通过Petal Search应用、手机主屏搜索框、华为浏览器、智慧助手等多个入口进行快速便捷的搜索,这些功能大大提升了信息搜索的聚合力;在用户输入方面,AI元素成为亮点,支持用户拍照或用图片搜索感兴趣的人物、动物、景点、商品、菜谱等,实现 “即拍即得”的效果。


沿着Petal Search的方向,物联网时代的搜索引擎将更多对接物联网的感知与制造能力,为用户提供极大丰富的物联网本地化服务。同时,用户接收和使用服务的过程足够智能化,即搜索引擎根据物联网基础设施感知到的场景时空属性推荐个性化服务,由AI系统实时辅助、精准遴选,并进一步提交给制造力网络生产制造。目前,我国的新基建项目计划正在为这一趋势推波助澜,面向城市视觉智能的数字视网膜[8]等平台级的基础设施日渐成熟;另一方面,物联网搜索引擎也会反作用于基础设施,对其网络化、智能化程度提出新要求,比如配合智能制造,还需要具备城市范围内的全自动分拣、送达的快递配送系统,才能完整打造物联网时代的简易搜索、个性化生产和及时送达的服务闭环。


最后,借助移动终端的强大感知能力,用户将更多信息提交给搜索引擎作为辅助输入,获得精准结果的同时,也是透露用户隐私的过程,如何获得方便和隐私之间的平衡,也必将成为物联网搜索引擎的热点研究内容,面向患者数据安全与隐私保护的联邦机器学习[9]已在此方面取得重要进展。


特别声明:中国计算机学会(CCF)拥有《中国计算机学会通讯》(CCCF)所刊登内容的所有版权,未经CCF允许,不得转载本刊文字及照片,否则被视为侵权。对于侵权行为,CCF将追究其法律责任


作者介绍


物联网时代的搜索引擎演进思考


刘军发

CCF高级会员,普适计算专业委员会委员。中科劲点(北京)科技有限公司CEO兼创始人。主要研究方向为情景感知、物联网定位、机器学习应用等。liujf@powerlbs.com

物联网时代的搜索引擎演进思考


陈益强 

CCF会士,普适计算专业委员会常务委员。中国科学院计算技术研究所研究员, 泛在计算与系统研究中心主任。主要研究方向为智能感知、人机交互、联邦学习等。

yqchen@ict.ac.cn

物联网时代的搜索引擎演进思考


俞晓明  

中国科学院计算技术研究所高级工程师, 硕士生导师。主要研究方向为信息检索、网络信息挖掘等。

yuxiaoming@ict.ac.cn

参考文献略

物联网时代的搜索引擎演进思考

点击“阅读原文”,加入CCF。

以上是关于物联网时代的搜索引擎演进思考的主要内容,如果未能解决你的问题,请参考以下文章

物联网学习之数据库与物联网搜索引擎详解

5G中的物联网技术与未来演进方向,路在何方?

高德客户端及引擎技术架构演进与思考

谈谈MQTT协议下的历史演进及实践

物联网核心协议—消息推送技术演进

物联网核心协议—消息推送技术演进