算法定义的新型信息空间 ——基于网络搜索引擎特性的综合治理研究

Posted 京际环保

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了算法定义的新型信息空间 ——基于网络搜索引擎特性的综合治理研究相关的知识,希望对你有一定的参考价值。

[ ] 万维网的发明造就了规模庞大的世界性信息库袁借助网络搜索引擎袁用户可以主动地寻找自己需要的信息袁从而获得空前广阔的视野  同时袁搜索引擎的算法在很大程度上定义了用户的信息环境袁并以微妙或明显的方式影响人们的社会认知塑造人们的态度和行为进而影响社会秩序和社会发展  技术角度看袁网络搜索引擎通过设计特定的算法来收集尧判断尧排列信息袁大大提高了用户的信息获取效 率袁但基于统计的算法尚不能像人工那样对信息价值信息质量作出精准的判断曰从商业视角上看袁搜索 引擎公司的盈利模式与其需要承担的社会责任存在一定的矛盾袁基于利润追求的算法设计可能影响搜索   结果的公正性和客观性进而造成不同程度的社会危害曰从社会视角看袁搜索引擎正在被一些洞悉其算法  特点的人与机构巧妙地加以利用成为信息造假信息操纵的工具  以上原因导致搜索引擎可能扭曲社会信息环境袁对个人认知与社会进步来说袁它是一个野变量冶袁要使之成为事业发展的增量冶袁需要形成多主  体多手段的综合治理格局  当前袁深入研究搜索引擎媒体特点及其传播规律以社会责任为导向不断改进和完善搜索算法建立面向公众的网络媒体素养教育体系是三项重要的基础工作

[关键词]      万维网社会信息搜索引擎新媒体算法网络综合治理媒体素养

[作者简介] 罗教讲袁武汉大学社会学院教授袁博士生导师曰刘存地袁武汉大学社会学院博士研究生袁湖北 430072

[中图分类号] IG206.7          [文献标识 ] A[文章编号] 1004- 4434(2019)03- 00 -13



互联网带来了传播工具的革命网络新兴媒体正成为公众最主要的社会信息来源习近平同志指出院野互联网是一个社会信息大平台亿万网民在上面获得信息交流信息这会对他们的求知途径维方式价值观念产生重要影响特别是会对他们对国家对社会对工作对人生的看法产生重要影响遥冶[1]互联网新媒体所营造的信息环境在很大程度上界定了人们观察社会和他人的视野并进而影响着社会秩序与社会发展 与传统媒体一样它既有正功能也有负功能在成为社会发展的重要推动力的同时也伴生了诸多始料不及的信息乱象 网络空间不会自然而然地风清气正净化其信息生态必须建立有效的综合治理体系已经成为社会各界的共识 治网必先懂网冶袁要对任何一种社会信息媒体实施有效治理首先必须对其有充分的认然后方能对症下药科学地建章立制实现法治化常态化治理 因此互联网新媒体研究即对各种新媒体的功能特点传播规律社会影响及其形成机制的研究成为传媒社会学的新课题对搜索引擎的研究是这项课题的重要内容之一在互联网的各种信息平台中搜索引擎是最为独特的新生事物受众从传统媒体的信息获取方式有很强的被动性而搜索引擎可以帮助互联网用户主动地在信息海洋中寻找使用自己需要的信息搜索引擎目前已成为互联网的高频应用它一方面帮助人们获得空前广阔的视野另一方面也产生了污染扭曲用户的社会信息环境等负面效应例如大量低俗劣质不健康内容常常出现在搜索结果中而且排序靠前一些假新闻谣言借助搜索引擎平台泛滥夸大性误导性欺诈性的搜索引擎广告在造成严重后果后仍然屡禁不止搜索引擎为用户营造的是怎样的社会信息环境为什么会衍生出这些网络乱象其负面效应的形成机制是怎样的对这些问题的正确认识是寻找其改进完善方法的不可或缺

1


的前提条件

搜索引擎的信息来源发展历程与媒体特点

 

要分析搜索引擎所营造的社会信息环境必须先了解其信息的来源信息的组织与处理方式进而发现其信息的选择机制呈现方式

信息来源万维网技术造就的世界性信

息库

搜索引擎与传统媒体及其他互联网新媒体的最大不同在于它自身并不生产信息它给用户呈现的信息来自于万维网World Wide Web冤遥互联网出现的最初 20 主要是为军事部门和学术科研服务真正推动互联网向全社会快速普及的是英国计算机科学家蒂姆伯纳斯Tim Berners-Lee发明的万维网技术万维网采用客户端服务器工作模式能够使全球范围的用户极为便捷地连接到互联网而不再需要经过一系列复杂的操作因而大大方便了用户的信息交流与信息查询 1991 第一个万维网公共服务在互联网上登场这一事件成为互联网发展史上的分水岭此后这项发明被推广为互联网提供最重要的信息服务[2]

用于展示信息内容的网站Website是万维网的重要组成单元每个网站包含若干数量的网页万维网是由大量网页交织连通而成的一张大网中网页是节点节点之间的连接称为链接 每个节点既有从自身出发指向别的节点的链接也有从别的节点指向自身的链接 网站的构建者可以利用网站发布自己想要传播的信息 或提供相关的服互联网用户则可以通过浏览器访问网站获取自己需要的信息或者其他服务

不论是组织还是个人任何想发布传播聚合信息的互联网用户都可以建立自己的网站一些网站还支持用户进行大规模的互动交流如社交媒体网站冤遥 1991 年第 1 个网站诞生起全球网站数量一直在快速增长1997 年达到百万数量级2000 年达到千万数量级2007 年突破 1 亿 此后

10 年更是呈爆炸性增长趋势20172018 年网站数量约为 17 亿 这些网站每天都在生成发布各种信息万维网上承载的信息量也一直处在高速增长之中由此造就了一个世界性的信息库 网站的构建者以及广大互联网用户是这个信息库的信息生产者数量众多成分极为复杂多样值取向各

有异同知识水平与信息素养参差不齐 这一方面使万维网的信息内容包罗万象涵盖了社会生活的方方面面另一方面也决定了其信息价值信息质量的良莠不齐

用户从万维网获取信息的方式可分为浏览式和搜索式两种浏览式获取指用户通过浏览某些网站来获取信息这种方式与大众传媒时代的信息获取很相似一个个网站就相当于各种报纸电视台与电视频道 但随着万维网承载的信息量快速增多以及各种用户的信息需要的多样性与差异性不可能有哪一个网站能够完美契合用户的全部信息需要 同时用户需要的信息往往分布在不同的地方而面对数以十亿计的包含大量网页内容的网站用户不可能以逐条浏览的方式去找寻自己所需要的信息浏览式获取越来越难以满足用户的需要 要充分发挥万维网的信息优势就需要一种适应万维网信息特点的检索工具帮助用户在迷宫般的信息海洋中快速便捷地找到所需要的信息搜索引擎正是为解决这一问题应运而生

发展历程从目录式搜索引擎到全文搜索引擎

搜索引擎是能够在计算机网络中检索各种文为互联网用户提供信息检索服务的系统[3]其服务方式是当用户需要查询某种信息只要在浏览器的搜索框中输入查询内容的提示如关键词冤袁提示会通过互联网提交给搜索引擎搜索引擎为用户进行查找并把查找结果以网页信息列表的方式返回给用户

在万维网发展早期网站数量相对较少信息

量还不是太大这一阶段出现的信息检索工具是目录式搜索引擎即服务商预先对各种网站中的网页信息进行收集制作出一个目录检索系统当接到用户的信息查询请求时服务商依据目录查找相关信息然后把结果列表返回给用户 比较有代表性的目录式搜索引擎服务商是早期的雅虎和搜狐当时目录检索系统的制作与更新主要以人工方式来完成由编辑人员对网页信息进行甄别分类整理这种方式的优点是准确率高但局限性也是非常明显的以人工方式维护目录检索系统不仅成本很高而且能编辑的信息量是有限的如果网站很多网页更新很快就难以靠人力及时对目录检索系统进行刷新[4]

随着互联网应用的领域越来越广泛网站快速增加这种依靠人工编辑的目录式搜索引擎很快就


2网站数量的有关数据获取自互联网实时统计冶渊Internet Live Stats https://www.internetlivestats.com/total-number-of-websites/.


无力应对呈指数式增长的网页信息量了面对这一问题IT 界的技术创新者们首先想到的就是借助计算机强大的计算能力通过设计一系列算法让计算机取代人工来完成对网页进行全文检索随网页更新及时刷新信息列表等工作 由此出现了以谷歌百度为代表的第二代商业搜索引擎全文搜索引擎

全文搜索引擎采取一定的策略运用特定的程序让计算机自行搜集万维网上的信息并对信息进行分析组织处理建立起专门的数据库为用户提供检索服务 全文搜索引擎具有查询信息量大查询范围广查询时间短操作简便等优势[5]而且一般是免费服务这使其备受用户青睐经历短短几年的发展完善后得到了广泛应用

除了目录式搜索引擎和全文搜索引擎外还有一种元搜索引擎 元搜索引擎没有自己的数据库当用户查询信息时元搜索引擎将用户所输入的查询请求同时发送给多个全文搜索引擎然后对返回的结果进行汇总处理再将其作为自己的搜索结果返回给用户[6] 元搜索引擎虽然有集多家之长的特点但需要以全文搜索引擎为基础而且它的用

 1 2005要2018 年搜索引擎使用率

 

如前所述搜索引擎并不生产信息它以万维网为信息来源通过复杂的算法为用户组织处理呈现信息 由于万维网信息超载即信息量远远超过了个人信息接收和处理能力的上限所以对用户来说其中绝大部分信息实际上是不可见的至少是不易见的用户在具有较为明确的指向性的情况通常都会借助搜索引擎来获取信息而他们得

户较少 以谷歌百度为代表的全文搜索引擎一直牢牢地占据着主流地位成为用户主动性获取信息时的首选工具

媒体特点庞大的用户规模与算法选择

机制

作为一种新型媒体搜索引擎有两个主要特一是用户规模庞大其社会影响面和影响力不断增大增强二是运用计算机算法而非人工对信息进行筛选具有与传统媒体截然不同的信息选择机制

搜索引擎是打开世界性信息库的一把钥匙用户只要在搜索框里输入关键词并点击搜索计算机屏幕转瞬就会出现大量相关信息的列表 如今搜索引擎已经是互联网的高频应用之一拥有庞大的用户规模在网络信息世界里扮演着越来越重要的角色 2005要2018 年历次中国互联网发展状况统计报告中相关数据搜索引擎的使用率在2005  12 月为 65.7% 2018  12 月已稳步上

升至 82.2%手机搜索使用率也由 2009 6 月的

26.2%增长到 2018  12 月的 80.0% 如图 1 2

所示

算法定义的新型信息空间 ——基于网络搜索引擎特性的综合治理研究

2 2009要2018 年手机搜索使用率

 

到的是搜索引擎对海量信息内容进行筛选排序后给出的信息列表列表内排名靠前的若干信息成为他们的可见或易见信息 换言之当用户主动地从万维网获取自己想要的信息时他们看到的是搜索引擎从万维网中为他们筛选出来并优先推荐给他们的信息 正是这些信息为用户呈现世界的图景以微妙或显著的方式影响他们的社会认知 并进


2007  1 月发布的中国互联网发展状况统计报告2006  12 月搜索引擎使用率数据缺失但这不影响对搜索引擎使用率整体

趋势的判断3


而塑造他们的态度和行为

综合上述分析可见搜索引擎作为一种新型媒体它的信息生产者是极具差异性的广大互联网用户其信息内容包罗万象但信息价值与信息质量良莠不齐 在这种情况下搜索引擎要成为一种有利于社会认知的媒体是否具备优良的信息选择机制就极为重要 一个能很好地承担社会责任的媒体应当从庞杂的信息中筛选出真实重要具有代表性的社会信息以及客观理性公正的观点并且兼顾信息的平衡以帮助受众全面准确地认识社会环境引导受众正确地分析和思考各种社会问题 而搜索引擎是通过特定的算法来收集筛选信息的因此研究搜索引擎的信息选择机制需要从算法原理影响算法设计与使用的因素入手

算法驱动搜索引擎的信息搜集与信息筛选

 

要了解搜索引擎如何通过特定的算法来收集筛选信息必须清楚其工作原理以下首先从技术角度对之展开分析 全文搜索引擎由下载系统析系统索引系统和查询系统组成其工作原理可表示如图 3

算法定义的新型信息空间 ——基于网络搜索引擎特性的综合治理研究

3   全文搜索引擎的工作原理

下载系统信息的收集与存储

型的网页信息网络爬虫是一种能够自动抓取公共可访问网页中的文本图片等数据的程序需要注意的是有些网页是拒绝网络爬虫访问的冤遥

网络爬虫选取万维网的某一个节点作为抓取数据的起点沿此节点的链接指向漫游到下一个节点再根据下一个节点的链接指向漫游到下下个节点如此继续下去虽然从理论上说用这种方法能够遍历万维网中的每个节点从而收集到全部的网页信息但实际上由于计算机的工作负荷能力带宽资源等限制下载系统只能优先下载那些重要性较高的网页以提高信息收集效率控制信息收集成本遥野网络爬虫通常会选取目录型网页作为种子站点从种子站点开始抓取网页信息 这实际上是基于这样一个假定在一般情况下距离种子站点越近的网页其重要性越高[7]

网络爬虫昼夜不停地在万维网的信息世界里漫游大约需要 10~20 天可将万维网中允许被访问的网站遍历一次 万维网是一个动态的系统每天都会增加新的网页旧的网页可能被修改或删除 网络爬虫能够依据泊松模型理论对新增的网页有修改的网页进行重访以尽量保持和万维网的更新同步为用户提供最新的信息[8] 借助页快照技术对网页进行备份存储在搜索引擎服务商的服务器缓存里冤袁下载系统还能够把一些被删除的网页数据预先保留下来遥野网络爬虫抓取到的网页数据体量巨大抓取之后需要及时以合适的方式进行存储以便今后能够快速地读取它们

分析系统网页信息的预处理

当下载系统完成信息的收集与存储后搜索引擎的分析系统对这些数据进行信息抽取 网页去重分词处理和网页排名Page Rank计算等处理信息抽取网页的原始数据是半结构化数据

分析系统的功能是通过建立标签从这些半结构化数据中将那些有价值能代表网页特征的属性抽取出来并将其组合为一个网页对象以实现网页数据的结构化冶遥结构化过程中会保留网页中的一些重要信息如标题正文冤袁去掉无用的信息插入的广告冤袁以尽量节省存储空间需要特别说明的是这种结构化并不是把文本等非结构化数据完整地转化成结构化数据而是从中提取若干属性特征然后将这些属性特征以结构化的方式表

达出来


下载系统又称为搜索器冶袁它通过一种名为

网络爬虫的程序从万维网上发现和下载各种类

 


网页去重在网络爬虫搜集的网页中会有很多相同的或高度相似的需要运用网页去重技术来


4不同的搜索引擎服务商如谷歌百度的遍历范围与周期有所不同


删除以节约存储空间降低此后查询的成本使查询结果更加多样化

分词处理对文本进行分词以便建立索引利用关键词进行查询作好准备 在英文文本中词之间有空格符号根据空格符号就可以将英文文本切分出单词而中文文本中字词之间没有空格符号分隔字词的不同组合会产生不同的含义 有时即便文本中的字完全相同不同的分词方式会使其含义发生很大的变化因此中文分词更为复杂度更大不可避免地存在一定的差错率[9][10]

网页排名不同的网页其重要性不同因此需要通过网页排名算法来标识网页重要性等级使越重要的网页排名值越高在排序时越靠前以便检索时更容易被找到[11]

索引系统网页对象数据的组织

网页信息经过分析系统的预处理后接下来就可以建立索引 搜索引擎的索引系统又称索引冶袁它的功能是将分析处理后的网页对象不是网页信息索引入库 索引系统对网页对象文件进行编码并存入数据库然后将数据库中的文件以一定的规则进行排序产生全文索引 目前建立索引的常用方法和技术有顺排文档检索倒排文档索引后缀数组索引等

索引库是网页对象数据及其存储位置的列表能否保证存得下查得快是索引系统的关键既要存储海量的网页数据还要能支持多用户同时进行检索在低于秒级的时间里检索出结果并返回给用户

查询系统信息的检索与排序

查询系统又称检索器冶袁它的功能是为用户提供一个可输入查询请求的界面并在接到用户输入的查询请求后经过检索排序摘要提取等计算将结果排成网页信息列表返回给用户查询系统并不是实时地在整个万维网上搜索信息而是在预先搜集整理好的网页索引库中寻找与用户输入内容相关的网页对象再根据网页对象给出相应的网页信息

在通常情况下查询系统检索出来的信息量会很大用户查询实际上是top-n 查询冶袁即一般不会将整个信息列表逐条看完只会浏览前 n 项查询结果[12] 这就需要对检索出来的信息进行排序使高相关性高质量的网页尽量在信息列表中位置靠 查询系统较常使用的排序方法有三种一是词频统计法即根据查询关键词在网页文档中的出现次数来判断相关性假定出现次数越多其相关性

就越高排序位置就越靠前二是超链接分析法即根据网页所具有的链接来判断其重要性和信息质量假定与其链接的网页越多越具权威性则其重要性和信息质量就越高排序就越靠前三是点击率法即根据网页的被关注度来判断其重要性假定网页被点击次数越多其被关注度越高重要性就越高排序也就越靠前[13] 在各种搜索引擎的查询系统中更多的是将以上三种方法混合使用赋予不同的权重计算出分值按分值的高低来排序需要指出的是以上对网页的重要性信息质量的判断方法都是基于对网页的某些特征变量的统计而非基于对网页信息内容的理解因此除了概率上的准确性外还有一种不属技术范畴而出于商

业目的的排序方法付费竞价法即以网页付费的价格高低来确定排名顺序也为搜索引擎公司普遍采用

了解了全文搜索引擎的工作原理就很容易发现其优势与局限全文搜索引擎运用计算机取代了人工实现万维网信息的快速自动查询为用户提供了一种便捷的信息获取方式避免用户在世界性信息库中大海捞针 但任何技术都存在能力边界全文搜索引擎并不是完美的它的局限性主要表现在以下几个方面

第一并非收集全部网页信息 尽管搜索引擎公司一般都称自己的网络爬虫是面向全网的但实际上不可能真的把万维网中的全部网页信息一个不漏地抓取下来如前所述出于成本时间等因素的制约袁野网络爬虫通常是优先下载被认为重要性较高的网页因此不可避免地会有遗漏虽然遗漏的比例可能不大冤遥  此外由于网络爬虫 10-

20   多天的遍历周期搜索引擎的数据也不是与万

维网信息严格同步 以上情况会导致搜索引擎的

5


第二对网页重要性的判断会存在一定偏差计算机对网页信息的重要性并不是在理解其内容的基础上进行直接判断而是根据距种子网页的距离相关链接的数量和指向等通过统计方法作间接判断 这种间接判断只具有概率上的准确性因而一些重要性信息可能在网页排名与查询排序中靠后位于用户浏览的top-n冶之后成为不可见或不易见信息基本等同于被过滤掉了而一些并不重要的信息可能由于在某些统计指标上占优被排在靠前的位置

第三信息分析处理会存在一定偏差 在抓取网页信息之后搜索引擎对网页信息进行的一系列分析处理包括通过属性提取将其结构化为网页对象分词处理网页对象排名查询结果排序等是依靠计算机算法来实现的而这些算法也都是基于统计而不是基于理解的由于网页信息内容极具多样性基于统计的算法不可能保证完全准确此信息处理必然存在一定的偏差性这种偏差性会导致搜索引擎的查不准问题

第四缺乏对信息质量的判断能力 搜索引擎对信息质量的判断能力相当有限一般甄别不了信息的真与伪对与错有利与有害 换言之以当前自然语言处理技术的水平是无力对信息的质量进行有效把关的

算法驱动的搜索引擎在信息收集与信息筛选上的这些技术缺陷会导致其对在为用户提供相关社会信息时常常难以保证信息的重要性代表性平衡性尤其难以保证信息的质量 由于搜索算法不是基于理解而是基于统计方法所以它尚不真正具备去粗取精去伪存真的能力难以甄别出假新闻谣言等虚假信息也难以精准识别那些低俗色情等不健康的信息内容以致无法将这些劣质信息过滤掉甚至有时还会将其列于搜索结果列表中很靠前的位置 从媒体社会责任的角度来看当前的搜索算法还不是一个合格的信息把关人冶遥目前搜索引擎公司的计算机工程师们在算法改进方面的努力似乎还主要是致力于如何使搜索引擎得更准冶野查得更快冶袁而信息价值信息质量尚未成为关注的重点

利益导向盈利模式与社会责任之间的冲突

 

对于企业而言获取利润是生存和发展的条件搜索引擎服务商自然也不例外谷歌百度等搜索6

引擎公司需要持续投入大量的资金支持庞大的研发投入硬件开支和运营费用盈利是其立足之本

广告收入搜索引擎公司的主要利润来源

搜索引擎最初的盈利方式是给企业政府部门等提供技术支持通过技术授权获取收益 由于搜索引擎核心技术有很高的专业技术要求其研发工作需要耗费大量的人力物力和财力所以很多政府网站企业网站门户网站更愿意选择付费使用著名搜索引擎公司的搜索技术对于专业的搜索引擎公司来说一旦将核心技术研发成功就能通过技术授权使自己的核心技术应用于一些网站时收取技术服务费例如谷歌在早期就给雅虎 易等门户网站思科宝洁等跨国企业美国能源部等政府机构提供搜索技术并按照搜索的次数来收取使用费当时技术授权占谷歌收益的 30%仅雅虎每个季度就给谷歌带来几百万美元的收入 再如硅谷动力新浪等门户网站购买了百度的搜索技术给百度公司带来一定的收益[14][15][16] 技术授权主要面向较大的网站尽管每一笔交易带来的收益比较可观但由于受众面并不广故而总体收入仍然是有限的尚不能满足搜索引擎公司规模发展的需要 经过一段时期后互联网形成了庞大的用户规模网络广告开始蓬勃发展 广告商在广播报纸杂志等传统媒体上投放广告主要是针对特定的人群虽然能够接触到大量的目标客户一般费用较高而且对于那些不常接触这些媒体对这些媒体不感兴趣的消费者来说产品信息无法传递给他们 因此覆盖率越来越大的互联网逐步成为最受青睐的广告发布平台已成为互联网高频应用的搜索引擎也具备了进军广告市场的条件

以谷歌为代表的搜索引擎公司敏锐地察觉到了巨大的商机在广告投放上进行了一系列卓有成效的创新使广告收入成为其主要利润来源 它们充分发挥了自身的优势通过搜集每天数以百万计的搜索引擎用户的搜索信息分析用户的需求断消费者需要的是什么尽力实现广告的精准投放 广告商通过搜索引擎这个平台能够将广告传递给用户用户能够直接链接产品信息从而真正搭建了用户与广告商之间连通的桥梁 并且搜索广告并不是只在固定的某一时间段出现而是全天都在线展示广告商还能够随时地调整投放广告的地区关键词等只要广告商有需要调整变动的地方广告平台能够保持同步更新此外搜索广告开通账户也较简便启动资金也不高搜索引擎公司还可以按广告的实际点击收费单次费用一般很


合作方式也比较灵活广告商对广告效果满意可以自行续费如果不满意可以随时终止[17]

如今搜索引擎已经成为重要的营销媒介索引擎公司也因此形成了新的盈利模式使用者免费广告商买单 以中国的搜索市场为例瑞咨询公司2018 年中国网络广告市场年度监测报告提供了自 2013 年起中国搜索引擎公司营收

搜索广告市场营收规模的数据以及对未来 3 年发展趋势的预测[18] 如图 4 所示

4 中国搜索引擎企业营收搜索广告市场营收规模及预测

从图 4 可以看出中国搜索引擎企业营收市场

规模从 2013 年的 394.6 亿元 一直稳步提升

2017 年已增至 1124.1 亿元 其中搜索广告市场

营收规模从 345.2 亿元上升至 852.3 亿元 虽然占搜索引擎企业营收规模的比例呈现下降的趋势但始终保持在 60%以上

另据智研咨询所整理的数据显示2016 国搜索引擎企业总收入中占比最大的为关键词广告收入规模达到了 652 亿元占比 72.3%联盟展示广告和其他广告收入规模超过 100 亿元占比均超过 10%导航广告的收入规模达到了 25 亿元占比 2.8%非广告收入规模还不足 1%[19] 如图5 所示

以上两份报告的数据虽略有出入但仍足以表明广告是中国搜索引擎企业收入的最主要的来源而其中又以关键词广告为核心业务其对搜索引擎公司的盈亏有着决定性的作用而联盟展示广告和其他广告起到了辅助作用


5 2016 年中国搜索引擎市场收入形式结构及收入规模

据智研咨询整理的 2016 年中国搜索引擎市场收入形式结构及收入规模改绘遥

竞价排名搜索引擎的最主要广告形式

关键词广告的投放是在用户以某一关键词进行信息查询时搜索引擎在返回查询结果的页面中呈现与关键词相关的广告内容关键词广告一般以两种方式出现一是在检索结果页面的右侧有需要的或感兴趣的用户可以点击查看不感兴趣的用户可以直接忽略这种方式不会影响用户的搜索结果列表二是直接排列在检索页面左侧的搜索结果列表中用户在浏览搜索结果时无法避开这些广告这些以与检索结果同时出现的广告主要有两种竞价排名广告和固定排名广告

第一竞价排名广告 竞价排名就是让广告商们在关键词价格上竞标以此决定其广告在搜索引擎检索结果中的排列顺序搜索引擎公司对关键词进行拍卖广告商则对与自己广告相关的关键词出价搜索引擎根据广告商出价的高低来决定其广告在检索结果中的先后顺序出价越高排名越靠前收费则遵循按效果付费的模式按广告链接的有效被点击次数单次价格来计算如果广告链接没有被用户点击则不收费[20] 竞价排名广告收入目前是搜索引擎公司最主要的营收来源[21]

第二固定排名广告 固定排名是指搜索引擎公司与广告商预先签订协议约定将广告链接排在搜索结果列表的某一固定位置 一般情况下广告所处的位置由广告商竞价决定该位置在协议有效期内保持不变与竞价排名的按效果付费模式不同 固定排名广告的收费在双方签订协议之时约此外关键词也在协议签订时予以确定如广告

7


商想增删修改关键词则需要重新签订协议[22]

对广告商尤其是中小企业的广告商来说搜索引擎上投放广告不仅受众面更宽而且能够以更加灵活的方式运营由于搜索引擎是根据用户检索的关键词显示相应的广告因而广告能够较为精准地针对目标消费者群体 因此与传统的广告营销方式相比搜索引擎广告往往能达到更好的效果 对搜索引擎公司来说按照用户对搜索广告的点击量和广告商的竞价来收费形成了一种新的盈利模式这种模式使搜索引擎公司获得了相当丰厚的利润也给搜索市场带来了更大的发展空间 这对搜索引擎企业和广告商来说是一件互利双赢的事情但是对互联网用户来说就不一定了

搜索引擎公司要获得更多的广告收入需要从两个方面着手一是继续扩大搜索引擎的用户规模二是尽量精准地把潜在客户引向广告商 随着搜索引擎公司对市场需求有了越来越清晰的领悟它的计算机工程师们的很多技术创新都是围绕这两个目标展开 然而在把搜索引擎打造成一个强有力的营销工具之时他们中大多数人尚未深刻地意识到搜索引擎已经成为负有社会责任的新型传播媒体搜索引擎公司在商业宣传中更多的是展示其技术的先进性与优越性而对其局限性往往有意或无意地予以回避或淡化搜索引擎公司不会向用户强调它们的算法对信息质量没有判断能力也不会向用户强调它们会把付费广告商想让你看到的信息优先呈现更不会告诉用户由于搜索引擎广告的发展是爆发式的以科技起家以广告收入为支柱的搜索引擎公司还缺乏作为媒体所必须具备的广告业务管理能力 当然回避不等于问题得到解决使用者免费广告商买单的盈利模式很快就衍生出不容忽视的社会问题

广告盈利模式衍生的负面效应

尤其是作为其核心业务的竞价排名广告这些问题在医疗药品广告方面暴露得最为明显 2003   年起谷歌就因为网络药品广告问题而频繁

遭到各国监管部门的调查和质询 2009 华尔街日报曳叶连线等知名媒体深度报道了谷歌的一起虚假药品广告事件2008 一个美国假药贩子惠特克在被捕后供述谷歌广告销售人员曾在明知不合法的情况下主动帮助他避开搜索引擎的过滤机制在网上投放假药广告 美国司法机构为了取证行了一次著名的钓鱼式调查司法机构给惠特克伪

造了一个新身份让他重演与谷歌广告销售人员合作卖假药的全过程 在数次钓鱼式调查取证过程中谷歌客服积极帮助惠特克优化分析挑选和购买关键词广告甚至帮助他将网站改头换面伪装成一家医疗信息网站通过暂时去掉首页药品广告和购买按键的方法蒙混通过谷歌的自动审核机制然后再恢复购买选择 这起事件让谷歌颜面扫地2011  8 谷歌与美国司法部就此事达成和为此支付了 5 亿美元的巨额罚金[23]

2014 年比利时佛兰德地方政府支持拍摄了一则公益宣传片要叶请勿谷歌你的疾病曳袁向公众警示搜索引擎并不是可靠信源 但是百度并未吸取谷歌的教训比利时的这则公益片也未引起中国搜索引擎用户普遍关注很多人依然通过百度求医问药 直至 2016 年的魏则西事件的发生酿成震动全国的悲剧搜索引擎发布虚假医疗广告的危害才引起社会各界的重视 搜索引擎广告的竞价排名机制开始受到强烈质疑很多人都认为这种机制影响了搜索结果的公正性和客观性搜索引擎提供的信息不再是用户最需要的信息而是那些向搜索引擎公司付费的商家希望用户看到的信息信息的排列顺序是基于而非基于冶袁质量高的信息很可能排在检索结果靠后的位置更为严重的是如果搜索引擎公司没有广告审核能力或出于利益驱动不履行广告审核的义务可能产生广泛的社会危害

按理说在遭受天价处罚酿成重大悲剧之后谷歌百度应当引以为戒深刻认识到互联网新媒体的社会责任加强企业自律然而事实却不容乐观 据相关报道2018 谷歌的医疗广告占比仍然高达 41%广告中不乏夸大之词而竞价排名依旧是最主要采用的方式[24] 谷歌在技术上继续升级医疗广告借助人工智能技术实现更为精准的推送重点转向移动端且投放尺度加大[25] 与之类似魏则西去世 3 年后百度也再次上线医疗广告的竞价排名业务 据新闻报道百度市场人员称疾病搜索的相关广告付费即可置顶甚至可仿冒公立医院的链接给民营医院引流[26] 与之前的情况相比百度所作的改进只是将那些临床不能治愈的重大疾病排除在付费广告之外 而不论是谷歌还是百度都没有向外界有说服力地证明它们已经具备了可靠的医疗广告审核能力建立了足够完善的把关机制


 


8可参见请勿谷歌你的疾病视频腾讯视频https://v.qq.com/x/page/p0197lcgfvn.html.


问题不仅仅在医疗广告但凡有利益的地方搜索引擎公司常常禁不住诱惑例如2010 2017 年间欧盟反垄断部门对谷歌涉嫌操控网上购物比价服务搜索结果进行调查并最终给谷歌开出 24.2

亿欧元的反垄断最大罚单[27] 2018 印度商家指责谷歌滥用自己的市场地位来最大限度地增加营收为此谷歌又被印度反垄断部门罚款 2100 万美[28] 以上现象表明由于搜索引擎公司的经济利益与社会责任存在天然的排斥性所以单纯依靠企业自律恐怕难以根治互联网新媒体市场化所带来的负面效应[29]

信息操纵搜索引擎的不道德使用

 

由于互联网深度嵌入社会因此用户利用搜索引擎获取利益的行为涉及从商业营销到政治宣传诸多领域 简言之只要提高信息能见度能够带来某种利益就可能出现操纵信息的行为近几年来搜索引擎被不道德使用的事件不断见诸媒体报道2016  5 京华时报报道一个专门利用职称评定必须发表论文进行诈骗的团伙假冒某健康教育杂志的官方网站声称可以帮助发表论文 为了提高自己的能见度诈骗团伙的主谋找搜索引擎公司花钱让假网站链接进入搜索排名的前三页以蒙骗那些评定职称需要发表论文的人 仅半年时间该诈骗团伙即获利 30 余万元[30]

在这起案件中搜索引擎公司其实对诈骗并不知情因此不能视为出于商业利益的目的而与诈骗团伙合谋但暴露出搜索引擎公司的广告商的内容审查能力存在缺陷或存在管理漏洞因而被诈骗团伙利用 上述案例中诈骗团伙所用手段的技术含量并不高 2017 年浙江永嘉警方破获的一起全国特大破坏计算机信息系统案则具有明显的技术犯罪的特点 2017 5 永嘉警方在对一个假烟销售网站进行调查时发现在百度搜索高仿烟关键词时该网站的百度搜索排名居然是第一家禁止销售高仿烟的相关政策信息居然还排在它后面 销售假烟的嫌犯落网后供述其向一家网络公司支付高昂的费用以实现网页搜索引擎优化Search Engine OptimizationSEO冤袁然后得以在百度搜索高仿烟关键词时排名第一搜索引擎优化指通过站内优化和修复站外优化来提升网站关键词排名以增强产品的曝光度 但正常的搜索引擎优化无法实现在百度搜索结果中快速提升

 


排名也不能保证长期排名第一 警方随即对这家网络公司展开侦查发现其自行研发了可进行模拟点击特定关键词及指定网页的软件该软件能在较短时间内急速提升特定网站的点击量干扰破坏百度公司后台数据达到非法提升特定网页搜索排名的目的深入了解后发现该公司招徕的客户中 除了销售假烟还有从事非法调查假酒销售同性 卖淫网络赌博等违法犯罪行为的个人和团伙两年间该公司牟取利润高达 7000 万元[31]

在这起案件中涉案网络公司以黑客手段干扰了百度公司正常的系统功能这也说明搜索引擎技术还有待完善 不法商家将搜索引擎作为直通冶袁将夸大误导虚假信息传送给广大互联网用户无疑会干扰和破坏网络信息环境 这必将是搜索引擎公司必须长期面对的挑战 其实以技术手段在搜索引擎上造假作弊并不是什么新鲜事提供这种非法服务的公司为数不少百度公司也一直在和众多的搜索引擎不道德使用者作斗争在百度指数的使用说明中就有关于百度如何防范各种作弊的行为发现作弊嫌疑如何处理的说明说明中称百度指数在防作弊反作弊方面做了大量工作对于已经有明确证据证明使用作弊手段来提高排名的关键词百度指数会对其数据进行很大幅度的降权处理

对搜索引擎不道德的使用并不仅限于利欲熏心的商家这种新兴信息工具也影响了 21 世纪的政治生态 近年来的很多重大政治事件中频频出现搜索引擎的身影许多政治活动例如竞选都离不开宣传如何在信息传播中占据优势主导舆论常常是至关重要的作为互联网时代的高频应用搜索引擎成为了必须争夺的媒体阵地尤其是近年来搜索引擎向智能化与个性化发展它在政治领域的作用更加不可小觑

搜索引擎转向智能化与个性化原本出于良好的愿望 由于用户的信息需求具有多样性和异质性所以对不同用户即便以同样的关键词搜索信息给出相同的搜索结果往往并不能达到最佳效果 如何尽量了解用户以尽可能准确地为用户提供其感兴趣的内容成为搜索引擎技术发展的一个新方向[32] 搜索引擎在服务过程中记录大量的用户行为数据如偏好搜索什么内容经常点开什么类型的网页对什么类型的信息完全不感兴趣等等计算机工程师尝试利用这些数据为用户画像设计复杂的算法并根据用户所在地区搜索时间以及


参见百度数的相关说网址 https://index.baidu.com/Helper/?tpl=help&word=#nrmqa.9


历史行为记录等数据给出有差异的搜索结果信息列表[33] 当前这种技术已经被广泛采用以同一个关键词搜索时每个用户得到的结果会不尽相同这种个性化信息服务的初衷是更好地满足异质性用户的需要提高其信息获取效率但也为利用搜索引擎操纵信息提供了更大的空间

2011 美国媒体人伊莱帕里泽EliPariser

曾提出过滤气泡概念用以描述不同用户在谷歌上搜索一个信息搜索结果很可能大相径庭的现 用户即便不登录谷歌账号谷歌仍然能够通过57 种信息电脑型号所用浏览器上网位置等观察用户搜索推荐算法将依据这些信息决定个性化搜索结果这使搜索引擎向用户展示他们想看到的但不一定是他们需要看到的信息而把其他一些信息过滤掉 这将形成一个包裹住用户的过滤气泡冶袁使用户生活在他个人的独一无二的网络信息世界中[34]而这种对信息平衡的破坏容易导致和放大偏见 2015 爱泼斯坦等就在研究中发现存在偏见的搜索引擎能够在某种程度上改变选民的政治意向甚至左右政治选举结果[35] 2016 年的美国大选为这一观点提供了有力佐证以谷歌

推特为首的新媒体平台被卷入了此次选举的政治信息传播风波之中传播学家和政治学家们发现在用户们搜索与大选相关的政治新闻时个性化搜索可以为他们提供量身定制的信息内容将他们包裹在过滤气泡新媒体平台会根据对用户历史行为记录和搜索词条的统计结果对信息内容进行有针对性的筛选使用户越来越看不到与他们意见相左的资讯观点导致其认知进一步窄化甚至单向化遥野过滤气泡效应导致了大选中美国两党支持者们的意识形态分化甚至在全国诱发了激烈的社会矛盾[36]

德国总理默克尔担心美国大选时出现的问题在德国重演2016  11 她在演讲中称谷歌书等提供新闻的网站所使用的搜索引擎正在创造 扭曲的棱镜计划冶曰默克尔认为这些公司记录用户个人喜好利用严格保密的算法调整输出结果而使公众可能最终收到的是最受他们偏爱的新闻制造出回声室效应冶遥 这是当今后真相政治民粹主义支持者提供的礼物即公众理解周围世界时他们的视角实际上受到了严格限制[37]

2018  8 美国总统特朗普在谷歌上搜索了一下自己发现关于他的新闻几乎全都是负面的特朗普对此十分不满连发两条推特抨击谷歌有政 治偏见指责其操控篡改搜索结果并称要对其加10

强监管[38] 特朗普在推特上以维权者的姿态呼吁称谷歌正在控制我们什么能看什么不能看这是 非常严重的问题需要被解决浴冶谷歌的发言人全盘否认了特朗普的指控表示从未利用搜索结果排名来操纵政治情绪 CNN 随后刊发了揭穿特朗普对谷歌的最新阴谋论一文指出特朗普并未对他有关谷歌的言论作任何数据上的证实[39] 此举引发的舆论震荡将互联网科技巨头与政治压力之间的博再一次推向公众的视野

近两年来脸书推特和谷歌都因为自己的服务被利用于影响用户观点而遭到美国各界的广泛批评 美国国会邀请这三家公司于 2018  9  5 日前往参议院情报委员会听证 脸书 COO 雪莉桑德伯格Sheryl Sandberg和推特 CEO 杰克多西Jack Dorsey如期前往但谷歌缺席了听证会 有丰富政界经验的桑德伯格在一份预备证词中承认袁野面对从以赚钱为目的的喷子水军爷渊troll farms到老练的军事情报机构脸书发现问题太晚反应速度太慢这都是脸书的责任但脸书正在逐步改进[40] 杰克多西同时承认充斥着滥用喷子虚假信息分裂性言论的互联网平台不是一个健康的公共空间言论自由正被当作武器淆公众视听推特对此的准备尚不充分也没有副武装冶遥 他向公众承诺虽然改变不可能一蹴而就但推特会公开解决上述问题[41] 对缺席听证会的谷歌有参议员特意摆了一把空椅子以示不满还有人说谷歌之所以不派人来也许是因为他们不 知道如何回答这些问题

雪莉桑德伯格杰克多西这两位著名互联网公司高管的证词实际上明确承认了互联网信息工具正在被一些人巧妙地加以利用谷歌公司全球事务高级副总裁肯特沃尔克Kent Walker也在一篇博文中称袁野没有哪一套系统是完美的谷歌也将继 续采取行动来解决这些问题冶遥以上事件足以说明搜索引擎还远未达到完美它还无法保证自己不被不道德地使用一些洞悉搜索引擎技术特点的机构与个人正设法把它变成自己手中的利器 这可能是搜索引擎技术的发明者们所始料未及的

结论与对策

互联网新媒体尽管克服了传统大众传媒的诸多缺陷 20 余年来的发展与现状已经表明其信息生产和信息选择机制也存在固有的缺陷只不过与传统大众传媒的缺陷不同而已冤袁因此不可能在


无管理的情况下自然地成为理想的社会认知工[42] 搜索引擎也不例外它在帮助人们获得空前广阔视野的同时也可能成为扭曲的棱镜 从技术角度看当前基于统计的智能算法尚不能像人工那样对信息内容进行准确的分析无法对信息价值信息质量作出精准的判断 因此搜索引擎为用户选择出的社会信息难以保证真实性重要性代表性难以有效过滤低俗色情等不健康的内容也难以保证优先推荐给用户的观点都是客观理性正的并兼顾信息的平衡从商业视角上看搜索引擎公司的盈利模式与其需要承担的社会责任存在一定的矛盾基于利润追求的算法设计可能影响搜索结果的公正性和客观性进而形成不同程度的社

会危害 从社会视角看搜索引擎正在被一些洞悉其技术特点的人与机构巧妙地加以利用成为操纵信息扭曲社会信息环境的工具这种不道德的使用已经涉及诸多领域成为互联网时代一个不容忽视的新问题 虽然搜索引擎存在以上问题但至少在当前全文搜索引擎是万维网信息库不可替代的查询工具每时每刻都有数以亿计的用户在使用因此对于个人认知国家发展与社会进步来说索引擎是一个变量冶袁如何使这个变量成为事业发展的增量冶袁是我们需要认真思考和加以解决的问题

习近平同志在 2018  4  20要21 日召开的全国网络安全和信息工作会议上强调院野要提高网络综合治理能力形成党委领导政府管理企业履 社会监督网民自律等多主体参与经济法律  技术等多种手段相结合的综合治网格局 [43]这为包括搜索引擎在内的互联网新媒体的信息治理指明了方向 党委的领导是为网络综合治理把关定向确保治理体系的建设为推动国家发展民族复兴服务确保各项工作运行于正确的轨道 政府在网络治理中应起主导作用因为唯有在政府主导下才能将法律行政经济技术等治理手段结合起来科学地建章立制以实现法制化常态化治 互联网企业是重要的治理主体必须意识到自己兼具科技公司与社会媒体双重角色在社会责任与商业利益之间必须寻找合适的平衡点加强企业自律 互联网治理离不开社会公众的监督他们参与网络信息的生产和传播其行为亦影响着网络的信息生态

要形成这种多主体多手段综合治理格局

使之真正发挥效能当前需要高度重视三项基础工作一是网络新媒体特点及其传播规律的研究

是以社会责任为导向的网络媒体技术改进三是建立面向公众的网络媒体素养教育体系具体到搜索引擎的信息治理建议考虑以下对策

深入研究搜索引擎媒体特点及其传播规律

计算机与网络技术的创新层出不穷网络生态一直处于快速变化之中包括搜索引擎在内的互联网新媒体的未来更是未知大于已知对搜索引擎进行有效治理需要与时俱进地研究其媒体特点及传播规律在这方面学界应当先行一步但从当前情况看此类研究还处于起步阶段研究水平亟待提升 制约研究水平的一个重要原因是搜索引擎的信息来源于广大互联网用户作为信息生产者的万维网其信息选择则是在用户提供较为明确的需要的情况下通过在某些导向下设计的算法来实现因此对搜索引擎的研究有很强的跨学科特点涉及计算机科学信息管理学新闻传播学社会学济学政治学等多个领域对研究者的知识结构有特别的要求 计算机信息管理等领域的学者往往难以深刻理解信息对个人认知及社会发展的作用机制而社会学传播学等社科领域的学者通常缺乏搜索引擎的技术原理等基础知识 当前关于搜索引擎的社会影响的论文有的停留于现象层面的描述和单纯的道德批判有的则由于社科学者的知识局限不了解搜索引擎算法等技术原理提出的治理对策缺乏可行性或存在误区 因此此类研究需要从传统的以学科为中心的模式转变为以问题为中心的模式即研究问题所涉及到的学科均不应缺位应全面深刻地观照万维网复杂的信息生态及其社会影响的形成机制 唯有如此才能为综合运用法律行政经济技术等治理手段提供理论依据 此外还需要与互联网企业开展更为紧密的合作共同探索切实可行的治理方案减少试错的成本

以社会责任为导向不断改进和完善搜索

算法

如果说在创立之初搜索引擎公司还没有为承担社会责任作好准备在如今负面效应日益显现之时就必须及时作出反应 在算法设计上除了量导向冶袁还需要有社会责任导向冶遥 在这方面索引擎公司是责无旁贷的因为搜索引擎算法并不是公开的算法的改进只能由搜索引擎公司来完成 曾有人如德国总理默克尔认为搜索引擎公司对相关算法的细节一直严格保密公众陷入无从知晓其信息选择机制的黑暗之中故而搜索引擎公司应该公开其搜索算法这种认识其实是存在问题

11


姑且不论这会使搜索引擎公司丧失其付出大量投资所建立起的技术优势更重要的是公开算法可

能带来更大范围的信息操纵因为一旦搜索算法被



具有计算机专业知识技术的人知晓他们将能够更为精准地进行算法迎合冶袁即依据搜索引擎算法来为信息作特别设计以获得更多的搜索可见性搜索算法的漏洞也会更容易地被找到更容易被不道德使用 搜索引擎公司作为重要的治理主体不能以技术中性为托辞必须以社会责任为导向不断改进完善其算法 虽然当前的人工智能技术还不足以彻底解决信息价值与信息质量问题但存在很大改进空间 2018 6 百度与人民日报社宣布达成战略合作共同研究党媒算法冶袁内容产品和技术层面携手探索媒体新生态[44] 无疑将成为一个良好的开端

建立面向公众的网络媒体素养教育体系

在万维网信息世界里广大互联网用户兼具四种角色他们不仅是信息的受众还可以是信息的生产者信息的传播者信息治理的监督者因此网络综合治理应当把公众的媒体素养的提高作为重要内容 从信息受众的角度看我国绝大多数用户对网络信息的甄别能力有限以搜索引擎用户而言很多人的一般认知是检索结果页面中排名越靠前点击量越多的信息越有价值因而他们容易点击含有大量虚假谬误性信息的链接最终导致社会认知出现偏差或使自身的权益受到损害 这就需要将互联网新媒体的特点信息选择机制信息质量问题等以科普方式广为传播使用户在真伪并存的信息状态中具备更强的识别批判能力 从信息生产者与信息传播者的角度看人人都有麦克风的时代互联网用户整体的自律意识还有待提高需要更加重视合理合法地运用自己发声和参与传播的权利规范自身的网络行为为减少网络信息污染尽一份力    从信息治理监督者角度看

很多用户尚未意识到维护网络空间这个共同的家

园人人有责因而缺乏履行监督职能的能力 以上状况需要通过普及网络媒介素养教育来改变而我国的媒介素养教育还比较薄弱网络媒介素养教育尤甚因此科学地建立网络媒介素养教育体系积极推动其向全社会普及是当前一项需要高度重视的大工程

虽然在可预见的未来搜索引擎技术固有的缺陷还难以彻底克服但我们有理由期待随着多主体多手段的综合治理格局的形成将有效抑制减少搜索引擎负面功能使之更好地服务于国家发展和社会进步.

[参考文献]

[1] 习近平.在网络安全和信息化工作座谈会上的讲话 [EB/ OL]. http://politics.people.com.cn/n1/2016/0426/c10242 - 8303544.html2016-04-26.

[2] 蒂姆窑伯纳斯-李袁马克窑菲谢蒂袁伯纳斯-李袁et al.编织万维网万维网之父谈万维网的原初设计与最终命运[ M]. .上海院上海译文出版社袁1999.

[3] 李晓明闫宏飞袁王继民.搜索引擎院原理尧技术与系统[ M].

科学出版社袁200513.

[4][13]潘雪峰袁花贵春袁梁斌.走进搜索引擎[ M].北京院电子工业出版社袁20112-3165.

[5] 袁津生李群.搜索引擎基础教程[ M].北京院清华大学出版社2010.

[6] 李广建黄崑.元搜索引擎及其主要技术[ J ].情报科学20022.

[7] 印鉴陈忆群张钢.搜索引擎技术研究与发展[ J ].计算机工程200514.

[8] 李晓明刘建国.搜索引擎技术及趋势[ J ].电脑与电信20085.

[9] 邹海山袁吴勇袁吴月珠袁等.中文搜索引擎中的中文信息处理技术[ J ].计算机应用研究200012.

[10] 李志蜀袁李果.中文搜索引擎的原理剖析及开发实现技术 [ J ].计算机应用研究袁200111.

[11] 杨思洛.搜索引擎的排序技术研究[ J ].现代图书情报技术袁20051.

[12] 吴丹.搜索引擎的智能化研究[ J ].情报理论与实践袁2002

4.

[14] 王知津袁潘颖.中文搜索引擎商业模式比较:以百度和谷歌为例[ J ].图书馆工作与研究袁201211.

[15] 秦兴梅.新媒体语境下搜索引擎的盈利模式[ J ].新闻知识袁20097.

[16] 张鹏.搜索引擎企业盈利模式探析[  J ].商场现代化袁2007

21.

[17] 张志.榨干百度谷歌院搜索引擎广告大赢家[ M ].北京院子工业出版社袁201168.

[18] 艾瑞咨询.2018 年中国网络广告市场年度监测报告-[EB/OL]. http://report.iresearch.cn/report_pdf.aspx?id= 32642018-08-31.

[19]2017 年中国搜索引擎市场规模及收入形式结构分析预[EB/OL]. http://www.chyxx.com/industry/201706/53 - 4921.html2017-6-23.

[20] 王知津潘颖.中文搜索引擎商业模式比较院以百度和谷歌为例[ J ].图书馆工作与研究袁201211.

[21] 敖静海袁支芬和袁田玲.搜索引擎盈利模式研究[ J ].生产力研究20095.

[22] 焦玉英金世发.搜索引擎的发展及盈利模式研究[ J ].报理论与实践袁20065.

[23] 郑峻.5 亿美金罚金买来对人的尊重 看美国如何打击虚


假医药广告[EB/OL].https://www.sohu.com/a/7325431- 6_1701042016-05-04.

[24] 谷歌医疗没有广告 真相却是占比高达 41% 爱用best夸大[EB/OL].http://www.sohu.com/a/252515-078_100- 0786732018-9-7.

[25] 曾响铃.谷歌全球医疗广告调查AI 推送袁移动端投放和尺度加大[EB/OL].http://www.sohu.com/a/254291610_ 4910652018-9-17.

[26] 仿冒又跳转 医疗网站推广玩花样[EB/OL].http://epaper. bjnews.com.cn/html/2018 -05/22/content_7206 -95.htm? div=02018-5-22.

[27] 操控网购搜索 欧盟对谷歌处以 24.2 亿欧元反垄断罚款[EB/OL].https://www.guancha.cn/economy/2017_06_27_ 415327_1.shtml2017-6-27.

[28] Google 在印度因野搜索偏见冶而被罚款 2100 万美元[EB/ OL]. http://www.sohu.com/a/221892895_485 -5572018 - 02-09.

[29] 于馨淼.搜索引擎与滥用市场支配地位[ J ].中国法学20123.

[30] 团伙造假杂志官网骗钱 30 [EB/OL]. http://media.people.com.cn/n1/2016/0503/c40606 -28319228.html2016 - 05-03.

[31] 黄伟. 黑客篡改搜索引擎数据收入 7000 袁永嘉警方破全国特大案件[EB/OL]. http://www.sohu.com/a/216822- 240_1602742018-01-15.

[32] 谭琼李晓黎史忠植.一种实现搜索引擎个性化服务的方法[ J ].计算机科学袁20021.

[33] 蒋萍袁崔志明.智能搜索引擎中用户兴趣模型分析与研究 [ J ].微电子学与计算机袁200411.

[34] Pariser E. The Filter Bubble: What the Internet is Hiding from You[ M].New York: Penguin Press201110-11.

[35] Epstein R, Robertson R E. The Search Engine Manipulation Effect (SEME) and Its Possible Impact on the Out comes of Elections[ C ]. Proceedings of the National Academy of Sciences of the United States of America2015, 112 (33): 4512-4521.

[36] 许志源袁唐维庸.2016 美国大选所透射的野过滤气泡冶现象与启示[ J ].传媒袁201716.

[37] 不满美主导互联网市场 欧洲欲为硅谷巨头立新规[EB/ OL]. http://w.huanqiu.com/r/MV8wXzk2MzI3NDlfND hfMTQ3ODIxNzQ4MA==2016-11-04.

[38] 特朗普炮轰谷歌野搜索偏见冶院谷歌上全是我的负面浴[EB/ OL]. http://news.cctv.com/2018/08/30/VIDEDLKbdY7 - hEa6ZrkHHyF03180830.shtml2018-08-30.

[39] 特朗普 Google 了一下自己然后花了一整天时间抨击Google[EB/OL]. http://www.geekpark.net/news/232340 2018-08-29.

[40] Facebook  Twitter 高管将出席国会听证会院谷歌缺席[EB/OL].https://www.cnbeta.com/articles/tech/764465.htm 2018-09-05.

[41] 科技公司再赴国会听证袁社交媒体的西部狂野时代要结束了吗 [EB/OL].https://www.sohu.com/a/252866632_ 4139802018-09-09.

[42] 罗俊.互联网时代传播格局的重构及其新挑战[ J ].学术论坛20184.

[43] 习近平.敏锐抓住信息化发展历史机遇 自主创新推进网络强国建设[EB/OL].http://politics.people.com.cn/n1/20- 18/0421/c1024-29941345.html2018-04-21.

[44] 百度和人民日报共研党媒算法 探索党媒新生态[EB/ OL]. http://finance.youth.cn/fi nance_cyxfgsxw/201806/t - 20180612_11642315.htm2018-06-12.

[责任编辑戴庆瑄]

以上是关于算法定义的新型信息空间 ——基于网络搜索引擎特性的综合治理研究的主要内容,如果未能解决你的问题,请参考以下文章

GPT-3或宣告新型搜索引擎的诞生:通过语言模型提问即可找到答案

BP数据预测基于matlab供需算法优化BP神经网络数据预测(含前后对比)含Matlab源码 2032期

BP数据预测基于matlab供需算法优化BP神经网络数据预测(含前后对比)含Matlab源码 2032期

基于神经网络算法的苹果芯片,让iPhone 相机更智能

基于神经网络算法的苹果A12芯片,让iPhone 相机更智能

基于光谱-空间残差网络模型的高光谱遥感图像分类