比较数据库和搜索引擎检索的方法和结果有啥不同??
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了比较数据库和搜索引擎检索的方法和结果有啥不同??相关的知识,希望对你有一定的参考价值。
达梦数据库搜索引擎2009版企业信息化建设浪潮,催生了大量的内部信息资源。据统计,企业数据每年以200%的速度增长,其中80%的数据以文件、邮件、图片等非结构化数据形式存放在企业内计算机系统中的各个角落,而这些数据总量远远超过了互联网信息的总量。整合企业信息资源,构建企业搜索引擎,为组织内外部用户提供检索和个性化信息服务,已经成为企业信息化的一大热点。
达梦数据库搜索引擎可以解决以下几个问题:
1、信息量大时速度慢的问题
比较常用的数据库有:Oracle、mysql、MS SQL等,这些都是支持标准sql92语法的数据库,数据库的重点功能在存储,对于数据量达到千万级的时候,再执行sql语法的速度将会变得很慢,特殊是执行含有like的select语句时,比如一个采用mysql存储的客户信息表数据记录达到500万行以上时,就算增加再多的索引,采用标准select语句执行查询时,所需时间至少也在2分钟以上,Oracle数据库虽然可以采用分区,或采用Oracle的内置函数如instr来辅助查询,时间也在1分钟以上。
达梦数据库搜索引擎采用全文检索技术,来解决搜索速度的问题,这就是为什么百度和谷歌能从上亿的网页数据库中搜索,只需零点零几秒以内返回结果。
达梦数据库搜索引擎为什么在检索时能达到零点零几秒返回结果呢?从数据库读取记录,对要搜索的字段分好词,存成文件索引,搜索时再分词,直接去索引查找每个词有哪些索引后文档。
2、信息形式多
如果要建一个行业的信息库,如新闻库,可能就会分很多类别,如:互联网、应用软件、通信等,每类可能由一个部门来组织,并且有可能会涉及到各个部门,不但包括文字、图片、图表和视频等多种形式的信息资源,而且涵盖了其他语言的信息资源。达梦数据库搜索引擎能够提供一个统一的跨媒体检索。
3、信息结构不一样
如果以前有很多信息系统,并且数据库不同,也是用不同语言开发的,查询A信息要去A系统,查询B类信息又要去B系统查询,一是不方便查询,二是重复的数据多,没法充分的利用这些已有的数据资源。
达梦数据库搜索引擎能够针对不同的数据源,采用灵活的定制,将这些数据统一成一个检索库,方便查询,达到数据的充分利用。 参考技术A 从搜索方式上看,搜索引擎使用起来要方便简单易用,只需要输入关键词就可搜索,而且搜索引擎大多是免费的查找网络上已有的网页,是一种人人可用的检索方式;然而,专业数据库的使用就比较的麻烦复杂,需要具有一定的相关知识才可以运用,而且专业数据库是收费的,需要专门购买。
从搜索结果来看,搜索引擎能够搜索到网络上已经存在的大量文章,这其中既有专门的论文也有相关的新闻或者一些网友的看法,相关性和权威性较差,但是信息覆盖广泛;专业数据库则只是收录了各类学术期刊中的论文以及一些学生的毕业论文,信息覆盖面要小一些,因此专业数据库的文章的相关性权威性要较搜索引擎高.
以上是关于比较数据库和搜索引擎检索的方法和结果有啥不同??的主要内容,如果未能解决你的问题,请参考以下文章
以图搜图 最佳实践阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎,