百度网盘搜索源码,新加分词功能,内容相关度聚合更高
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了百度网盘搜索源码,新加分词功能,内容相关度聚合更高相关的知识,希望对你有一定的参考价值。
百度网盘搜索源码说明:
最佳适用环境:linux(如果不是linux系统,win系统也可以,但是php天生就是跑在linux上的,linux上跑php性能不是win系统可以比拟的)
源码说明:php+mysql
关于前端:前端是基于bootstrap框架。
关于广告位:本程序是采用伪静态地址访问,可以一键增加广告位。
关于采集源:采集源是直接采集百度网盘的,这样可以避免有些失效资源问题等等。
关于程序内核:程序全部为自己开发,非套用市面上开源内核,自主开发的程序专门适用于存储云盘亿级数据,个人看法,不管是从性能还是适用度都优于开源内核。
关于数据库:数据库按照文件的分类分表存储,数据库进行了很多优化,增加了关键词索引,最大限度的节省了数据库资源损耗。(实测:导入1.2亿数据后,资源损耗基本可以忽略不计。)
关于搜索:本程序搜索是基于coreseek中文开源框架的,亿级数据,搜索毫秒级。
关于爬虫:本爬虫是基于php snoopy类写的一个爬虫,更新了爬虫触发,将原有的web触发方式改为了命令行下触发,优化了爬虫超时问题。
爬虫新添加3个功能:
1、加入了爬虫来路功能
2、加入了使用代理ip功能
3、加入了cookies功能(为什么要加cookies功能,这个保密哦)
程序新增功能:
1、自动采集百度热点关键词
2、增加了专题功能,更易于搜索引擎排名。
3、增加了分词功能,使内容聚合相关度更高。
4、删除了一些华而不实的sql语句,将服务器资源节省到底。
程序大概介绍:
注意:本程序是直接采集百度网盘资源的,并且会保存到数据库里面,非市面上见到的小偷类的程序。
1、前段经过细致的seo优化处理过,基本不用修改什么内容,拿来直接可以用。
2、程序可以承载亿级数据,所以不用担心以后数据多了会怎样
3、网盘资源下载页面 做了相关内容聚合优化,并且对相关推荐做了文件的分类。
4、分词功能
演示截图:只截图了首页和资源详情页,其余页面请打开网址查看。
首页截图
资源详情页截图:
以上是关于百度网盘搜索源码,新加分词功能,内容相关度聚合更高的主要内容,如果未能解决你的问题,请参考以下文章