PHP搜索优化 sphinx

Posted 懒牛拉车

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PHP搜索优化 sphinx相关的知识,希望对你有一定的参考价值。

安装。环境:win7 64位

1、下载sphinx文件包

下载地址:http://sphinxsearch.com/downloads/archive/

2、解压到D:/sphinx。新建文件夹data 和 log,在本地test库中,导入example.sql文件。结构如下

3、配置 复制sphinx.conf.in文件到bin目录下。重命名为sphinx.conf。配置内容如下。每一行代表什么意思,目前我也说不清楚,后续吧...

注意两点:红色为我修改过的内容,黄底的地方,命名需要一致。

# 配置数据源
source src1
{
    type            = mysql
    sql_host        = localhsot
    sql_user        = root
    sql_pass        = 
    sql_db          = test
    sql_port        = 3306    
    sql_query_pre    = SET NAMES utf8
    sql_query        = SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content \\
        FROM documents
    sql_attr_uint        = group_id
    sql_attr_timestamp    = date_added
    sql_ranged_throttle    = 0
}

source src1throttled : src1
{
    sql_ranged_throttle    = 100
}

# 配置数据源生成的索引文件存放的位置
index test1
{
    source            = src1
    path            = D:/sphinx/data/test1  # 注意此处包含生成的文件路径和名称。会在data目录下生成test1.***格式的文件
    charset_table     = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
    docinfo            = extern
    dict            = keywords
    mlock            = 0
    morphology        = none
    min_word_len    = 1
    ngram_len        = 1
    ngram_chars        = U+3000..U+2FA1F
    html_strip        = 0
}
 
indexer
{
    mem_limit        = 128M
}

# 配置Sphinx服务器的信息
searchd
{
    listen            = 9312
    listen            = 9306:mysql41
    log                = D:/sphinx/log/searchd.log
    query_log        = D:/sphinx/log/query.log
    read_timeout        = 5
    client_timeout        = 300
    max_children        = 30
    persistent_connections_limit    = 30
    pid_file            = D:/sphinx/log/searchd.pid
    preopen_indexes        = 1
    unlink_old            = 1
    mva_updates_pool    = 1M
    max_packet_size        = 8M
    max_filters            = 256
    max_filter_values    = 4096
    max_batch_queries    = 32
    workers                = threads 
  # windows下启动searchd服务一定要注释掉这个
  # seamless_rotate  = 1
}

4、建立索引

indexer.exe test1

5、启动服务

searchd.exe --pidfile

或者

searchd

也可以制作成.bat文件,方便快速启动。新建文件“测试.bat”,用文本编辑器打开,写入如下内容。可以根据自己环境,自行修改。双击即可启动sphinx

@echo off 
d: 
cd\\sphinx/bin
searchd

6、如果需要关闭服务,直接关闭DOC窗口

7、(拓展)php安装sphinx拓展就大概说一下。也可以不安装拓展,代码中引入文件即可

require(\'sphinxapi.php\');

ext下加入dll文件

下载地址:http://pecl.php.net/package/sphinx

php.ini下配置。重启apache

extension=php_sphinx.dll

到此配置结束。

 

测试用例1。输出符合搜索关键词的ID

<?php

 # 如果php中安装了sphinx.dll拓展,则不需要这一行代码
 require(\'sphinxapi.php\');

$keyword = \'test\';
$sphinx = new SphinxClient;
$sphinx->setServer("localhost", 9312);
$sphinx->setMatchMode(SPH_MATCH_ANY);   //匹配模式 ANY为关键词自动拆词,ALL为不拆词匹配(完全匹配)
$sphinx->SetArrayResult ( true );    //返回的结果集为数组
$result = $sphinx->query($keyword,"test1");    //星号为所有索引源
$count=$result[\'total\'];        //查到的结果条数
$time=$result[\'time\'];            //耗时
$arr=$result[\'matches\'];        //结果集
$id=\'\';
for($i=0;$i<$count;$i++){
    $id.=$arr[$i][\'id\'].\',\';
}
$id=substr($id,0,-1);            //结果集的id字符串

echo $id;

结果展示:

 

测试用例2。符合搜索关键词高亮

<?php
# 如果php中安装了sphinx.dll拓展,则不需要这一行代码
 require(\'sphinxapi.php\'); $keyword
= \'test\'; $sphinx = new SphinxClient(); $sphinx->SetServer(\'localhost\',9312); $sphinx->setMatchMode(SPH_MATCH_ANY);//匹配模式 SPH_MATCH_ALL:完全匹配 $result = $sphinx->query($keyword,\'*\');//*表示在所有索引里面进行搜索 $ids = implode(\',\',array_keys($result[\'matches\'])); $conn = mysqli_connect(\'localhost\',\'root\',\'\'); mysqli_query($conn,\'set names utf8\'); mysqli_select_db($conn,\'test\'); $sql = "select * from documents where id in (".$ids.")"; $rst = mysqli_query($conn,$sql); //给匹配关键字添加样式 $opts = array( \'before_match\'=>\'<font style="font-weight:bold;color:#f00;">\', \'after_match\'=>\'</font>\' ); echo \'<pre>\'; while($row = mysqli_fetch_assoc($rst)){ $row2 = $sphinx->buildExcerpts($row,\'test1\',$keyword,$opts);//test1 配置文件中的主数据源索引 print_r($row2); }

 结果展示

 用定时任务,自动更新索引,可以参考网址:http://v9.help.phpcms.cn/html/2010/search_0919/35.html

以上是关于PHP搜索优化 sphinx的主要内容,如果未能解决你的问题,请参考以下文章

php_sphinx安装使用

Sphinx、reStructuredText 显示/隐藏代码片段

Sphinx - 在代码块片段中使用省略号 (...)

PHP中使用Sphinx中文全文检索/搜索

用sphinx给PHP加个给力的搜索功能

php中使用sphinx搜索引擎