Geode上的Apache Lucene LatLonPoint查询

Posted

技术标签:

【中文标题】Geode上的Apache Lucene LatLonPoint查询【英文标题】:Apache Lucene LatLonPoint Query on Geode 【发布时间】:2017-09-26 12:20:07 【问题描述】:

我正在尝试对在 Geode 区域上创建的 Lucene 索引上的一些地理空间数据进行索引,并使用 Lucene's LatLonPoint 类查询方法(如 newDistanceQuerynewPolygonQuery 方法)对这些数据运行查询。运行应用程序一次返回正确的结果,但是当我第二次运行代码时,我得到以下异常:

org.apache.lucene.index.IndexNotFoundException: 
no segments* file found in RegionDirectory@4218500f lockFactory=
org.apache.lucene.store.SingleInstanceLockFactory@4bff64c2: files: []

这里是类:

服务器.java

public class Server 
final static Logger _logger = LoggerFactory.getLogger(Server.class);

public static void main(String[] args) throws InterruptedException 
    startServer();


/** Start a Geode Cache Server with a locator */
public static void startServer() throws InterruptedException 
    ServerLauncher serverLauncher = new ServerLauncher.Builder()
            .setMemberName("server1")
            .setServerPort(40404)
            .set("start-locator", "127.0.0.1[10334]")
            .set("jmx-manager", "true")
            .set("jmx-manager-start", "true")
            .build();

    ServerLauncher.ServerState state = serverLauncher.start();
    _logger.info(state.toString());

    Cache cache = new CacheFactory().create();
    createLuceneIndex(cache);
    cache.createRegionFactory(RegionShortcut.PARTITION).create("locationsRegion");


/** Create a Lucene Index with given cache */
public static void createLuceneIndex(Cache cache) throws InterruptedException 
    LuceneService luceneService = LuceneServiceProvider.get(cache);
    luceneService.createIndexFactory()
            .addField("NAME")
            .addField("LOCATION")
            .addField("COORDINATES")
            .create("locationsIndex", "locationsRegion");


Client.java

public class Client 
private static ClientCache cache;
private static Region<Integer, Document> region;

public static void main(String[] args) throws LuceneQueryException, InterruptedException, IOException 
    init();
    indexFiles();
    search();


/** Initialize the client cache and region */
private static void init() 
    cache = new ClientCacheFactory()
            .addPoolLocator("localhost", 10334)
            .create();

    if (cache != null) 
        region = cache.<Integer, Document>createClientRegionFactory(
                ClientRegionShortcut.CACHING_PROXY).create("locationsRegion");
     else 
        throw new NullPointerException("Client cache is null");
    


/** Add documents to the Lucene index */
private static void indexFiles() 
    // Dummy data
    List<Document> locations = Arrays.asList(
            DocumentBuilder.newSampleDocument("Exastax", 40.984929, 29.133506),
            DocumentBuilder.newSampleDocument("Galata Tower", 41.025826, 28.974378),
            DocumentBuilder.newSampleDocument("St. Peter and St. Paul Church", 41.024757, 28.972950));

    // Standart IndexWriter initialization.
    Analyzer analyzer = new StandardAnalyzer();
    // Create a directory from geode region
    Directory directory = RawLucene.returnRegionDirectory(cache, region, "locationsIndex");
    IndexWriterConfig indexWriterConfig = new IndexWriterConfig(analyzer);
    IndexWriter indexWriter;
    try 
        indexWriter = new IndexWriter(directory, indexWriterConfig);
        indexWriter.addDocuments(locations);
        indexWriter.commit();
        indexWriter.close();
     catch (IOException e) 
        e.printStackTrace();
    


/** Search in the Lucene index */
private static void search() 
    try 
        DirectoryReader reader = DirectoryReader.open(RawLucene.returnRegionDirectory(cache, region, "locationsIndex"));
        IndexSearcher indexSearcher = new IndexSearcher(reader);

        Query query = LatLonPoint.newDistanceQuery("COORDINATES", 41.024873, 28.974346, 500);
        ScoreDoc[] scoreDocs = indexSearcher.search(query, 10).scoreDocs;
        for (int i = 0; i < scoreDocs.length; i++) 
            Document doc = indexSearcher.doc(scoreDocs[i].doc);
            System.out.println(doc.get("NAME") + " --- " + doc.get("LOCATION"));
        
     catch (IOException e) 
        e.printStackTrace();
    


RawLucene.java

public class RawLucene 
public static Directory returnRegionDirectory(ClientCache cache, Region region, String indexName) 
    return new RegionDirectory(region,new FileSystemStats(cache.getDistributedSystem(), indexName));


DocumentBuilder.java

public class DocumentBuilder 
public static Document newSampleDocument(String name, Double lat, Double lon) 
    Document document = new Document();
    document.add(new StoredField("NAME", name));
    document.add(new StoredField("LOCATION", lat + " " + lon));
    document.add(new LatLonPoint("COORDINATES", lat, lon));
    return document;


这是我启动应用程序的方式:

    运行服务器类 使用所有三种方法运行 Client 类(初始运行。工作正常并返回正确结果) 在不调用indexFiles 方法的情况下运行客户端类。 (第二次运行。这是我得到异常的地方)

为什么代码第一次运行良好,第二次运行抛出异常?

【问题讨论】:

【参考方案1】:

看起来您正在使用 geode 的公共 API 和内部类 RegionDirectory 的组合。公共 API 仅支持通过将对象直接添加到区域来添加文档,并使用 LuceneService.createQueryFactory() 进行查询。

geode-lucene 模块在内部确实使用了 RegionDirectory,但它的使用方式与您使用的有点不同 - 它不是从客户端包装整个区域,而是在服务器端包装单个存储桶。

我认为这里发生的事情是 RegionDirectory 和底层 FileSystem 类正在使用一些 geode API,当您在客户端调用它们时,它们的行为会有所不同。特别是,我认为当 FileSystem 类查找文件时,它使用的是 Region.keySet,它与您的缓存客户端一起将返回缓存在客户端的文件列表。我认为这可以解释为什么您会收到关于没有文件的错误。

RegionDirectory 不是公共 API 并且不真正支持您尝试使用它的方式,这太糟糕了,因为这看起来是一个很好的用例。

【讨论】:

以上是关于Geode上的Apache Lucene LatLonPoint查询的主要内容,如果未能解决你的问题,请参考以下文章

SpringBoot:使用jpa实现对Apache Geode的基本操作

SpringBoot:使用jpa实现对Apache Geode的基本操作

Apache Geode 中的主从功能

用java连接apache geode

Apache Geode 的 Spring 数据教程二十

Apache Geode 的 Spring 数据教程二十