FSCrawler 找不到现有的工作
Posted
技术标签:
【中文标题】FSCrawler 找不到现有的工作【英文标题】:FSCrawler can't find existing jobs 【发布时间】:2020-05-26 16:06:07 【问题描述】:我是 Elastic Stack 的新手,想使用 FSCrawler 来索引文档。我遇到了一个奇怪的问题:
我创建了一个新作业,并确认它已成功创建。我可以看到新创建的带有作业名的文件夹。
问题是,FSCrawler 无法找到新生成的作业。
我在 PS 中使用以下命令生成作业:
PS C:\ELK\fscrawler> bin/fscrawler testJobLaaKii
10:22:28,708 INFO [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.4mb/247.5mb=3.43%], RAM [2.4gb/7.8gb=31.33%], Swap [4.6gb/12.5gb=37.33%].
10:22:28,724 WARN [f.p.e.c.f.c.FsCrawlerCli] job [testJobLaaKii] does not exist
10:22:28,726 INFO [f.p.e.c.f.c.FsCrawlerCli] Do you want to create it (Y/N)?
y
10:22:31,190 INFO [f.p.e.c.f.c.FsCrawlerCli] Settings have been created in [C:\Users\<username>\.fscrawler\testJobLaaKii\_settings.yaml]. Please review and edit before relaunch
但是每当我想启动它时,FSCrawler 似乎都找不到它。
PS C:\ELK\fscrawler> bin/fscrawler
10:24:49,361 INFO [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.6mb/247.5mb=3.48%], RAM [2.4gb/7.8gb=31.38%], Swap [4.6gb/12.5gb=37.06%].
10:24:49,373 INFO [f.p.e.c.f.c.FsCrawlerCli] No job specified. Here is the list of existing jobs:
10:24:49,378 INFO [f.p.e.c.f.c.FsCrawlerCli] No job exists in [C:\Users\<username>\.fscrawler].
10:24:49,378 INFO [f.p.e.c.f.c.FsCrawlerCli] To create your first job, run 'fscrawler job_name' with 'job_name' you want
即使明确创建了工作:
【问题讨论】:
【参考方案1】:Sooo,找到这个视频后:Indexing many PDF files for full-text search using Elasticsearch
我使用他在视频中显示的命令解决了它:
bin\fscrawler --config_dir ./DS data_science --loop 1
而不是我的较短版本。我不知道使用较短版本有什么问题,并且在执行bin\fscrawl
时仍然看不到我的工作列表,但不知何故它可以工作......
【讨论】:
以上是关于FSCrawler 找不到现有的工作的主要内容,如果未能解决你的问题,请参考以下文章
带有 Docker 的 Rails '在任何资源中都找不到 ...' 用于现有的 gem
Pyinstaller 和 PyQt5 出错“找不到现有的 PyQt5 插件目录”
电脑/笔记本重装系统“我们无法创建新的分区,也找不到现有的分区”问题解决
电脑/笔记本重装系统“我们无法创建新的分区,也找不到现有的分区”问题解决