OSError:[E050] 找不到模型“de”。它似乎不是快捷链接、Python 包或数据目录的有效路径

Posted

技术标签:

【中文标题】OSError:[E050] 找不到模型“de”。它似乎不是快捷链接、Python 包或数据目录的有效路径【英文标题】:OSError: [E050] Can't find model 'de'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory 【发布时间】:2020-10-30 12:19:27 【问题描述】:

所以我正在尝试制作一个 seq to seq 模型,用于在 kaggle notebook 和 google colab 等在线笔记本上使用 pytorch 将德语翻译成英语

import torch
import torch.nn as nn
import torch.optim as optim
from torchtext.datasets import Multi30k
from torchtext.data import Field, BucketIterator
import numpy as np
import spacy
import random
from torch.utils.tensorboard import SummaryWriter  # to print to tensorboard

导入的库,当我使用带有 spacy 的函数加载数据集时,如下所示,

spacy_ger = spacy.load("de")
spacy_eng = spacy.load("en")

出现此错误。: 。

到处都有“en”的解释,但没有“de”的解释。如果有人可以帮助解决这个问题。

规格:

包:版本

空间:2.3.1

pytorch-crf:0.7.0

火炬:1.5.1

torchnlp:0.0.0.1

火炬文本:0.4.0

火炬视觉:0.6.1

jupyter 张量板:0.2.0

张量板:2.2.2

张量板插件机智:1.7.0

提前感谢您的帮助。

【问题讨论】:

可以肯定的是,您是否在尝试加载之前下载了德国模型? @ZakSoliman 是的,我尝试下载它们,但在下载时出现错误:_ no compatible model for 'de_core_news_md' (spaCy v2.0.12)_ 【参考方案1】:

所以整整一个月后,尝试其他事情并探索与此主题相关的问题和问题,我找到了这样做的方法,

  import spacy.cli 
  spacy.cli.download("en_core_web_md")

使用这种方法,您可以使用和导入任何 spacy 模型,无论是中型还是大型数据集,如果您尝试使用 spacy.load 因为它对于在 Google colab 或 Kaggle 笔记本或任何其他在线笔记本中加载除 sm 或最小尺寸数据集以外的数据集无效。

【讨论】:

您绝对可以在笔记本中加载mdlg 模型。您只需要在下载后重新启动运行时,以确保 Python 正确注册了新包。或者更好的是:在您预先设置并安装了正确软件包的虚拟环境中运行您的笔记本。 @Sofie VL 实际上我的电脑上没有安装 nvidia gpu,所以除了在线笔记本我别无选择,这就是我没有使用虚拟环境的原因,否则它工作正常在机器上。【参考方案2】:

接受的答案对我不起作用,而且问题是德语,而不是英语。

因此,您需要下载de 文件:

在终端中运行以下代码

python -m spacy download de

下载完成后,spacy.load("de")应该可以正常使用了。

如果您使用的是英文,那么只需使用以下方式下载英文文件:

python -m spacy download en

【讨论】:

其实,你是对的,我给出了如何下载英语语言包的例子。类似地,我们也可以下载任何其他语言的包。对于德语,您可以使用 !python -m spacy download de_core_news_md

以上是关于OSError:[E050] 找不到模型“de”。它似乎不是快捷链接、Python 包或数据目录的有效路径的主要内容,如果未能解决你的问题,请参考以下文章

OSError:标签:找不到文件“Gilroy-light.ttf”

OSError: [WinError 126] 在 Python 中找不到指定的模块

由于 scipy,sklearn 导入失败。 OSError: [WinError 126] 找不到指定的模块

OSError: [WinError 126] 找不到指定的模块。 Error loading “......caffe2_nvrtc.dll“ or one of its dependencies.

错误:无法写入字节码。该系统找不到指定的路径。 (os error 3). 编译基板节点模板时出错

ITMS-90626:无效的 Siri 支持 - 自定义意图的本地化标题:找不到区域设置的“配置”:de_DE