如何在 URDU 语言文本上进行 NLP? [关闭]

Posted

技术标签:

【中文标题】如何在 URDU 语言文本上进行 NLP? [关闭]【英文标题】:How to do NLP over URDU language text? [closed] 【发布时间】:2019-05-29 21:09:09 【问题描述】:

我想对乌尔都语文本进行 NLP。但我不知道从哪里开始。

例如,当我对英文文本进行 NLP 时,我使用 NLTK 或 spacy 库 在 Spacy 中,我为此加载了英文模型。

但是,如果它没有像乌尔都语或任何其他语言这样的语言模型怎么办? 具体来说,我想做情感分析,或者在给定的句子中找到词性,如名词、形容词动词等

我该如何开始呢?

【问题讨论】:

NLP 是一个非常广泛的术语。你应该说出你想要表演的内容。 @BhaskarDhariyal 我想做情感分析,或者在给定的句子中找到词性,比如名词、形容词动词等 这里有一堆库可以帮助你入门:github.com/topics/urdu-nlp 【参考方案1】:

要从头开始找到乌尔都语句子的词性是一项艰巨的任务,首先你必须创建一个带有正确注释的词性标签的巨大语料库,并且你必须训练一个模型(已经可以用于英语)。

因此可行的方法是使用语言翻译 A​​PI 将句子翻译成英文并进行情感分析等。

【讨论】:

以上是关于如何在 URDU 语言文本上进行 NLP? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

论文泛读180反向翻译任务自适应预训练:提高文本分类的准确性和鲁棒性

论文泛读180反向翻译任务自适应预训练:提高文本分类的准确性和鲁棒性

使用 Nastaleeq Urdu 字体的内容的 HTML 文本到 NSString 转换

如何强制文本框中的输入语言为英语

在 JAVA 中使用哪个 NLP 工具包? [关闭]

如何在 KeyUp 上进行文本框回发?