什么样的数据库以及如何创建它来对文本进行分层分类?

Posted

技术标签:

【中文标题】什么样的数据库以及如何创建它来对文本进行分层分类?【英文标题】:What kind of database and how to create it to hierarchically categorize text? 【发布时间】:2011-06-05 15:14:18 【问题描述】:

它是一个我将从头开始的应用程序。我希望将 jsp 与 phpmyadmin 和 mysql 数据库一起使用。但我不知道我应该如何创建我的数据库...我的数据是这样的

img833.imageshack.us/img833/9901/89112252.png

EG 输入文本:“描述下图”(所以描述在 Perception P1 Physchomotor Domain 中)输出将是:Perception p1, Physchomotor Domain

但是还有 3 个域使它像一个层次结构,其中域是 p1、p2 的父级等等......我如何像这样构建我的数据库?不同的域有不同数量的p1,p2

【问题讨论】:

【参考方案1】:

我不完全确定你的数据集是什么或它应该做什么,但我会给你一些提示。

您似乎有“域”,这将是您的对象模型(数据库中的一个表)。这些域可以有一个或多个父级或子级,因此您将需要一个包含父级 ID 的列(这将使您能够执行查询以查找父级或子级)。对于任何层次结构,这通常是您所需要的。然后,您将需要 1 列或更多列的数据。例如,我想你会想要一个名为“words”的列,它是一个字符串列表,可能存储为 text 或 varchar 数据类型。

顺便说一句,如果你需要好的帮助,你应该尽量让你的问题更清楚,并使用良好的拼写和语法。当问题的框架正确时,人们更愿意提供帮助。

【讨论】:

以上是关于什么样的数据库以及如何创建它来对文本进行分层分类?的主要内容,如果未能解决你的问题,请参考以下文章

使用 StanfordNLP 分类器进行分词的文本分类器

应该使用啥相似性度量来对这些序列进行分类?

循环神经网络实践—文本分类

循环神经网络实践—文本分类

SVM 多类文本分类

我应该使用哪种聊天文本数据表示来进行用户分类? [关闭]