python利用交集计算词类标签的分类

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python利用交集计算词类标签的分类相关的知识,希望对你有一定的参考价值。

在词分类中经常有以下标签:
‘ab‘,‘ba‘,‘‘,‘13‘,‘1‘,‘3‘,‘bc3‘,‘ab24‘
那么,如何将这些标签归入各标签的子类中呢?

mystr=[‘ab‘,‘ba‘,‘‘,‘13‘,‘1‘,‘3‘,‘bc3‘,‘ab24‘]
myl=dict()
for k1 in mystr:
    for k2 in mystr:
        if len(set(k1).intersection(k2))==len(set(k1)) :
            myl.setdefault(k1,[]) 
            myl[k1].append(k2)
print(myl)

{‘ab‘: [‘ab‘, ‘ba‘, ‘ab24‘], ‘ba‘: [‘ab‘, ‘ba‘, ‘ab24‘], ‘‘: [‘ab‘, ‘ba‘, ‘‘, ‘13‘, ‘1‘, ‘3‘, ‘bc3‘, ‘ab24‘], ‘13‘: [‘13‘], ‘1‘: [‘13‘, ‘1‘], ‘3‘: [‘13‘, ‘3‘, ‘bc3‘], ‘bc3‘: [‘bc3‘], ‘ab24‘: [‘ab24‘]}

以上是关于python利用交集计算词类标签的分类的主要内容,如果未能解决你的问题,请参考以下文章

Python计算训练数据集(测试集)中某个分类变量阴性(阳性)标签样本的不同水平(level)或者分类值的统计个数以及比例

Python计算两个numpy数组的交集(Intersection)实战:两个输入数组的交集并排序获取交集元素及其索引如果输入数组不是一维的,它们将被展平(flatten),然后计算交集

Python获取两个文件的交集并集差集

Python简单的循环小编程

Python中verbaim标签使用详解

如何使用 sklearn.metrics 计算多标签分类任务的微观/宏观度量?