从pandas数据框架中的模式中提取字符串。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从pandas数据框架中的模式中提取字符串。相关的知识,希望对你有一定的参考价值。

我有一个数据框,里面有一列字符串,如下所示。

1 Janus Henderson Research Fund Class N 2 Calvert Equity Fund Class A 3 Invesco Diversified Dividend Fund R5 Class 4 Prudential Day One 2035 Fund Class R3 5 TETON Convertible Securities Fund Class C ... 24991 BlackRock Asian Dragon Fund,Inc.Class R 24993 MFS Blended Research International Equity Fund... 24994 ClearBridge Small Cap Fund Class A 24995 Federated Equity Income Fund, Inc. Class A Shares

我想提取每行的类,例如第1行是N类,第2行是A类,等等......有些行没有类这个词,我希望是NA类。

答案

你可以写一个解析函数,接收一行并查找 "Class "这个词,然后返回它旁边的任何内容。txt.split('Class') 比如说。编写完这个函数后,你可以使用 apply() (dataframe方法)来分别应用到每一行。

以上是关于从pandas数据框架中的模式中提取字符串。的主要内容,如果未能解决你的问题,请参考以下文章

如何从python中的pandas数据框中的列中提取关键字(字符串)

从 pandas DataFrame 中的文本中提取子字符串作为新列

从pandas DataFrame中另一列中的位置给定的字符串列中提取字符[重复]

从 pandas DataFrame 中的列中提取 JSON 数据

如何在 pandas DataFrame 中的字符串模式后提取数字并在 python 中创建新功能

Pandas 从字符串中提取数字