从pandas数据框架中的模式中提取字符串。
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从pandas数据框架中的模式中提取字符串。相关的知识,希望对你有一定的参考价值。
我有一个数据框,里面有一列字符串,如下所示。
1 Janus Henderson Research Fund Class N
2 Calvert Equity Fund Class A
3 Invesco Diversified Dividend Fund R5 Class
4 Prudential Day One 2035 Fund Class R3
5 TETON Convertible Securities Fund Class C
...
24991 BlackRock Asian Dragon Fund,Inc.Class R
24993 MFS Blended Research International Equity Fund...
24994 ClearBridge Small Cap Fund Class A
24995 Federated Equity Income Fund, Inc. Class A Shares
我想提取每行的类,例如第1行是N类,第2行是A类,等等......有些行没有类这个词,我希望是NA类。
你可以写一个解析函数,接收一行并查找 "Class "这个词,然后返回它旁边的任何内容。txt.split('Class')
比如说。编写完这个函数后,你可以使用 apply()
(dataframe方法)来分别应用到每一行。
以上是关于从pandas数据框架中的模式中提取字符串。的主要内容,如果未能解决你的问题,请参考以下文章
如何从python中的pandas数据框中的列中提取关键字(字符串)
从 pandas DataFrame 中的文本中提取子字符串作为新列
从pandas DataFrame中另一列中的位置给定的字符串列中提取字符[重复]
从 pandas DataFrame 中的列中提取 JSON 数据