python 删除变音符号去掉文本中字符的附加符号

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 删除变音符号去掉文本中字符的附加符号相关的知识,希望对你有一定的参考价值。

# from Fluent Python chapter 4
import unicodedata
import string

def shave_marks(txt):
  """Remove all diacritics marks"""
  norm_txt = unicodedata.normalize('NFD', txt)
  shaved  = ''.join(c for c in norm_txt
                   if not unicodedata.combining(c))
  return unicodedata.normalize('NFC', shaved)


"""
In [5]: shave_marks('café')
Out[5]: 'cafe'
"""

以上是关于python 删除变音符号去掉文本中字符的附加符号的主要内容,如果未能解决你的问题,请参考以下文章

如何从 .NET 中的字符串中删除变音符号(重音符号)?

用英语等价物替换德语字符(变音符号、重音符号)

在 JavaScript 中删除字符串中的重音符号/变音符号

使用正则表达式剥离字符失败,使用带有变音符号,撇号,重音符号等的文字字符

MongoDB 匹配部分文本忽略重音符号(变音符号)

将非 ASCII 字符(变音符号、重音符号...)转换为最接近的 ASCII 等效字符(创建 slug)