ruby テキストから日本语を抜き出す正规表现。失败パターン,成功パターン
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ruby テキストから日本语を抜き出す正规表现。失败パターン,成功パターン相关的知识,希望对你有一定的参考价值。
require 'pp'
Japanese = %r/[
\p{Hiragana}
\p{InKatakana}
\p{Han}
\p{InCJKSymbolsAndPunctuation}
\p{InCJKUnifiedIdeographs}
]{2,}/x # `+` -> `{2,}`
str = <<EOF
text in English
日本語のテキスト
にほんご の テキスト
EOF
pp str.scan(Japanese)
# => ["\n日本語のテキスト\nにほんご の テキスト\n"]
require 'pp'
Japanese = %r/[
\p{Hiragana}
\p{InKatakana}
\p{Han}
\p{InCJKSymbolsAndPunctuation}
\p{InCJKUnifiedIdeographs}
]+/x
str = <<EOF
text in English
日本語のテキスト
にほんご の テキスト
EOF
pp str.scan(Japanese)
# => [" ", " ", "\n日本語のテキスト\nにほんご の テキスト\n"]
pp str.scan(Japanese).select{|x| !x.include? ' '}
# => ["\n日本語のテキスト\nにほんご の テキスト\n"]
以上是关于ruby テキストから日本语を抜き出す正规表现。失败パターン,成功パターン的主要内容,如果未能解决你的问题,请参考以下文章
sh SlackのログからURL取得以外のものを抜き出す.jq,ruby必须
ruby 正规表现による文字列の抜き出しとその変换
python 蟒蛇はリスト内包表记の中で正规表现が使えるとのこと。テキスト处理に使えそう。
ruby 雅虎JAPANが提供するテキスト解析WebAPIを利用して,テキストに振り仮名をる
ruby 与えられたカッコ(なんでも。开きと闭じとの定义を引数にくれればいい)内を抜き出します。 ruby extract_between_parentheses.rb“「」「YOUR_FILE_NA
ruby EVALメソッドは実行中のコンテキストを共有するが,変数の宣言はできない