golang 去言语正规表现テスト

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了golang 去言语正规表现テスト相关的知识,希望对你有一定的参考价值。

#!/bin/bash
# -*- coding: utf-8 -*-

set -eux

echo "############################################################"
echo "文字列の有無の確認"
echo "############################################################"

echo "------------------------------------------------------------"
echo "go"
echo "------------------------------------------------------------"
go run ./match_string.go
echo "------------------------------------------------------------"
echo "python"
echo "------------------------------------------------------------"
python3 ./match_string.py

echo "############################################################"
echo "複数の文字列を取り出す+要素数を数える"
echo "############################################################"

echo "------------------------------------------------------------"
echo "go"
echo "------------------------------------------------------------"
go run ./find_all_string.go
echo "------------------------------------------------------------"
echo "python"
echo "------------------------------------------------------------"
python3 ./find_all_string.py

echo "############################################################"
echo "文字列を正規表現で置換する"
echo "############################################################"

echo "------------------------------------------------------------"
echo "go"
echo "------------------------------------------------------------"
go run ./replace_all_string.go
echo "------------------------------------------------------------"
echo "python"
echo "------------------------------------------------------------"
python3 ./replace_all_string.py

echo "############################################################"
echo "後方参照"
echo "############################################################"

echo "------------------------------------------------------------"
echo "go"
echo "------------------------------------------------------------"
go run ./backref.go
echo "------------------------------------------------------------"
echo "python"
echo "------------------------------------------------------------"
python3 ./backref.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import re

def main():
    p = re.compile(r"[0-4]\d")
    score = """
国語 : 43
数学 : 82
理科 : 92
社会 : 13
英語 : 21
    """
    print("置換前")
    print(score)
    print("置換後")
    print(re.sub(p, "70", score))

if __name__ == '__main__':
    main()


package main

import (
	"fmt"
	"regexp"
)

func main() {
	re := regexp.MustCompile(`[0-4]\d`)

	fmt.Println(`test ReplaceAllString <[0-4]\d>`)
	score := `
国語 : 43
数学 : 82
理科 : 92
社会 : 13
英語 : 21
`
	fmt.Println("置換前")
	fmt.Println(score)
	fmt.Println("置換後")
	fmt.Println(re.ReplaceAllString(score, "70"))
}
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import re

def main():
    p = re.compile(r"^https?://[^/]*/$")
    li = [
		"https://google.com/",
		"https://example.com/index.php",
		"C:\\workspace\\test\\go\\",
            ]
    for l in li:
        result = p.match(l) != None
        print("{:5s} : {}".format(str(result), l))

if __name__ == '__main__':
    main()


package main

import (
	"fmt"
	"regexp"
)

func main() {
	re := regexp.MustCompile(`^https?://[^/]*/$`)

	fmt.Println("test Match : <^https?://[^/]*/$>")
	li := []string{
		"https://google.com/",
		"https://example.com/index.php",
		`C:\workspace\test\go\`,
	}
	for _, v := range li {
		fmt.Printf("%5v : %v\n", re.MatchString(v), v)
	}
}
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import re

def main():
    p = re.compile(r"2000/01/\d{2}")
    text = """
1999/12/31 23:42:28 テスト
2000/01/01 00:00:00 サンプル
2000/01/01 13:01:20 Example
2000/01/01 13:50:09 ほげさんぷる
2000/01/02 17:00:03 foobar
2000/01/02 17:00:04 hogefuga
2000/01/02 17:00:05 hogepiyo
    """
    print(text)

    matched = p.findall(text)
    print("結果")
    print("見つけた要素 : ", matched)
    print("見つけた数 : ", len(matched))

if __name__ == '__main__':
    main()


package main

import (
	"fmt"
	"regexp"
)

func main() {
	fmt.Println(`test FindAllString : <2000/01/\d{2}>`)

	re := regexp.MustCompile(`2000/01/\d{2}`)
	fmt.Println("検証用サンプルテキスト")
	text := `
1999/12/31 23:42:28 テスト
2000/01/01 00:00:00 サンプル
2000/01/01 13:01:20 Example
2000/01/01 13:50:09 ほげさんぷる
2000/01/02 17:00:03 foobar
2000/01/02 17:00:04 hogefuga
2000/01/02 17:00:05 hogepiyo
`
	fmt.Println(text)

	matched := re.FindAllString(text, -1)
	fmt.Println("結果")
	fmt.Println("見つけた要素 : ", matched)
	fmt.Println("見つけた数 : ", len(matched))
}
############################################################
文字列の有無の確認
############################################################
------------------------------------------------------------
go
------------------------------------------------------------
test Match : <^https?://[^/]*/$>
 true : https://google.com/
false : https://example.com/index.php
false : C:\workspace\test\go\
------------------------------------------------------------
python
------------------------------------------------------------
True  : https://google.com/
False : https://example.com/index.php
False : C:\workspace\test\go\
############################################################
複数の文字列を取り出す+要素数を数える
############################################################
------------------------------------------------------------
go
------------------------------------------------------------
test FindAllString : <2000/01/\d{2}>
検証用サンプルテキスト

1999/12/31 23:42:28 テスト
2000/01/01 00:00:00 サンプル
2000/01/01 13:01:20 Example
2000/01/01 13:50:09 ほげさんぷる
2000/01/02 17:00:03 foobar
2000/01/02 17:00:04 hogefuga
2000/01/02 17:00:05 hogepiyo

結果
見つけた要素 :  [2000/01/01 2000/01/01 2000/01/01 2000/01/02 2000/01/02 2000/01/02]
見つけた数 :  6
------------------------------------------------------------
python
------------------------------------------------------------

1999/12/31 23:42:28 テスト
2000/01/01 00:00:00 サンプル
2000/01/01 13:01:20 Example
2000/01/01 13:50:09 ほげさんぷる
2000/01/02 17:00:03 foobar
2000/01/02 17:00:04 hogefuga
2000/01/02 17:00:05 hogepiyo
    
結果
見つけた要素 :  ['2000/01/01', '2000/01/01', '2000/01/01', '2000/01/02', '2000/01/02', '2000/01/02']
見つけた数 :  6
############################################################
文字列を正規表現で置換する
############################################################
------------------------------------------------------------
go
------------------------------------------------------------
test ReplaceAllString <[0-4]\d>
置換前

国語 : 43
数学 : 82
理科 : 92
社会 : 13
英語 : 21

置換後

国語 : 70
数学 : 82
理科 : 92
社会 : 70
英語 : 70

------------------------------------------------------------
python
------------------------------------------------------------
置換前

国語 : 43
数学 : 82
理科 : 92
社会 : 13
英語 : 21
    
置換後

国語 : 70
数学 : 82
理科 : 92
社会 : 70
英語 : 70
    
############################################################
後方参照
############################################################
------------------------------------------------------------
go
------------------------------------------------------------
 true : 田中 太郎 : 太郎 田中
 true : 山本 次郎 : 次郎 山本
false : ほげ山 三郎 : ほげ山 三郎
 true : ばー ふー : ふー ばー
 true : hoge	piyo : piyo hoge
------------------------------------------------------------
python
------------------------------------------------------------
True  : 田中 太郎 : 太郎 田中
True  : 山本 次郎 : 次郎 山本
True  : ほげ山 三郎 : 三郎 ほげ山
True  : ばー ふー : ふー ばー
True  : hoge	piyo : piyo hoge
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import re

def main():
    p = re.compile(r"^([^\s]+)\s([^\s]+)$")
    names = [
        "田中 太郎",
        "山本 次郎",
        "ほげ山 三郎",
        "ばー ふー",
        "hoge	piyo",
            ]
    for name in names:
        match = p.match(name) != None
        rep = re.sub(p, "\\2 \\1", name)
        print("{:5s} : {} : {}".format(str(match), name, rep))

if __name__ == '__main__':
    main()


package main

import (
	"fmt"
	"regexp"
)

func main() {
	re := regexp.MustCompile(`^([^\s]+)\s([^\s]+)$`)
	names := []string{
		"田中 太郎",
		"山本 次郎",
		"ほげ山 三郎",
		"ばー ふー",
		"hoge	piyo",
	}
	for _, v := range names {
		m := re.MatchString(v)
		rep := re.ReplaceAllString(v, "$2 $1")
		fmt.Printf("%5v : %s : %s\n", m, v, rep)
	}
}

ruby テキストから日本语を抜き出す正规表现。失败パターン,成功パターン

require 'pp'

Japanese = %r/[
  \p{Hiragana}
  \p{InKatakana}
  \p{Han}
  \p{InCJKSymbolsAndPunctuation}
  \p{InCJKUnifiedIdeographs}
]{2,}/x # `+` -> `{2,}`

str = <<EOF
text in English
日本語のテキスト
にほんご の テキスト
EOF

pp str.scan(Japanese)
# => ["\n日本語のテキスト\nにほんご の テキスト\n"]
require 'pp'

Japanese = %r/[
  \p{Hiragana}
  \p{InKatakana}
  \p{Han}
  \p{InCJKSymbolsAndPunctuation}
  \p{InCJKUnifiedIdeographs}
]+/x

str = <<EOF
text in English
日本語のテキスト
にほんご の テキスト
EOF

pp str.scan(Japanese)
# => [" ", " ", "\n日本語のテキスト\nにほんご の テキスト\n"]

pp str.scan(Japanese).select{|x| !x.include? ' '}
# => ["\n日本語のテキスト\nにほんご の テキスト\n"]

以上是关于golang 去言语正规表现テスト的主要内容,如果未能解决你的问题,请参考以下文章

c_cpp ç言语で正规表现で検索を行う

python 蟒蛇はリスト内包表记の中で正规表现が使えるとのこと。テキスト处理に使えそう。

ruby テキストから日本语を抜き出す正规表现。失败パターン,成功パターン

php Gist Publicテスト

php ログイン认证テスト

php テスト