获取字符串中两个字符串之间的字符串
Posted
技术标签:
【中文标题】获取字符串中两个字符串之间的字符串【英文标题】:Get string between two strings in a string 【发布时间】:2013-06-22 16:00:52 【问题描述】:我有一个类似的字符串:
"super example of string key : text I want to keep - end of my string"
我只想保留"key : "
和" - "
之间的字符串。我怎样才能做到这一点?我必须使用正则表达式还是可以使用其他方式?
【问题讨论】:
使用substring
和indexof
获取字符串中特定字符串之后和另一个特定字符串之前的字符串,该字符串也包含在前一个字符串所在的字符串中..
您还在犹豫选择哪个答案吗?
【参考方案1】:
或许,一个好办法就是剪掉一个子串:
String St = "super exemple of string key : text I want to keep - end of my string";
int pFrom = St.IndexOf("key : ") + "key : ".Length;
int pTo = St.LastIndexOf(" - ");
String result = St.Substring(pFrom, pTo - pFrom);
【讨论】:
【参考方案2】:string input = "super exemple of string key : text I want to keep - end of my string";
var match = Regex.Match(input, @"key : (.+?)-").Groups[1].Value;
或仅使用字符串操作
var start = input.IndexOf("key : ") + 6;
var match2 = input.Substring(start, input.IndexOf("-") - start);
【讨论】:
【参考方案3】:你可以不用正则表达式
input.Split(new string[] "key :",StringSplitOptions.None)[1]
.Split('-')[0]
.Trim();
【讨论】:
这会在内存中创建多个不需要的字符串。如果您关心内存,请不要使用它。【参考方案4】:这是我的方法
public string Between(string STR , string FirstString, string LastString)
string FinalString;
int Pos1 = STR.IndexOf(FirstString) + FirstString.Length;
int Pos2 = STR.IndexOf(LastString);
FinalString = STR.Substring(Pos1, Pos2 - Pos1);
return FinalString;
【讨论】:
这是我在修复很多事情后最终使用的那个。错误:Pos2 应该是 STR.IndexOf(LastString, Pos1) 以便从 Pos1 开始。需要进一步检查 0 Pos 值。【参考方案5】:根据您希望实现的健壮/灵活程度,这实际上可能有点棘手。这是我使用的实现:
public static class StringExtensions
/// <summary>
/// takes a substring between two anchor strings (or the end of the string if that anchor is null)
/// </summary>
/// <param name="this">a string</param>
/// <param name="from">an optional string to search after</param>
/// <param name="until">an optional string to search before</param>
/// <param name="comparison">an optional comparison for the search</param>
/// <returns>a substring based on the search</returns>
public static string Substring(this string @this, string from = null, string until = null, StringComparison comparison = StringComparison.InvariantCulture)
var fromLength = (from ?? string.Empty).Length;
var startIndex = !string.IsNullOrEmpty(from)
? @this.IndexOf(from, comparison) + fromLength
: 0;
if (startIndex < fromLength) throw new ArgumentException("from: Failed to find an instance of the first anchor");
var endIndex = !string.IsNullOrEmpty(until)
? @this.IndexOf(until, startIndex, comparison)
: @this.Length;
if (endIndex < 0) throw new ArgumentException("until: Failed to find an instance of the last anchor");
var subString = @this.Substring(startIndex, endIndex - startIndex);
return subString;
// usage:
var between = "a - to keep x more stuff".Substring(from: "-", until: "x");
// returns " to keep "
【讨论】:
我使用了你的代码,但我在 @this.IndexOf(until, startIndex + fromLength, comparison) 中发现了一个小错误,来自像“AB”这样的字符串,其中 A 来自,B 是直到,所以我从长度中删除了 +。不过我还没有深入测试过 @AdrianIftode:好电话。这绝对是一个错误。在 startIndex 开始搜索第二个锚点是有意义的,因为这已经超过了第一个锚点的末尾。我已经在这里修复了代码。InvariantCulture
不适用于 Windows 通用应用。有什么办法可以在保留班级功能的情况下删除它? @ChaseMedallion
@Leon:您应该能够删除所有与文化相关的内容,.NET 将只使用当前文化进行 indexOf 操作。不过,我对 Windows 通用应用程序并不熟悉,所以我不能肯定。【参考方案6】:
我认为这可行:
static void Main(string[] args)
String text = "One=1,Two=2,ThreeFour=34";
Console.WriteLine(betweenStrings(text, "One=", ",")); // 1
Console.WriteLine(betweenStrings(text, "Two=", ",")); // 2
Console.WriteLine(betweenStrings(text, "ThreeFour=", "")); // 34
Console.ReadKey();
public static String betweenStrings(String text, String start, String end)
int p1 = text.IndexOf(start) + start.Length;
int p2 = text.IndexOf(end, p1);
if (end == "") return (text.Substring(p1));
else return text.Substring(p1, p2 - p1);
【讨论】:
【参考方案7】:正则表达式在这里是多余的。
您可以将string.Split
与将string[]
用作分隔符的重载一起使用,但这也是矫枉过正的。
查看Substring
和IndexOf
- 前者用于获取给定字符串的部分内容、索引和长度,后者用于查找内部字符串/字符的索引。
【讨论】:
这不是矫枉过正...事实上我会说 Substring 和 IndexOf 是矫枉过正。我会说 string.Split 是正确的。正则表达式是多余的。 过度杀戮或杀戮不足的意义没有实际意义,因为答案满足了发帖人的要求,即以不同于正则表达式的方式。 @newStackExchangeInstance:如果“key:”之前有一个“-”,它也会失败。子字符串是正确的。 @newStackExchangeInstance - 我相信他说的是string.Split
。【参考方案8】:
一个有效的 LINQ 解决方案:
string str = "super example of string key : text I want to keep - end of my string";
string res = new string(str.SkipWhile(c => c != ':')
.Skip(1)
.TakeWhile(c => c != '-')
.ToArray()).Trim();
Console.WriteLine(res); // text I want to keep
【讨论】:
这仅适用于单字符占位符吗? 它只适用于单个字符,不是 OP 要求的,应该被否决【参考方案9】: string str="super exemple of string key : text I want to keep - end of my string";
int startIndex = str.IndexOf("key") + "key".Length;
int endIndex = str.IndexOf("-");
string newString = str.Substring(startIndex, endIndex - startIndex);
【讨论】:
您的代码将导致冒号返回到 newString 的开头。【参考方案10】:由于:
和-
是独一无二的,您可以使用:
string input;
string output;
input = "super example of string key : text I want to keep - end of my string";
output = input.Split(new char[] ':', '-' )[1];
【讨论】:
这个答案并没有为已经大量的现有答案添加任何有意义的东西。【参考方案11】:或者,使用正则表达式。
using System.Text.RegularExpressions;
...
var value =
Regex.Match(
"super exemple of string key : text I want to keep - end of my string",
"key : (.*) - ")
.Groups[1].Value;
running example。
你可以决定它是否矫枉过正。
或
作为一种未得到验证的扩展方法
using System.Text.RegularExpressions;
public class Test
public static void Main()
var value =
"super exemple of string key : text I want to keep - end of my string"
.Between(
"key : ",
" - ");
Console.WriteLine(value);
public static class Ext
static string Between(this string source, string left, string right)
return Regex.Match(
source,
string.Format("0(.*)1", left, right))
.Groups[1].Value;
【讨论】:
当字符串包含'-'时这不起作用例如:"Equipment=1,ExternalAntenna=1-1-2,AuxPlugInUnit=2,".Between("ExternalAntenna=",", ") 返回 "1-1-2,AuxPlugInUnit=2" 下面这个答案能够处理我的情况***.com/a/38794506/193974【参考方案12】:我使用了来自 Vijay Singh Rana 的代码 sn-p,它基本上可以完成这项工作。但如果firstString
确实已经包含lastString
,则会导致问题。我想要的是从 JSON 响应中提取 access_token(没有加载 JSON 解析器)。我的firstString
是\"access_token\": \"
,我的lastString
是\"
。最后我做了一点修改
string Between(string str, string firstString, string lastString)
int pos1 = str.IndexOf(firstString) + firstString.Length;
int pos2 = str.Substring(pos1).IndexOf(lastString);
return str.Substring(pos1, pos2);
【讨论】:
存在冗余。将 pos1 添加到 pos2,然后从 pos2 中减去。【参考方案13】:在 C# 8.0 及更高版本中,您可以使用范围运算符..
,如
var s = "header-THE_TARGET_STRING.7z";
var from = s.IndexOf("-") + "-".Length;
var to = s.IndexOf(".7z");
var versionString = s[from..to]; // THE_TARGET_STRING
详情请见documentation。
【讨论】:
我喜欢 C# 8 及以上版本的简写方法!【参考方案14】:您可以使用下面的扩展方法:
public static string GetStringBetween(this string token, string first, string second)
if (!token.Contains(first)) return "";
var afterFirst = token.Split(new[] first , StringSplitOptions.None)[1];
if (!afterFirst.Contains(second)) return "";
var result = afterFirst.Split(new[] second , StringSplitOptions.None)[0];
return result;
用法是:
var token = "super exemple of string key : text I want to keep - end of my string";
var keyValue = token.GetStringBetween("key : ", " - ");
【讨论】:
【参考方案15】:var matches = Regex.Matches(input, @"(?<=key :)(.+?)(?=-)");
这仅返回“key :”和以下出现的“-”之间的值
【讨论】:
【参考方案16】:如果您正在寻找 1 行解决方案,就是这样:
s.Substring(s.IndexOf("eT") + "eT".Length).Split("97".ToCharArray()).First()
全1行解决方案,用System.Linq
:
using System;
using System.Linq;
class OneLiner
static void Main()
string s = "TextHereTisImortant973End"; //Between "eT" and "97"
Console.WriteLine(s.Substring(s.IndexOf("eT") + "eT".Length)
.Split("97".ToCharArray()).First());
【讨论】:
【参考方案17】: private string gettxtbettwen(string txt, string first, string last)
StringBuilder sb = new StringBuilder(txt);
int pos1 = txt.IndexOf(first) + first.Length;
int len = (txt.Length ) - pos1;
string reminder = txt.Substring(pos1, len);
int pos2 = reminder.IndexOf(last) - last.Length +1;
return reminder.Substring(0, pos2);
【讨论】:
【参考方案18】:当问题以单个示例的形式陈述时,不可避免地会出现模棱两可的情况。这个问题也不例外。
对于问题中给出的示例,所需的字符串很明确:
super example of string key : text I want to keep - end of my string
^^^^^^^^^^^^^^^^^^^
然而,这个字符串只是字符串和边界字符串的一个例子,某些子字符串要被识别。我会考虑一个带有泛型边界字符串的泛型字符串,表示如下。
abc FF def PP ghi,PP jkl,FF mno PP pqr FF,stu FF vwx,PP yza
^^^^^^^^^^^^ ^^^^^
PP
是前面的字符串,FF
是后面的字符串,派对帽子指示要匹配哪些子字符串。 (在问题中给出的示例中,key :
是前面的字符串,-
是后面的字符串。)我假设 PP
和 FF
之前和之后是单词边界(所以 PPA
和FF8
不匹配)。
我的假设,正如派对帽子所反映的那样,如下所示:
第一个子字符串PP
前面可以有一个(或多个)FF
子字符串,如果存在,则忽略它们;
如果在遇到FF
之前PP
后跟一个或多个PP
s,则后面的PP
s 是前后字符串之间的子字符串的一部分;
如果在遇到PP
之前PP
后跟一个或多个FF
s,则将PP
之后的第一个FF
视为以下字符串。
请注意,这里的许多答案只处理表单的字符串
abc PP def FF ghi
^^^^^
或
abc PP def FF ghi PP jkl FF mno
^^^^^ ^^^^^
可以使用正则表达式、代码结构或两者的组合来识别感兴趣的子字符串。我不判断哪种方法最好。我将只提供以下将匹配感兴趣的子字符串的正则表达式。
(?<=\bPP\b)(?:(?!\bFF\b).)*(?=\bFF\b)
Start your engine!1
我使用 PCRE (php) 正则表达式引擎对此进行了测试,但由于正则表达式一点也不陌生,我确信它可以与 .NET 正则表达式引擎(非常强大)一起使用。
正则表达式引擎执行以下操作:
(?<= : begin a positive lookbehind
\bPP\b : match 'PP'
) : end positive lookbehind
(?: : begin a non-capture group
(?! : begin a negative lookahead
\bFF\b : match 'FF'
) : end negative lookahead
. : match any character
) : end non-capture group
* : execute non-capture group 0+ times
(?= : begin positive lookahead
\bFF\b : match 'FF'
) : end positive lookahead
这种技术,一次匹配一个字符,在前面的字符串之后,直到字符是F
,然后是F
(或更一般地说,字符是构成后面字符串的字符串),被称为Tempered Greedy Token Solution。
如果我上面提出的假设发生变化,自然就必须修改正则表达式(如果可能的话)。
1.移动光标查看详细说明。
【讨论】:
【参考方案19】:如果你想处理多次出现的子字符串对,没有 RegEx 就不容易了:
Regex.Matches(input ?? String.Empty, "(?=key : )(.*)(?<= - )", RegexOptions.Singleline);
input ?? String.Empty
避免参数空异常?=
保留第一个子字符串,?<=
保留第二个子字符串RegexOptions.Singleline
允许子字符串对之间换行
如果子字符串的顺序和出现次数无关紧要,那么这个快速而肮脏的选项可能是一种选择:
var parts = input?.Split(new string[] "key : ", " - " , StringSplitOptions.None);
string result = parts?.Length >= 3 ? result[1] : input;
至少它避免了大多数异常,如果没有/单个子字符串匹配,则返回原始字符串。
【讨论】:
【参考方案20】:您已经有了一些好的答案,但我意识到我提供的代码远不是最有效和最干净的。但是,我认为它可能对教育目的有用。我们可以整天使用预先构建的类和库。但是如果不了解内部运作,我们只是在模仿和重复,永远不会学到任何东西。此代码有效,并且比其他一些代码更基本或“处女”:
char startDelimiter = ':';
char endDelimiter = '-';
Boolean collect = false;
string parsedString = "";
foreach (char c in originalString)
if (c == startDelimiter)
collect = true;
if (c == endDelimiter)
collect = false;
if (collect == true && c != startDelimiter)
parsedString += c;
您最终将所需的字符串分配给 parsedString 变量。请记住,它还将捕获进行中和前面的空格。请记住,字符串只是一个字符数组,可以像其他具有索引等的数组一样进行操作。
保重。
【讨论】:
这是最好的算法,虽然在字符串创建方面最差。提供的所有不是仅正则表达式的答案在创建字符串时都很高兴,但从这个意义上说,这个答案是最糟糕的。如果您刚刚捕获要捕获的字符串的开头和结尾并使用 ''string.Substring'' 来提取它,那将是完美的。 我同意。正如我所提到的,它远非有效。我不推荐使用这个算法。这只是“简单化”,这样他就可以理解较低级别的字符串。如果他只是想完成工作,他已经有了可以实现这一目标的答案。 我明白这一点。我只是指出它的强项和周点。虽然,要回答原始问题,它需要更多,因为它需要匹配字符串边界而不仅仅是字符边界。但想法是一样的。【参考方案21】:正如我常说的,没有什么是不可能的:
string value = "super exemple of string key : text I want to keep - end of my string";
Regex regex = new Regex(@"(key \: (.*?) _ )");
Match match = regex.Match(value);
if (match.Success)
Messagebox.Show(match.Value);
请记住应该添加 System.Text.RegularExpressions 的引用
希望我有所帮助。
【讨论】:
【参考方案22】:可能是这样的
private static string Between(string text, string from, string to)
return text[(text.IndexOf(from)+from.Length)..text.IndexOf(to, text.IndexOf(from))];
【讨论】:
【参考方案23】:getStringBetween(startStr, endStr, fullStr)
string startIndex = fullStr.indexOf(startStr);
string endIndex= fullStr.indexOf(endStr);
return fullStr.substring(startIndex + startStr.length, endIndex);
【讨论】:
@KiranAmadipudi。欢迎来到 ***。请提供一些解释,为什么您认为您提出的解决方案可能对 OP 有所帮助。【参考方案24】:在这里;
/// <summary>
///
/// </summary>
/// <param name="line"></param>
/// <param name="begin_tag"></param>
/// <param name="end_tag"></param>
/// <param name="lastIndexOfEndTag"></param>
/// <returns></returns>
private string getBetween(string line, string begin_tag, string end_tag, bool lastIndexOfEndTag = false, bool returnNullIfTagsNotExists = false)
if (!string.IsNullOrEmpty(line) && !string.IsNullOrEmpty(begin_tag) && !string.IsNullOrEmpty(end_tag))
// 1 2 3 4 5 6 7
//0123456789012345678901234567890123456789012345678901234567890123456789012
//StdErrorData: Duration: 01:59:54.88, start: 0.000000, bitrate: 557 kb/s
int startIndex = line.IndexOf(begin_tag);
if (startIndex >= 0)
startIndex += begin_tag.Length;
else
if (returnNullIfTagsNotExists)
return null;
else
startIndex = 0;
int endIndex = lastIndexOfEndTag ?
line.LastIndexOf(end_tag, startIndex)
: line.IndexOf(end_tag, startIndex);
if (endIndex > startIndex)
return line.Substring(startIndex, endIndex - startIndex);
else
if (returnNullIfTagsNotExists)
return null;
else
return line.Substring(startIndex);
return null;
测试;
string r = getBetween("StdErrorData: Duration: 01:59:54.88, start: 0.000000, bitrate: 557 kb/s", "Duration:", ",");
Console.WriteLine($"<r>");
//< 01:59:54.88>
【讨论】:
【参考方案25】:这是扩展方法,以防任何人也有兴趣保留开始和结束文本。
public static string SubstringBetween(this string text, string start, string end, bool keepStartEndText = false)
var startIndex = text.IndexOf(start);
var endIndex = text.LastIndexOf(end);
if (keepStartEndText)
return text.Substring(startIndex, (endIndex + end.Length) - startIndex);
else
return text.Substring(startIndex + start.Length, endIndex - (startIndex + start.Length));
【讨论】:
【参考方案26】: public static string ExtractBetweenTwoStrings(string FullText, string StartString, string EndString, bool IncludeStartString, bool IncludeEndString)
try int Pos1 = FullText.IndexOf(StartString) + StartString.Length; int Pos2 = FullText.IndexOf(EndString, Pos1); return ((IncludeStartString) ? StartString : "")
+ FullText.Substring(Pos1, Pos2 - Pos1) + ((IncludeEndString) ? EndString : ""); catch (Exception ex) return ex.ToString(); //return "";
感谢:https://www.c-sharpcorner.com/blogs/how-to-extract-a-string-lies-between-two-strings-in-c-sharpnet1
【讨论】:
【参考方案27】:对于字符串之间的获取字符串,我使用这种方法:
public static class Extension
/// <summary>
/// Gets currently string between
/// </summary>
/// <param name="word">Currently string</param>
/// <param name="start">String left</param>
/// <param name="end">String right</param>
/// <returns>String between start and end</returns>
/// <example>The string "value (4815162342)" use Between("(",")") generates in method: "4815162342"</example>
public static string Between(this string word, string start, string end)
if (start.Equals(end))
throw new ArgumentException("Start string can't equals a end string.");
int startIndex = word.LastIndexOf(start) + 1;
int endIndex = word.LastIndexOf(end) - 1 - word.LastIndexOf(start);
return word.Substring(startIndex, endIndex);
【讨论】:
以上是关于获取字符串中两个字符串之间的字符串的主要内容,如果未能解决你的问题,请参考以下文章