Rust标准库之——&str类型

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Rust标准库之——&str类型相关的知识,希望对你有一定的参考价值。

参考技术A

&str类型是rust中最基本的字符串类型,声明一个&str类型的变量很简单:

我们可以打印出上述定义中变量 s 的类型:

在 rust-playground 中使用nightly版本编译:

关于 str和&str标准库文档是如此说明的:

通俗理解, str 类型是字符串切片类型,是rust中最基本的字符串类型,但是我们见的更多的是它的借用类型(引用值),也就是 &str ,最直观的例子就是拥有静态生命周期 \'static 的字符串字面量。

另有 《Why Rust?》中给出的示例:

即:

因此在rust中 &str 类型为: 静态内存分配字符串的引用

Rust中切片类型表示为 &[T] ,它表示无法在编译期确定大小的同一种类型数据的连续内存序列 [T] 的 视图 ,它在内存中的管理是基于 Repr union 来实现的, &[T] 即指向 [T] 类型的指针,这个指针在最底层是通过称为胖指针( FatPtr )的结构体来模拟的:

在内存布局(memory layout)上, 切片变量和 FatPtr 类型的变量共享同一片内存空间,而FatPtr中则保存了"切片"的必要特征:

而借助于Rust类型系统的优势,标准库在 [T] 类型上定义的方法和trait则完全封装了底层负责解释指针含义的工作(这部分解释工作需要依赖unsafe rust来实现)。
如标准库实现的len方法:

查看标准库对于 str 类型的实现:

我们知道, &str 类型变量可以通过调用 len 方法获取字符串中的字节个数,查看 len 函数的定义可以发现,其内部是调用了 as_bytes 方法实现的; as_bytes 方法中定义了一个union类型 Slices ,并且声明为和C语言的内存布局一致( #[repr(C)] ):

熟悉union的同学不难发现, &str 和 &[u8] 的内存布局是一样的,从而 &str 是 &[T] 当 T=u8 时的特例!而 len 方法不过是调用了 &[u8] 的 len 方法而已。

字符串切片类型总是合法的 utf-8 字节序列。

其中 run_utf8_validation(v) 做了必要的utf-8字节序列的合法性检测,若不符合utf-8规范,则抛出Error。

思考下面的例子:

其中 s的类型是 &str ,那么s是怎么调用定义在 str 类型上的方法 len 的呢?
是因为标准库已经为我们对任意类型 &T 实现了 Deref trait:

而实现了Deref trait的类型,编译器会在适当的地方对变量进行足够多的解引用以使变量的类型转变为 T 。

由于 deref 函数获取的变量 &self 是不可变引用:

因此保证了由编译器来进行解引用总是安全的。

Go语言标准库之strconv

Go语言中strconv包实现了基本数据类型和其字符串表示的相互转换。

strconv包

strconv包实现了基本数据类型与其字符串表示的转换,主要有以下常用函数: Atoi()Itia()、parse系列、format系列、append系列。

更多函数请查看官方文档

string与int类型转换

这一组函数是我们平时编程中用的最多的。

Atoi()

Atoi()函数用于将字符串类型的整数转换为int类型,函数签名如下。

func Atoi(s string) (i int, err error)

如果传入的字符串参数无法转换为int类型,就会返回错误。

s1 := "100"
i1, err := strconv.Atoi(s1)
if err != nil {
	fmt.Println("can‘t convert to int")
} else {
	fmt.Printf("type:%T value:%#v
", i1, i1) //type:int value:100
}

Itoa()

Itoa()函数用于将int类型数据转换为对应的字符串表示,具体的函数签名如下。

func Itoa(i int) string

示例代码如下:

i2 := 200
s2 := strconv.Itoa(i2)
fmt.Printf("type:%T value:%#v
", s2, s2) //type:string value:"200"

a的典故

【扩展阅读】这是C语言遗留下的典故。C语言中没有string类型而是用字符数组(array)表示字符串,所以Itoa对很多C系的程序员很好理解。

Parse系列函数

Parse类函数用于转换字符串为给定类型的值:ParseBool()、ParseFloat()、ParseInt()、ParseUint()。

ParseBool()

func ParseBool(str string) (value bool, err error)

返回字符串表示的bool值。它接受1、0、t、f、T、F、true、false、True、False、TRUE、FALSE;否则返回错误。

ParseInt()

func ParseInt(s string, base int, bitSize int) (i int64, err error)

返回字符串表示的整数值,接受正负号。

base指定进制(2到36),如果base为0,则会从字符串前置判断,”0x”是16进制,”0”是8进制,否则是10进制;

bitSize指定结果必须能无溢出赋值的整数类型,0、8、16、32、64 分别代表 int、int8、int16、int32、int64;

返回的err是*NumErr类型的,如果语法有误,err.Error = ErrSyntax;如果结果超出类型范围err.Error = ErrRange。

ParseUnit()

func ParseUint(s string, base int, bitSize int) (n uint64, err error)

ParseUint类似ParseInt但不接受正负号,用于无符号整型。

ParseFloat()

func ParseFloat(s string, bitSize int) (f float64, err error)

解析一个表示浮点数的字符串并返回其值。

如果s合乎语法规则,函数会返回最为接近s表示值的一个浮点数(使用IEEE754规范舍入)。

bitSize指定了期望的接收类型,32是float32(返回值可以不改变精确值的赋值给float32),64是float64;

返回值err是*NumErr类型的,语法有误的,err.Error=ErrSyntax;结果超出表示范围的,返回值f为±Inf,err.Error= ErrRange。

代码示例

b, err := strconv.ParseBool("true")
f, err := strconv.ParseFloat("3.1415", 64)
i, err := strconv.ParseInt("-2", 10, 64)
u, err := strconv.ParseUint("2", 10, 64)

这些函数都有两个返回值,第一个返回值是转换后的值,第二个返回值为转化失败的错误信息。

Format系列函数

Format系列函数实现了将给定类型数据格式化为string类型数据的功能。

FormatBool()

func FormatBool(b bool) string

根据b的值返回”true”或”false”。

FormatInt()

func FormatInt(i int64, base int) string

返回i的base进制的字符串表示。base 必须在2到36之间,结果中会使用小写字母’a’到’z’表示大于10的数字。

FormatUint()

func FormatUint(i uint64, base int) string

是FormatInt的无符号整数版本。

FormatFloat()

func FormatFloat(f float64, fmt byte, prec, bitSize int) string

函数将浮点数表示为字符串并返回。

bitSize表示f的来源类型(32:float32、64:float64),会据此进行舍入。

fmt表示格式:’f’(-ddd.dddd)、’b’(-ddddp±ddd,指数为二进制)、’e’(-d.dddde±dd,十进制指数)、’E’(-d.ddddE±dd,十进制指数)、’g’(指数很大时用’e’格式,否则’f’格式)、’G’(指数很大时用’E’格式,否则’f’格式)。

prec控制精度(排除指数部分):对’f’、’e’、’E’,它表示小数点后的数字个数;对’g’、’G’,它控制总的数字个数。如果prec 为-1,则代表使用最少数量的、但又必需的数字来表示f。

代码示例

s1 := strconv.FormatBool(true)
s2 := strconv.FormatFloat(3.1415, ‘E‘, -1, 64)
s3 := strconv.FormatInt(-2, 16)
s4 := strconv.FormatUint(2, 16)

其他

isPrint()

func IsPrint(r rune) bool

返回一个字符是否是可打印的,和unicode.IsPrint一样,r必须是:字母(广义)、数字、标点、符号、ASCII空格。

CanBackquote()

func CanBackquote(s string) bool

返回字符串s是否可以不被修改的表示为一个单行的、没有空格和tab之外控制字符的反引号字符串。

其他

除上文列出的函数外,strconv包中还有Append系列、Quote系列等函数。具体用法可查看官方文档

转载自李文周博客

以上是关于Rust标准库之——&str类型的主要内容,如果未能解决你的问题,请参考以下文章

go语言标准库之strconv

python标准库之collections

C++标准库之vector(各函数及其使用全)

Go语言标准库之strconv

Go语言标准库之log

go语言标准库之log