Rust学习教程27 - 深入了解特征

Posted 孙飞 Sunface

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Rust学习教程27 - 深入了解特征相关的知识,希望对你有一定的参考价值。

本文节选自<<Rust语言圣经>>一书
欢迎大家加入Rust编程学院,一起学习交流:
QQ群:1009730433

深入了解特征

特征之于Rust更甚于接口之于其他语言,因此特征在Rust中很重要也相对较为复杂,我们决定把特征分为两篇进行介绍,第一篇在之前已经讲过,现在就是第二篇:关于特征的进阶篇,会讲述一些你不常用到但是该了解的特性。

关联类型

在方法一章中,我们将到了关联函数,但是实际上关联类型和关联函数并没有任何交集,虽然它们的名字有一半的交集。

关联类型是在特征定义的语句块中,申明一个自定义类型,这样就可以在特征的方法签名中使用该类型:

pub trait Iterator 
    type Item;

    fn next(&mut self) -> Option<Self::Item>;

以上是标准库中的迭代器特征Iterator,它有一个Item关联类型,用于替代遍历的值的类型。

同时,next方法也返回了一个Item类型,不过使用Option枚举进行了包裹,假如迭代器中的值是i32类型,那么调用next方法就将获取一个Option<i32>的值。

还记得Self吧?在之前的章节提到过, Self用来指代当前的特征实例 ,那么Self::Item就用来指代特征实例中具体的Item类型:

impl Iterator for Counter 
    type Item = u32;

    fn next(&mut self) -> Option<Self::Item> 
        // --snip--

在上述代码中,我们为Counter类型实现了Iterator特征,那么Self就是当前的Iterator特征对象,Item就是u32类型。

聪明的读者之所以聪明,因为你们喜欢联想和举一反三,同时你们也喜欢提问:为何不用泛型,例如如下代码

pub trait Iterator<Item> 
    fn next(&mut self) -> Option<Item>;

答案其实很简单,为了代码的可读性. 当你使用了泛型后,你需要在所有地方都这样写Iterator<Item>,而使用了关联类型,你只需要这样写Iterator,当类型定义复杂时,这种写法可以极大的增加可读性:

pub trait CacheableItem: Clone + Default + fmt::Debug + Decodable + Encodable 
  type Address: AsRef<[u8]> + Clone + fmt::Debug + Eq + Hash;
  fn is_null(&self) -> bool;

例如上面的代码,Address自然远比AsRef<[u8]> + Clone + fmt::Debug + Eq + Hash的要简单的多,而且含义清晰。

再例如,如果使用泛型,你将得到以下的代码:

trait Container<A,B> 
    fn contains(&self,a: A,b: B) -> bool;


fn difference<A,B,C>(container: &C) -> i32 where 
    C : Container<A,B> ...

而使用关联类型,将得到可读性好的多的代码:

trait Container
    type A;
    type B;
    fn contains(&self, a: &Self::A, b: &Self::B) -> bool;


fn difference<C: Container>(container: &C) 

默认泛型类型参数

当使用泛型类型参数时,可以为其指定一个默认的具体类型,例如标准库中的std::ops::Add特征:

trait Add<RHS=Self> 
    type Output;

    fn add(self, rhs: RHS) -> Self::Output;

它有一个泛型参数RHS,但是与我们以往的用法不同,这里它给RHS一个默认值,也就是当用户不指定RHS时,默认使用两个同样类型的值进行相加,然后返回一个关联类型Outpu

可能上面那段不太好理解,下面我们用代码来举例:

use std::ops::Add;

#[derive(Debug, PartialEq)]
struct Point 
    x: i32,
    y: i32,


impl Add for Point 
    type Output = Point;

    fn add(self, other: Point) -> Point 
        Point 
            x: self.x + other.x,
            y: self.y + other.y,
        
    


fn main() 
    assert_eq!(Point  x: 1, y: 0  + Point  x: 2, y: 3 ,
               Point  x: 3, y: 3 );

上面的代码主要干了一件事,就是为Point结构体提供+的能力,这就是运算符重载,不过Rust并不支持创建自定义运算符,你也无法为所有运算符进行重载,目前来说,只有定义在std::ops中的运算符才能进行重载。

+对应的特征是std::ops::Add,我们在之前也看过它的定义trait Add<RHS=Self>,但是上面的例子中并没有为Point实现Add<RHS>特征,而是实现了Add特征,这意味着我们使用了RHS的默认类型,也就是Self。换句话说,我们这里定义的是两个相同的Point类型相加,因此无需指定RHS

与上面的例子相反,下面的例子,我们来创建两个不同类型的相加:

use std::ops::Add;

struct Millimeters(u32);
struct Meters(u32);

impl Add<Meters> for Millimeters 
    type Output = Millimeters;

    fn add(self, other: Meters) -> Millimeters 
        Millimeters(self.0 + (other.0 * 1000))
    

这里,是进行Millimeters + Meters的操作,因此此时不能再使用默认的RHS,否则就会变成Millimeters + Millimeters的形式。使用Add<Meters>可以将RHS指定为Meters,那么fn add(self, rhs: RHS)自然而言的变成了MillimetersMeters的相加.

默认类型参数主要用于两个方面:

  1. 减少实现的样板代码
  2. 扩展类型但是无需大幅修改现有的代码

之前的例子就是第一点,虽然效果也就那样。在+左右两边都是同样类型时,只需要impl Add即可,否则你需要impl Add<SOME_TYPE>,嗯,会多写几个字:)

对于第二点,也很好理解,如果你在一个复杂类型的基础上,新引入一个泛型参数,可能需要修改很多地方,但是如果新引入的泛型参数有了默认类型,情况就会好很多。

归根到底,默认泛型参数,是有用的,但是大多数情况下,咱们确实用不到,当需要用到时,大家再回头来查阅本章即可, 手上有剑,心中不慌.

调用同名的方法

不同特征拥有同名的方法是很正常的事情,你没有任何办法阻止这一点,甚至除了特征上的同名方法外,在你的类型上,也有同名方法:

trait Pilot 
    fn fly(&self);


trait Wizard 
    fn fly(&self);


struct Human;

impl Pilot for Human 
    fn fly(&self) 
        println!("This is your captain speaking.");
    


impl Wizard for Human 
    fn fly(&self) 
        println!("Up!");
    


impl Human 
    fn fly(&self) 
        println!("*waving arms furiously*");
    

这里,不仅仅两个特征PilotWizardfly方法,就连实现那两个特征的Human元结构体,也拥有一个同名方法fly(这世界怎么了,非常这么卷吗?程序员何苦难为程序员,哎).

既然代码已经不可更改,那下面我们来讲讲该如何调用这些fly方法。

优先调用类型上的方法

当调用Human实例的fly时,编译器默认调用该类型中定义的方法:

fn main() 
    let person = Human;
    person.fly();

这段代码会打印*waving arms furiously*,说明直接调用了类型上定义的方法。

调用特征上的方法

为了能够调用两个特征的方法,需要使用显式调用的语法:

fn main() 
    let person = Human;
    Pilot::fly(&person); // 调用Pilot特征上的方法
    Wizard::fly(&person); // 调用Wizard特征上的方法
    person.fly(); // 调用Human类型自身的方法

运行后依次输出:

fn main() 
    let person = Human;
    Pilot::fly(&person);
    Wizard::fly(&person);
    person.fly();

因为fly方法的参数是self,当显示的调用时,编译器就可以根据调用的类型(self的类型)决定具体调用哪个方法。

这个时候问题又来了,如果方法没有self参数呢?稍等,估计有读者会问:还有方法没有self参数?看到这个疑问,作者的眼泪不禁流了下来, 大明湖畔的关联函数,你还记得嘛?

但是成年人的世界,就算再伤心,事还得做,咱们继续:

trait Animal 
    fn baby_name() -> String;


struct Dog;

impl Dog 
    fn baby_name() -> String 
        String::from("Spot")
    


impl Animal for Dog 
    fn baby_name() -> String 
        String::from("puppy")
    


fn main() 
    println!("A baby dog is called a ", Dog::baby_name());

就像人类妈妈会给自己的宝宝起爱称一样,狗狗妈妈也会。狗狗妈称呼自己的宝宝为Spot,其它动物称呼狗宝宝为puppy, 这个时候假如有其它动物,不知道该称如何呼狗宝宝,它需要查询一下。

但是Dog::baby_name()的调用方式显然不行,这是狗妈妈对宝宝的爱称,但是如果你试图这样查询:

fn main() 
    println!("A baby dog is called a ", Animal::baby_name());

铛铛,无情报错了:

error[E0283]: type annotations needed // 需要类型注释
  --> src/main.rs:20:43
   |
20 |     println!("A baby dog is called a ", Animal::baby_name());
   |                                           ^^^^^^^^^^^^^^^^^ cannot infer type // 无法推断类型
   |
   = note: cannot satisfy `_: Animal`

因为单纯从Animal::baby_name()上,编译器无法得到任何有效的信息:你想获取哪个动物宝宝的名称?狗宝宝?猪宝宝?还是熊宝宝?

此时,就需要使用完全限定语法.

完全限定语法

完全限定语法是调用函数最为明确的方式:

fn main() 
    println!("A baby dog is called a ", <Dog as Animal>::baby_name());

在尖括号中,通过as关键字,我们向Rust编译器提供了类型注解,也就是Animal就是Dog,而不是其他动物,因此最终会调用impl Animal for Dog中的方法,获取到其它动物对狗宝宝的称呼:puppy.

言归正题,完全限定语法定义为:

<Type as Trait>::function(receiver_if_method, next_arg, ...);

对于关联函数,其没有一个方法接收器(receiver),故只会有其他参数的列表。可以选择在任何函数或方法调用处使用完全限定语法, 同时,你还能省略任何Rust能够从程序中的其他信息中推导出的的部分。只有当存在多个同名实现而 Rust 需要帮助以便知道我们希望调用哪个实现时,才需要使用这个较为冗长的语法。

特征定义中的特征约束

有时,我们会需要让某个特征A能使用另一个特征B的功能(另一种形式的特征约束),这种情况下,不仅仅要为类型实现特征A,还要为类型实现特征B才行,这就是supertrait(实在不知道该如何翻译,有大佬指导下嘛?)

例如有一个特征OutlinePrint,它有一个方法,能够对当前的实现类型进行格式化输出:

use std::fmt::Display;

trait OutlinePrint: Display 
    fn outline_print(&self) 
        let output = self.to_string();
        let len = output.len();
        println!("", "*".repeat(len + 4));
        println!("**", " ".repeat(len + 2));
        println!("*  *", output);
        println!("**", " ".repeat(len + 2));
        println!("", "*".repeat(len + 4));
    

等等,这里有一个眼熟的语法:OutlinePrint: Display,感觉很像之前讲过的特征约束,只不过用在了特征定义中而不是函数的参数中, 是的,在某种意义上来说,这和特征约束非常类似,都用来说明一个特征需要实现另一个特征,这里就是:如果你想要实现OutlinePrint特征,首先你需要实现Display特征。

想象一下,假如没有这个特征约束,那么self.to_string还能够调用吗(to_string方法会为实现Display特征的类型自动实现)?编译器肯定是不愿意的, 会报错说当前作用域中找不到用于&Self类型的方法to_string:

struct Point 
    x: i32,
    y: i32,


impl OutlinePrint for Point 

因为Point没有实现Display特征,会得到下面的报错:

error[E0277]: the trait bound `Point: std::fmt::Display` is not satisfied
  --> src/main.rs:20:6
   |
20 | impl OutlinePrint for Point 
   |      ^^^^^^^^^^^^ `Point` cannot be formatted with the default formatter;
try using `:?` instead if you are using a format string
   |
   = help: the trait `std::fmt::Display` is not implemented for `Point`

既然我们有求于编译器,那只能选择满足它咯:

use std::fmt;

impl fmt::Display for Point 
    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result 
        write!(f, "(, )", self.x, self.y)
    

上面代码为Point实现了Display特征,那么to_string方法也将自动实现:最终获得字符串是通过这里的fmt方法获得的。

在外部类型上实现外部特征(newtype)

特征章节中, 有提到孤儿规则,简单来说,就是特征或者类型必需至少有一个是本地的,才能在此类型上定义特征。

这里提供一个办法来绕过孤儿规则, 那就是使用newtype模式,简而言之: 就是为一个元组结构体创建新类型。该元组结构体封装有一个字段,该字段就是希望实现特征的具体类型。

该封装类型是本地的,因此我们可以为此类型实现外部的特征。

newtype不仅仅能实现以上的功能,而且它在运行时没有任何性能损耗,因为在编译期,该类型会被自动忽略。

下面来看一个例子,我们有一个动态数组类型:Vec<T>,它定义在标准库中,还有一个特征Display,它也定义在标准库中,如果没有newtype,我们是无法为Vec<T>实现Display的:

error[E0117]: only traits defined in the current crate can be implemented for arbitrary types  
--> src/main.rs:5:1
|
5 | impl<T> std::fmt::Display for Vec<T> 
| ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^------
| |                             |
| |                             Vec is not defined in the current crate
| impl doesn't use only types from inside the current crate
|
= note: define and implement a trait or new type instead

编译器给了我们提示:define and implement a trait or new type instead,重新定义一个特征,或者使用new type,前者当然不可行,那么来试试后者:

use std::fmt;

struct Wrapper(Vec<String>);

impl fmt::Display for Wrapper 
    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result 
        write!(f, "[]", self.0.join(", "))
    


fn main() 
    let w = Wrapper(vec![String::from("hello"), String::from("world")]);
    println!("w = ", w);

其中,struct Wrapper(Vec<String>)就是一个元组结构体,它定义了一个新类型Wrapper,代码很简单,相信大家也很容易看懂。

既然new type有这么多好处,它有没有不好的地方呢?答案是肯定的。注意到我们怎么访问里面的数组吗?self.0.join(", "), 是的,很啰嗦,因为需要先从Wrapper中取出数组: self.0,然后才能执行join方法.

类似的,任何数组上的方法,你都无法直接调用,需要先用self.0取出数组,然后再进行调用。

当然,解决办法还是有的,要不怎么说Rust是极其强大灵活的编程语言!Rust提供了一个特征叫Deref,实现该特征后,可以自动做一层类似类型转换的操作,可以将Wrapper变成Vec<String>来使用。这样就会像直接使用数组那样去使用Wrapper,而无需为每一个操作都添加上self.0

同时,如果不想Wrapper暴漏底层数组的所有方法,我们还可以为Wrapper去重载这些方法,实现隐藏的目的。

以上是关于Rust学习教程27 - 深入了解特征的主要内容,如果未能解决你的问题,请参考以下文章

Rust学习教程27 - 深入了解特征

Rust语言圣经27 - 深入了解特征

Rust学习教程26 - 特征对象

Rust学习教程26 - 特征对象

Rust学习教程26 - 特征对象

Rust学习教程25 - 特征Trait