Rust编程语言入门之高级特性

打印 上一主题 下一主题

主题 996|帖子 996|积分 2988

高级特性

主要内容


  • 不安全 Rust
  • 高级 Trait
  • 高级 类型
  • 高级函数和闭包

一、不安全 Rust

匹配命名变量


  • 隐藏着第二个语言,它没有强制内存安全保证:Unsafe Rust(不安全的 Rust)

    • 和普通的 Rust 一样,但提供了额外的“超能力”

  • Unsafe Rust 存在的原因:

    • 静态分析是保守的。

      • 使用 Unsafe Rust:我知道自己在做什么,并承担相应风险

    • 计算机硬件本身就是不安全的,Rust需要能够进行底层系统编程

Unsafe 超能力


  • 使用 unsafe 关键字来切换到 unsafe Rust,开启一个块,里面放着 Unsafe 代码
  • Unsafe Rust 里可执行的四个动作(unsafe 超能力):

    • 解引用原始指针
    • 调用 unsafe 函数或方法
    • 方法或修改可变的静态变量
    • 实现 unsafe trait

  • 注意:

    • Unsafe 并没有关闭借用检查或停用其它安全检查
    • 任何内存安全相关的错误必须留在 unsafe 块里
    • 尽可能隔离 Unsafe 代码,最好将其封装在安全的抽象里,提供安全的API

解引用原始指针


  • 原始指针

    • 可变的:*mut T
    • 不可变的:*const T。意味着指针在解引用后不能直接对其进行赋值
    • 注意:这里的 * 不是解引用符号,它是类型名的一部分。

  • 与引用不同,原始指针:

    • 允许通过同时具有不可变和可变指针或多个执行同一位置的可变指针来忽略借用规则
    • 无法保证能指向合理的内存
    • 允许为null
    • 不实现任何自动清理

  • 放弃保证的安全,换取更好的性能/与其它语言或硬件接口的能力
解引用原始指针
  1. fn main() {
  2.   let mut num = 5;
  3.   
  4.   let r1 = &num as *const i32;
  5.   let r2 = &mut num as *mut i32;
  6.   unsafe {
  7.     println!("r1: {}", *r1);
  8.     println!("r2: {}", *r2);
  9.   }
  10.   
  11.   let address = 0x012345usize;
  12.   let r = address as *const i32;
  13.   unsafe {
  14.     println!("r: {}", *r); // 报错 非法访问
  15.   }
  16. }
复制代码

  • 为什么要用原始指针?

    • 与 C 语言进行接口
    • 构建借用检查器无法理解的安全抽象

调用 unsafe 函数或方法


  • unsafe 函数或方法:在定义前加上了 unsafe 关键字

    • 调用前需手动满足一些条件(主要靠看文档),因为Rust无法对这些条件进行验证
    • 需要在 unsafe 块里进行调用

  1. unsafe fn dangerous() {}
  2. fn main() {
  3.   unsafe {
  4.     dangerous();
  5.   }
  6. }
复制代码
创建 Unsafe 代码的安全抽象


  • 函数包含 unsafe 代码并不意味着需要将整个函数标记为 unsafe
  • 将 unsafe 代码包裹在安全函数中是一个常见的抽象
  1. fn split_at_mut(slice: &mut [i32], mid: usize) -> (&mut [i32], &mut [i32]) {
  2.   let len = slice.len();
  3.   
  4.   assert!(mid <= len);
  5.   
  6.   (&mut slice[..mid], &mut slice[mid..]) // 报错 cannot borrow `*slice` as mutable more than once at a time
  7. }
  8. fn main() {
  9.   let mut v = vec![1, 2, 3, 4, 5, 6];
  10.   
  11.   let r = &mut v[..];
  12.   let (a, b) = r.split_at_mut(3);
  13.   assert_eq!(a, &mut [1, 2, 3]);
  14.   assert_eq!(b, &mut [4, 5, 6]);
  15. }
复制代码

  • 应用二进制接口(ABI,Application Binary Interface):定义函数在汇编层的调用方式
  • “C” ABI 是最常见的ABI,它遵循 C 语言的ABI
从其它语言调用 Rust 函数


  • 可以使用 extern 创建接口,其它语言通过它们可以调用 Rust 的函数
  • 在 fn 前添加 extern 关键字,并指定 ABI
  • 还需添加 #[no_mangle]注解:避免 Rust 在编译时改变它的名称
  1. use std::slice;
  2. fn split_at_mut(slice: &mut [i32], mid: usize) -> (&mut [i32], &mut [i32]) {
  3.   let len = slice.len();
  4.   let ptr = slice.as_mut_ptr()
  5.   
  6.   assert!(mid <= len);
  7.   
  8.   unsafe {
  9.     (
  10.       slice::from_raw_parts_mut(ptr, mid),
  11.       slice::from_raw_parts_mut(ptr.add(mid), len = mid),
  12.     )
  13.   }
  14. }
  15. fn main() {
  16.   let address = 0x012345usize;
  17.   let r = address as *mut i32;
  18.   
  19.   let slice: &[i32] = unsafe {
  20.     slice::from_raw_parts_mut(r, 10000)
  21.   };
  22. }
复制代码
访问或修改一个可变静态变量


  • Rust 支持全局变量,但因为所有权机制可能产生某些问题,例如数据竞争
  • 在 Rust 里,全局变量叫做静态(static)变量
  1. extern "C" {
  2.   fn abs(input: i32) -> i32;
  3. }
  4. fn main() {
  5.   unsafe {
  6.     println!("Absolute value of -3 according to C: {}", abs(-3));
  7.   }
  8. }
复制代码
静态变量


  • 静态变量与常量类似
  • 命名:SCREAMING_SNAKE_CASE
  • 必须标注类型
  • 静态变量只能存储 'static 生命周期的引用,无需显示标注
  • 访问不可变静态变量是安全的
常量和不可变静态变量的区别


  • 静态变量:有固定的内存地址,使用它的值总会访问同样的数据
  • 常量:允许使用它们的时候对数据进行复制
  • 静态变量:可以是可变的,访问和修改静态可变变量是不安全(unsafe)的
  1. #[no_mangle]
  2. pub extern "C" fn call_from_c() {
  3.   println!("Just called a Rust function from C!");
  4. }
  5. fn main() {}
复制代码
实现不安全(unsafe)trait


  • 当某个 trait 中存在至少一个方法拥有编译器无法校验的不安全因素时,就称这个 trait 是不安全的
  • 声明 unsafe trait:在定义前加 unsafe 关键字

    • 该 trait 只能在 unsafe 代码块中实现

  1. static HELLO_WORLD: &str = "Hello, world!";
  2. fn main() {
  3.   println!("name is: {}", HELLO_WORLD);
  4. }
复制代码
何时使用 unsafe 代码


  • 编译器无法保证内存安全,保证 unsafe 代码正确并不简单
  • 有充足理由使用 unsafe 代码时,就可以这样做
  • 通过显示标记 unsafe,可以在出现问题时轻松的定位
二、高级 Trait

在 Trait 定义中使用关联类型来指定占位类型


  • 关联类型(associated type)是 Trait中的类型占位符,它可以用于Trait的方法签名中:

    • 可以定义出包含某些类型的 Trait,而在实现前无需知道这些类型是什么

  1. static mut COUNTER: u32 = 0;
  2. fn add_to_count(inc: u32) {
  3.   unsafe {
  4.     COUNTER += inc;
  5.   }
  6. }
  7. fn main() {
  8.   add_to_count(3);
  9.   
  10.   unsafe {
  11.     println!("COUNTER: {}", COUNTER);
  12.   }
  13. }
复制代码
关联类型与泛型的区别

泛型关联类型每次实现 Trait 时标注类型无需标注类型可以为一个类型多次实现某个 Trait(不同的泛型参数)无法为单个类型多次实现某个 Trait例子:
  1. unsafe trait Foo {
  2.   // methods go here
  3. }
  4. unsafe impl Foo for i32 {
  5.   // method implementations go here
  6. }
  7. fn main() {}
复制代码
默认泛型参数和运算符重载


  • 可以在使用泛型参数时为泛型指定一个默认的具体类型。
  • 语法:
  • 这种技术常用于运算符重载(operator overloading)
  • Rust 不允许创建自己的运算符及重载任意的运算符
  • 但可以通过实现 std::ops 中列出的那些 trait 来重载一部分相应的运算符
例子一:
  1. pub trait Iterator {
  2.   type Item;
  3.   
  4.   fn next(&mut self) -> Option<Self::Item>;
  5. }
  6. fn main() {
  7.   println!("Hello, world!");
  8. }
复制代码
例子二:
  1. pub trait Iterator {
  2.   type Item;
  3.   
  4.   fn next(&mut self) -> Option<Self::Item>;
  5. }
  6. pub trait Iterator2<T> {
  7.   fn next(&mut self) -> Option<T>;
  8. }
  9. struct Counter {}
  10. impl Iterator for Counter {
  11.   type Item = u32;
  12.   
  13.   fn next(&mut self) -> Option<Self::Item> {
  14.     None
  15.   }
  16. }
  17. impl Iterator2<String> for Counter {
  18.   fn next(&mut self) -> Option<String> {
  19.     None
  20.   }
  21. }
  22. impl Iterator2<u32> for Counter {
  23.   fn next(&mut self) -> Option<u32> {
  24.     None
  25.   }
  26. }
  27. fn main() {
  28.   println!("Hello, world!");
  29. }
复制代码
默认泛型参数的主要应用场景


  • 扩展一个类型而不破坏现有代码
  • 允许在大部分用户都不需要的特定场景下进行自定义
完全限定语法(Fully Qualified Syntax)如何调用同名方法

例子一:
  1. use std::ops::Add;
  2. #[derive(Debug, PartialEq)]
  3. struct Point {
  4.   x: i32,
  5.   y: i32,
  6. }
  7. impl Add for Point {
  8.   type Output = Point;
  9.   
  10.   fn add(self, other: Point) -> Point {
  11.     Point {
  12.       x: self.x + other.x,
  13.       y: self.y + other.y,
  14.     }
  15.   }
  16. }
  17. fn main() {
  18.   assert_eq!(Point {x: 1, y: 0} + Point {x: 2, y: 3},
  19.     Point {x: 3, y: 3}
  20.   );
  21. }
复制代码
例子二:
  1. use std::ops::Add;
  2. struct Millimeters(u32);
  3. struct Meters(u32);
  4. impl Add<Meters> for Millimeters {
  5.   type Output = Millimeters;
  6.   
  7.   fn add(self, other: Meters) -> Millimeters {
  8.     Millimeters(self.0 + (other.0 * 1000))
  9.   }
  10. }
  11. fn main() {
  12.   
  13. }
复制代码
完全限定语法(Fully Qualified Syntax)如何调用同名方法


  • 完全限定语法:::function(receiver_if_method, netx_arg, ...);

    • 可以在任何调用函数或方法的地方使用
    • 允许忽略那些从其它上下文能推导出来的部分
    • 当 Rust 无法区分你期望调用哪个具体实现的时候,才需使用这种语法

  1. trait Pilot {
  2.   fn fly(&self);
  3. }
  4. trait Wizard {
  5.   fn fly(&self);
  6. }
  7. struct Human;
  8. impl Pilot for Human {
  9.   fn fly(&self) {
  10.     println!("This is your captain speaking.");
  11.   }
  12. }
  13. impl Wizard for Human {
  14.   fn fly(&self) {
  15.     println!("Up!");
  16.   }
  17. }
  18. impl Human {
  19.   fn fly(&self) {
  20.     println!("*waving arms furiously*");
  21.   }
  22. }
  23. fn main() {
  24.   let persion = Human;
  25.   person.fly(); // Human 本身的 fly 方法
  26.   Pilot::fly(&person);
  27.   Wizard::fly(&person);
  28. }
复制代码
使用 supertrait 来要求 trait 附带其它 trait 的功能


  • 需要在一个 trait 中使用其它 trait 的功能:

    • 需要被依赖的 trait 也被实现
    • 那个被间接依赖的 trait 就是当前 trait 的 supertrait

  1. trait Animal {
  2.   fn baby_name() -> String;
  3. }
  4. struct Dog;
  5. impl Dog {
  6.   fn baby_name() -> String {
  7.     String::from("Spot")
  8.   }
  9. }
  10. impl Animal for Dog {
  11.   fn baby_name() -> String {
  12.     String::from("puppy")
  13.   }
  14. }
  15. fn main() {
  16.   println!("A baby dog is called a {}", Dog::baby_name()); // Dog 本身的关联方法
  17. }
复制代码
使用 newtype 模式在外部类型上实现外部 trait


  • 孤儿规则:只有当 trait 或类型定义在本地包时,才能为该类型实现这个 trait
  • 可以通过 newtype 模式来绕过这一规则

    • 利用 tuple struct (元组结构体)创建一个新的类型

  1. trait Animal {
  2.   fn baby_name() -> String;
  3. }
  4. struct Dog;
  5. impl Dog {
  6.   fn baby_name() -> String {
  7.     String::from("Spot")
  8.   }
  9. }
  10. impl Animal for Dog {
  11.   fn baby_name() -> String {
  12.     String::from("puppy")
  13.   }
  14. }
  15. fn main() {
  16.   println!("A baby dog is called a {}", Dog::baby_name()); // Dog 本身的关联方法
  17.   println!("A baby dog is called a {}", <Dog as Animal>::baby_name());
  18. }
复制代码
三、高级类型

使用 newtype 模式实现类型安全和抽象


  • newtype 模式可以:

    • 用来静态的保证各种值之间不会混淆并表明值的单位
    • 为类型的某些细节提供抽象能力
    • 通过轻量级的封装来隐藏内部实现细节

使用类型别名创建类型同义词


  • Rust 提供了类型别名的功能:

    • 为现有类型生产另外的名称(同义词)
    • 并不是一个独立的类型
    • 使用 type 关键字

  • 主要用途:减少代码字符重复
例子一:
  1. use std::fmt;
  2. trait OutlinePrint: fmt::Display {
  3.   fn outline_print(&self) {
  4.     let output = self.to_string();
  5.     let len = output.len();
  6.     println!("{}", "*".repeat(len + 4));
  7.     println!("*{}*", " ".repeat(len + 2));
  8.     println!("* {} *", output);
  9.     println!("*{}*", " ".repeat(len + 2));
  10.     println!("{}", "*".repeat(len + 4));
  11.   }
  12. }
  13. struct Point {
  14.   x: i32,
  15.   y: i32,
  16. }
  17. impl OutlinePrint for Point {}
  18. impl fmt::Display for Point {
  19.   fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
  20.     write!(f, "({}, {})", self.x, self.y)
  21.   }
  22. }
  23. fn main() {}
复制代码
例子二:
  1. use std::fmt;
  2. struct Wrapper(Vec<String>);
  3. impl fmt::Display for Wrapper {
  4.   fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
  5.     write!(f, "[{}]", self.0.join(", "))
  6.   }
  7. }
  8. fn main() {
  9.   let w = Wrapper(vec![String::from("hello"), String::from("world")]);
  10.   println!("w = {}", w);
  11. }
复制代码
例子三:
  1. type Kilometers = i32;
  2. fn main() {
  3.   let x: i32 = 5;
  4.   let y: Killometers = 5;
  5.   println!("x + y = {}", x + y);
  6. }
复制代码
修改之后:
  1. fn takes_long_type(f: Box<dyn Fn() + Send + 'static>) {
  2.   // --snip--
  3. }
  4. fn returns_long_type() -> Box<dyn Fn() + Send + 'static> {
  5.   Box::new(|| println!("hi"))
  6. }
  7. fn main() {
  8.   let f: Box<dyn Fn() + Send + 'static> = Box::new(|| println!("hi"));
  9. }
复制代码
Never 类型


  • 有一个名为 ! 的特殊类型:

    • 它没有任何值,行话称为空类型(empty type)
    • 我们倾向于叫它 never 类型,因为它在不返回的函数中充当返回类型

  • 不返回值的函数也被称作发散函数(diverging function)
例子一:
  1. type Thunk = Box<dyn Fn() + Send + 'static>;
  2. fn takes_long_type(f: Thunk) {
  3.   // --snip--
  4. }
  5. fn returns_long_type() -> Thunk {
  6.   Box::new(|| println!("hi"))
  7. }
  8. fn main() {
  9.   let f: Thunk = Box::new(|| println!("hi"));
  10. }
复制代码
例子二:
  1. use std::io::Error;
  2. use std::fmt;
  3. pub trait Write {
  4.   fn write(&mut self, buf: &[u8]) -> Result<usize, Error>;
  5.   fn flush(&mut self) -> Result<(), Error>;
  6.   
  7.   fn write_all(&mut self, buf: &[u8]) -> Result<(), Error>;
  8.   fn write_fmt(&mut self, fmt: fmt::Arguments) -> Result<(), Error>;
  9. }
  10. fn main() {
  11.   
  12. }
复制代码
注意:never 类型的表达式可以被强制的转化为任意其它类型
例子三:
  1. use std::fmt;
  2. // type Result<T> = Result<T, std::io::Error>; // 声明在 std::io 中
  3. type Result<T> = std::io::Result<T>;
  4. pub trait Write {
  5.   fn write(&mut self, buf: &[u8]) -> Result<usize>;
  6.   fn flush(&mut self) -> Result<()>;
  7.   
  8.   fn write_all(&mut self, buf: &[u8]) -> Result<()>;
  9.   fn write_fmt(&mut self, fmt: fmt::Arguments) -> Result<()>;
  10. }
  11. fn main() {
  12.   
  13. }
复制代码
例子四:
  1. fn bar() -> ! { // 报错 返回单元类型 不匹配
  2.   
  3. }
  4. fn main() {}
复制代码
动态大小和 Sized Trait


  • Rust 需要在编译时确定为一个特定类型的值分配多少空间。
  • 动态大小的类型(Dynamically Sized Types,DST)的概念:

    • 编写代码时使用只有在运行时才能确定大小的值

  • str 是动态大小的类型(注意不是 &str):只有运行时才能确定字符串的长度

    • 下列代码无法正常工作:

      • let s1: str = "Hello there!";
      • let s2: str = "How's it going?";

    • 使用 &str 来解决:

      • str 的地址
      • str 的长度


Rust使用动态大小类型的通用方式


  • 附带一些额外的元数据来存储动态信息的大小

    • 使用动态大小类型时总会把它的值放在某种指针后边

另外一种动态大小的类型:trait


  • 每个 trait 都是一个动态大小的类型,可以通过名称对其进行引用
  • 为了将 trait 用作 trait 对象,必须将它放置在某种指针之后

    • 例如 &dyn Trait 或 Box (Rc) 之后

Sized trait


  • 为了处理动态大小的类型,Rust 提供了一个 Sized trait 来确定一个类型的大小在编译时是否已知

    • 编译时可计算出大小的类型会自动实现这一 trait
    • Rust 还会为每一个泛型函数隐式的添加 Sized 约束

  1. fn main() {
  2.   let guess = "";
  3.   
  4.   loop {
  5.     let guess: u32 = match guess.trim().parse() {
  6.       Ok(num) => num,
  7.       Err(_) => continue, // ! never 类型
  8.     };
  9.   }
  10. }
复制代码

  • 默认情况下,泛型函数只能被用于编译时已经知道大小的类型,可以通过特殊语法解除这一限制
?Sized trait 约束
  1. impl<T> Option<T> {
  2.   pub fn unwrap(self) -> T {
  3.     match self {
  4.       Some(val) => val,
  5.       None => panic!("called `Option::unwrap()` on a `None` value"), // !
  6.     }
  7.   }
  8. }
复制代码

  • T 可能是也可能不是 Sized
  • 这个语法只能用在 Sized 上面,不能被用于其它 trait
四、高级函数和闭包

函数指针


  • 可以将函数传递给其它函数
  • 函数在传递过程中会被强制转换成 fn 类型
  • fn 类型就是 “函数指针(function pointer)”
  1. fn main() {
  2.   println!("forever");
  3.   
  4.   loop {
  5.     println!("and ever");
  6.   }
  7. }
复制代码
函数指针与闭包的不同


  • fn 是一个类型,不是一个 trait

    • 可以直接指定 fn 为参数类型,不用声明一个以 Fn trait 为约束的泛型参数

  • 函数指针实现了全部3种闭包 trait(Fn、FnMut、FnOnce):

    • 总是可以把函数指针用作参数传递给一个接收闭包的函数
    • 所以,倾向于搭配闭包 trait 的泛型来编写函数:可以同时接收闭包和普通函数

  • 某些情景,只想接收 fn 而不接收闭包:

    • 与外部不支持闭包的代码交互:C 函数

例子一
  1. fn generic<T>(t: T) {}
  2. fn generic<T: Sized>(t: T) {} // 上面的generic 会隐式的转化为这种
  3. fn main() {}
复制代码
例子二
  1. fn generic<T>(t: T) {}
  2. fn generic<T: Sized>(t: T) {}
  3. fn generic<T: ?Sized>(t: &T) {} // ? 只能用在 sized上
  4. fn main() {}
复制代码
返回闭包


  • 闭包使用 trait 进行表达,无法在函数中直接返回一个闭包,可以将一个实现了该 trait 的具体类型作为返回值。
  1. fn add_one(x: i32) -> i32 {
  2.   x + 1
  3. }
  4. fn do_twice(f: fn(i32) -> i32, arg: i32) -> i32 {
  5.   f(arg) + f(arg)
  6. }
  7. fn main() {
  8.   let answer = do_twice(add_one, 5);
  9.   
  10.   println!("The answer is: {}", answer);
  11. }
复制代码
五、宏

宏 macro


  • 宏在Rust里指的是一组相关特性的集合称谓:

    • 使用 macro_rules! 构建的声明宏(declarative macro)
    • 3 种过程宏

      • 自定义 #[derive] 宏,用于 struct 或 enum,可以为其指定随 derive 属性添加的代码
      • 类似属性的宏,在任何条目上添加自定义属性
      • 类似函数的宏,看起来像函数调用,对其指定为参数的 token 进行操作


函数与宏的差别


  • 本质上,宏是用来编写可以生成其它代码的代码(元编程,metaprogramming)
  • 函数在定义签名时,必须声明参数的个数和类型,宏可处理可变的参数
  • 编译器会在解释代码前展开宏
  • 宏的定义比函数复杂得多,难以阅读、理解、维护
  • 在某个文件调用宏时,必须提前定义宏或将宏引入当前作用域:
  • 函数可以在任何位置定义并在任何位置使用
macro_rules! 声明宏(弃用)


  • Rust 中最常见的宏形式:声明宏

    • 类似 match 的模式匹配
    • 需要使用 marco_rules!

  1. fn main() {
  2.   let list_of_numbers = vec![1, 2, 3];
  3.   let list_of_strings: Vec<String> = list_of_numbers
  4.   .iter().map(|i| i.to_string()).collect();
  5.   
  6.   let list_of_numbers = vec![1, 2, 3];
  7.   let list_of_strings: Vec<String> = list_of_numbers
  8.   .iter().map(ToString::to_string).collect();
  9. }
复制代码
基于属性来生成代码的过程宏


  • 这种形式更像函数(某种形式的过程)一些

    • 接收并操作输入的 Rust 代码
    • 生成另外一些 Rust 代码作为结果

  • 三种过程宏:

    • 自定义派生
    • 属性宏
    • 函数宏

  • 创建过程宏时:

    • 宏定义必须单独放在它们自己的包中,并使用特殊的包类型

  1. fn main() {
  2.   enum Status {
  3.     Value(u32),
  4.     Stop,
  5.   }
  6.   
  7.   let v = Status::Value(3);
  8.   
  9.   let list_of_statuses: Vec<Status> = (0u32..20).map(Status::Value).collect();
  10. }
复制代码
自定义 derive 宏


  • 需求:

    • 创建一个 hello_macro 包,定义一个拥有关联函数 hello_macro 的 HelloMacro trait
    • 我们提供一个能自动实现 trait 的过程宏
    • 在它们的类型上标注 #[derive(HelloMacro)],进而得到 hello_macro 的默认实现

[code]➜ cd rust~/rust➜ cargo new hello_macro --lib     Created library `hello_macro` package~/rust➜ cd hello_macrohello_macro on  master [?] via
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

勿忘初心做自己

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表