内存Bug终结！为什么Rust正在Linux内核中取代C语言？

菜小编

2025-1-6

编程语言从入门到精通

Rust 正逐渐被视为维护和开发 Linux 内核的一个有前景的替代方案，这主要得益于其安全特性和现代化的工具支持。尽管 C 一直是内核开发的传统语言，但在某些内核模块中，Rust 可能是更优的选择，原因如下。

我对C语言的热爱与局限性

C 是所有编程语言的“父亲”，它性能强大且灵活，但有时过于灵活。在 C 中，要实现一个安全可靠的功能，需要开发者对潜在的漏洞保持高度警惕。

Rust 则在编译时就为你处理了这些潜在的漏洞，让你可以更多地专注于功能开发，而不是担心可能出现的错误。

本文将详细说明为什么在像 Linux 内核模块这样的重要应用中，Rust 比 C 更安全。

内存安全

Rust 相较于 C 的一个显著优势是其内存安全性。在 C 中，开发者需要自行管理内存的分配和释放，这可能导致以下问题：

缓冲区溢出（Buffer Overflow）
悬空指针（Dangling Pointer）
使用已释放内存（Use-After-Free）

这些问题是内核漏洞的常见来源。而 Rust 使用一种称为借用检查器（Borrow Checker）的机制，在无需垃圾回收器的情况下确保内存安全，从而在编译时就避免了这些错误。

在 C 中，一个简单的错误，例如访问已释放的指针，就可能导致未定义行为：

int *ptr = malloc(sizeof(int));  
free(ptr);  
*ptr = 5;  // 访问已释放的内存

而在 Rust 中，借用检查器会确保内存引用在需要时始终有效：

let mut ptr = Box::new(5);  
let r = &mut ptr; // 借用 ptr 的可变引用  
drop(ptr); // ptr 被释放  
// r 无法在 ptr 被释放后使用

如果尝试在 ptr 被释放后使用 r，Rust 会在编译时阻止这种行为，从而确保不会访问已释放的内存。

并发安全

并发编程是另一个挑战，而 Rust 在这方面表现出色。在 C 中，当多个线程访问共享数据时，容易出现竞争条件（Race Condition）和死锁（Deadlock）等问题。C 并不提供任何关于并发的保证，因此开发者必须小心设计线程安全的代码，这种过程容易出错且常常导致难以察觉的漏洞。

Rust 的所有权系统（Ownership System）确保数据要么是可变的且归一个线程所有，要么是不可变的且可以在多个线程间共享，从而在许多情况下无需锁机制就能提供并发安全性。这使得并发编程更加安全。

在 C 中，以下代码可能会因为两个线程同时修改同一个变量而导致竞争条件：

pthread_t thread1, thread2;  
int counter = 0;  
void *increment(void *arg) {  
    counter++;  
    return NULL;  
}

而在 Rust 中，编译器会确保可变数据不会在多个线程间共享，除非明确允许：

use std::sync::{Arc, Mutex};  
use std::thread;

let counter = Arc::new(Mutex::new(0));  
letmut handles = vec![];

for _ in0..10 {  
    let counter = Arc::clone(&counter);  
    let handle = thread::spawn(move || {  
        letmut num = counter.lock().unwrap();  
        *num += 1;  
    });  
    handles.push(handle);  
}

for handle in handles {  
    handle.join().unwrap();  
}

Rust 的 Arc 和 Mutex 类型强制执行线程间数据共享的安全性，并确保不会出现竞争条件或数据竞争。

消除空指针解引用

C 允许空指针（Null Pointer）的存在，这很容易导致段错误（Segmentation Fault）。Rust 通过使用 Option 类型代替原始指针，消除了这一风险，确保空引用能够被安全处理。

在 C 中，解引用空指针会导致程序崩溃：

int *ptr = NULL;  
*ptr = 5;  // 解引用空指针

而在 Rust 中，**Option 类型**强制开发者显式处理值缺失的情况：

let x: Option<i32> = None;  
if let Some(val) = x {  
    println!("{}", val);  // 安全地解包值  
} else {  
    println!("没有值！");  
}

Rust 的类型系统要求程序员显式处理 None 的情况，从而避免了空指针解引用的风险。

安全且高效的底层编程

虽然 C 允许直接操作硬件资源，但 Rust 在提供类似底层控制的同时，不会牺牲安全性。Rust 提供了 unsafe 块，允许开发者在必要时手动处理不安全的代码，但它确保只有明确标记为不安全的代码才会绕过安全检查。这种方式使得内核级编程既能进行安全检查，又能灵活操作。

在 C 中，开发者可以直接写入内存地址，这可能导致不安全的操作：

int *ptr = (int*) 0x1000;  // 直接访问内存地址  
*ptr = 42;

而在 Rust 中，可以使用 unsafe 关键字进行直接内存访问，但不安全的代码会被清晰地标记：

let ptr: *mut i32 = 0x1000 as *mut i32; // 不安全的指针  
unsafe {  
    *ptr = 42; // 不安全的操作  
}

Rust 的这种方式明确标记了绕过安全检查的代码区域，使得代码审查和潜在错误的定位更加容易。

改进的错误处理

C 依赖于错误码和手动检查，这可能导致不完整或有缺陷的错误处理。而 Rust 通过 Result 和 Option 类型 提供了更强大的错误处理模型，确保错误能够被显式处理。

在 C 中，错误处理通常通过返回码实现：

int foo() {  
    if (something_wrong) {  
        return -1;  // 错误码  
    }  
    return 0;  // 成功  
}

而在 Rust 中，错误处理通过 Result 类型完成，强制开发者处理所有可能的错误情况：

fn foo() -> Result<i32, String> {  
    if something_wrong {  
        Err("错误".to_string())  
    } else {  
        Ok(42)  
    }  
}

Rust 的模式匹配机制确保错误处理成为代码流程的一部分，从而减少了错误被忽略的可能性。

现代化工具与生态系统

Rust 提供了现代化的生态系统和优秀的工具支持，而这些是 C 在内核开发中所缺乏的：

Cargo：用于包管理和构建项目。
Clippy：用于代码静态分析和优化建议。
Rustfmt：用于自动格式化代码。

这些工具提高了开发效率、代码质量和可维护性，使 Rust 成为比 C 更适合长期项目（如内核维护）的开发语言。

示例：Linux 内核模块的实现对比

以下是一个用 C 实现的内核模块，它从用户输入中接收字符串并存储在固定大小的缓冲区中。如果边界检查不当，可能会导致缓冲区溢出：

#define BUF_SIZE 16 // 固定缓冲区大小

staticchar buffer[BUF_SIZE];

static ssize_t example_write(const char __user *user_buffer, size_t len) {  
    if (len > BUF_SIZE) {  
        pr_err("缓冲区溢出风险：输入过大！\n");  
        return -EINVAL;  
    }

    if (copy_from_user(buffer, user_buffer, len)) {  
        pr_err("从用户空间复制数据失败。\n");  
        return -EFAULT;  
    }

    pr_info("接收到：%s\n", buffer);  
    return len;  
}

问题：

开发者必须手动检查输入长度是否超出缓冲区大小，容易出错。
如果忘记检查边界，可能导致缓冲区溢出，进而引发未定义行为或安全漏洞。

以下是用 Rust 实现的相同模块，采用了更安全、现代的方法：

const BUF_SIZE: usize = 16; // 固定缓冲区大小

pub fn write_input(reader: &mut IoBufferReader<'_>) -> Result<()> {  
    let mut buffer = [0u8; BUF_SIZE];  
    let len = reader.read_slice(&mut buffer)?;  
    pr_info!("接收到：{:?}\n", &buffer[..len]);  
    Ok(())  
}

为什么 Rust 更安全？