如何在 Rust 中实现获取缓存或加载操作?
How can I implement a fetch-cached-or-load operation in Rust?
我正在尝试创建一个简单的缓存,它只有一个操作:“从
缓存,必要时加载”。这是一个 working example(只是
为简单起见使用文件加载):
use std::collections::HashMap;
use std::fs::File;
use std::io;
use std::path::{Path, PathBuf};
#[derive(Debug, Default)]
pub struct FileCache {
/// Map storing contents of loaded files.
files: HashMap<PathBuf, Vec<u8>>,
}
impl FileCache {
/// Get a file's contents, loading it if it hasn't yet been loaded.
pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
if let Some(_) = self.files.get(path) {
println!("Cached");
return Ok(self.files.get(path).expect("just checked"));
}
let buf = self.load(path)?;
Ok(self.files.entry(path.to_owned()).or_insert(buf))
}
/// Load a file, returning its contents.
fn load(&self, path: &Path) -> io::Result<Vec<u8>> {
println!("Loading");
let mut buf = Vec::new();
use std::io::Read;
File::open(path)?.read_to_end(&mut buf)?;
Ok(buf)
}
}
pub fn main() -> io::Result<()> {
let mut store = FileCache::default();
let path = Path::new("src/main.rs");
println!("Length: {}", store.get(path)?.len());
println!("Length: {}", store.get(path)?.len());
Ok(())
}
if let
的成功分支额外调用了 self.files.get
和一个额外的 expect
。我们只是调用它并对其进行模式匹配
结果,所以我们只想 return 匹配:
pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
if let Some(x) = self.files.get(path) {
println!("Cached");
return Ok(x);
}
let buf = self.load(path)?;
Ok(self.files.entry(path.to_owned()).or_insert(buf))
}
error[E0502]: cannot borrow `self.files` as mutable because it is also borrowed as immutable
--> src/main.rs:20:12
|
14 | pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
| - let's call the lifetime of this reference `'1`
15 | if let Some(x) = self.files.get(path) {
| ---------- immutable borrow occurs here
16 | println!("Cached");
17 | return Ok(x);
| ----- returning this value requires that `self.files` is borrowed for `'1`
...
20 | Ok(self.files.entry(path.to_owned()).or_insert(buf))
| ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ mutable borrow occurs here
我不明白为什么这两个版本的行为不同。不是
self.files
在这两种情况下都借了 &self
一生?在第一
形式,我们放弃借用并获得一个新的,但我不明白为什么
应该有所作为。第二种形式如何使我违反
内存安全,以及如何在不进行额外查找的情况下编写此代码
expect
检查?
我读过 ,这是相关的,但是
那里的答案要么重复查找(如在我的工作示例中)
或克隆值(非常昂贵),所以还不够。
两种实现都应该是合法的 Rust 代码。 rustc
拒绝第二个的事实实际上是 issue 58910.
跟踪的错误
让我们详细说明:
pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
if let Some(x) = self.files.get(path) { // ---+ x
println!("Cached"); // |
return Ok(x); // |
} // |
let buf = self.load(path)?; // |
Ok(self.files.entry(path.to_owned()) // |
.or_insert(buf)) // |
} // v
通过绑定到变量 x
in let some expression,self.files
被借用为不可变的。相同的 x
后来被 return 发送给调用者,这意味着 self.files
一直被借用,直到调用者的某个时刻。所以在当前的 Rust 借用检查器实现中,self.files
是 不必要地 一直被借用整个 get
函数。它不能在以后再次借用为可变的。 x
在早期 return 之后从未使用过的事实未被考虑。
您的第一个实现可以解决此问题。因为 let some(_) = ...
没有创建任何绑定,所以它没有同样的问题。尽管由于多次查找,它确实会产生额外的运行时成本。
这是 Niko 的 NLL RFC 中描述的 problem case #3。好消息是:
TL;DR: Polonius is supposed to fix this.
(Polonius 是更复杂的 Rust 借用检查器的第三个版本,仍在开发中)。
我正在尝试创建一个简单的缓存,它只有一个操作:“从 缓存,必要时加载”。这是一个 working example(只是 为简单起见使用文件加载):
use std::collections::HashMap;
use std::fs::File;
use std::io;
use std::path::{Path, PathBuf};
#[derive(Debug, Default)]
pub struct FileCache {
/// Map storing contents of loaded files.
files: HashMap<PathBuf, Vec<u8>>,
}
impl FileCache {
/// Get a file's contents, loading it if it hasn't yet been loaded.
pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
if let Some(_) = self.files.get(path) {
println!("Cached");
return Ok(self.files.get(path).expect("just checked"));
}
let buf = self.load(path)?;
Ok(self.files.entry(path.to_owned()).or_insert(buf))
}
/// Load a file, returning its contents.
fn load(&self, path: &Path) -> io::Result<Vec<u8>> {
println!("Loading");
let mut buf = Vec::new();
use std::io::Read;
File::open(path)?.read_to_end(&mut buf)?;
Ok(buf)
}
}
pub fn main() -> io::Result<()> {
let mut store = FileCache::default();
let path = Path::new("src/main.rs");
println!("Length: {}", store.get(path)?.len());
println!("Length: {}", store.get(path)?.len());
Ok(())
}
if let
的成功分支额外调用了 self.files.get
和一个额外的 expect
。我们只是调用它并对其进行模式匹配
结果,所以我们只想 return 匹配:
pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
if let Some(x) = self.files.get(path) {
println!("Cached");
return Ok(x);
}
let buf = self.load(path)?;
Ok(self.files.entry(path.to_owned()).or_insert(buf))
}
error[E0502]: cannot borrow `self.files` as mutable because it is also borrowed as immutable
--> src/main.rs:20:12
|
14 | pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
| - let's call the lifetime of this reference `'1`
15 | if let Some(x) = self.files.get(path) {
| ---------- immutable borrow occurs here
16 | println!("Cached");
17 | return Ok(x);
| ----- returning this value requires that `self.files` is borrowed for `'1`
...
20 | Ok(self.files.entry(path.to_owned()).or_insert(buf))
| ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ mutable borrow occurs here
我不明白为什么这两个版本的行为不同。不是
self.files
在这两种情况下都借了 &self
一生?在第一
形式,我们放弃借用并获得一个新的,但我不明白为什么
应该有所作为。第二种形式如何使我违反
内存安全,以及如何在不进行额外查找的情况下编写此代码
expect
检查?
我读过
两种实现都应该是合法的 Rust 代码。 rustc
拒绝第二个的事实实际上是 issue 58910.
让我们详细说明:
pub fn get(&mut self, path: &Path) -> io::Result<&[u8]> {
if let Some(x) = self.files.get(path) { // ---+ x
println!("Cached"); // |
return Ok(x); // |
} // |
let buf = self.load(path)?; // |
Ok(self.files.entry(path.to_owned()) // |
.or_insert(buf)) // |
} // v
通过绑定到变量 x
in let some expression,self.files
被借用为不可变的。相同的 x
后来被 return 发送给调用者,这意味着 self.files
一直被借用,直到调用者的某个时刻。所以在当前的 Rust 借用检查器实现中,self.files
是 不必要地 一直被借用整个 get
函数。它不能在以后再次借用为可变的。 x
在早期 return 之后从未使用过的事实未被考虑。
您的第一个实现可以解决此问题。因为 let some(_) = ...
没有创建任何绑定,所以它没有同样的问题。尽管由于多次查找,它确实会产生额外的运行时成本。
这是 Niko 的 NLL RFC 中描述的 problem case #3。好消息是:
TL;DR: Polonius is supposed to fix this.
(Polonius 是更复杂的 Rust 借用检查器的第三个版本,仍在开发中)。