rust - 如何在编译时不知道结构的情况下读取 CSV 数据?
问题描述
我对 Rust 很陌生,并试图实现某种数据库。用户应该通过给出表名、列名向量和列类型向量(通过枚举实现)来创建表。填写表格应通过指定 csv 文件来完成。但是,这需要在编译时指定表行的结构,如基本示例所示:
#[derive(Debug, Deserialize, Eq, PartialEq)]
struct Row {
key: u32,
name: String,
comment: String
}
use std::error::Error;
use csv::ReaderBuilder;
use serde::Deserialize;
use std::fs;
fn read_from_file(path: &str) -> Result<(), Box<dyn Error>> {
let data = fs::read_to_string(path).expect("Unable to read file");
let mut rdr = ReaderBuilder::new()
.has_headers(false)
.delimiter(b'|')
.from_reader(data.as_bytes());
let mut iter = rdr.deserialize();
if let Some(result) = iter.next() {
let record:Row = result?;
println!("{:?}", record);
Ok(())
} else {
Err(From::from("expected at least one record but got none"))
}
}
是否有可能使用通用表信息而不是“行”结构来转换反序列化的结果?是否可以根据列类型的组合大小简单地分配内存并解析其中的记录?我会在C中做这样的事情......
解决方案
是否有可能使用通用表信息而不是“行”结构来转换反序列化的结果?
所有泛型在编译时都替换为具体类型。如果您不知道运行时需要的类型,则“泛型”不是您所需要的。
是否可以根据列类型的组合大小简单地分配内存并解析其中的记录?我会在C中做这样的事情......
我建议Box<dyn Any>
改为使用,以便能够存储任何类型的引用,并且仍然知道它是什么类型。
这种方法的维护成本相当高。您必须在要使用单元格值的任何地方管理每种可能的值类型。另一方面,您不需要每次都解析值,只需在运行时进行一些类型检查。
我已经习惯std::any::TypeId
了识别类型,但它不能用于match
表达式。您可以考虑使用自定义枚举作为类型标识符。
use std::any::{Any, TypeId};
use std::io::Read;
use csv::Reader;
#[derive(Default)]
struct Table {
name: String,
headers: Vec<(String, TypeId)>,
data: Vec<Vec<Box<dyn Any>>>,
}
impl Table {
fn add_header(&mut self, header: String, _type: TypeId) {
self.headers.push((header, _type));
}
fn populate_data<R: Read>(
&mut self,
rdr: &mut Reader<R>,
) -> Result<(), Box<dyn std::error::Error>> {
for record in rdr.records() {
let record = record?;
let mut row: Vec<Box<dyn Any>> = vec![];
for (&(_, type_id), value) in self.headers.iter().zip(record.iter()) {
if type_id == TypeId::of::<u32>() {
row.push(Box::new(value.parse::<u32>()?));
} else if type_id == TypeId::of::<String>() {
row.push(Box::new(value.to_owned()));
}
}
self.data.push(row);
}
Ok(())
}
}
impl std::fmt::Display for Table {
fn fmt(&self, f: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
writeln!(f, "Table: {}", self.name)?;
for (name, _) in self.headers.iter() {
write!(f, "{}, ", name)?;
}
writeln!(f)?;
for row in self.data.iter() {
for cell in row.iter() {
if let Some(&value) = cell.downcast_ref::<u32>() {
write!(f, "{}, ", value)?;
} else if let Some(value) = cell.downcast_ref::<String>() {
write!(f, "{}, ", value)?;
}
}
writeln!(f)?;
}
Ok(())
}
}
fn main() {
let mut table: Table = Default::default();
table.name = "Foo".to_owned();
table.add_header("key".to_owned(), TypeId::of::<u32>());
table.add_header("name".to_owned(), TypeId::of::<String>());
table.add_header("comment".to_owned(), TypeId::of::<String>());
let data = "\
key,name,comment
1,foo,foo comment
2,bar,bar comment
";
let mut rdr = Reader::from_reader(data.as_bytes());
table.populate_data(&mut rdr).unwrap();
print!("{}", table);
}
推荐阅读
- apache - 将非 www 重定向到 www,SSL ON
- identityserver4 - “AuthenticationScheme:idsrv 未通过身份验证。” 当 Identity Server 4 托管在 IIS 中但工作托管在 Azure 中时
- python - 如何在pygame中绘制多行多列的矩形?
- php - 使用 PHP 在 MySQL 中计数(*)
- node.js - 通过 API 发送 MQTT 数据
- javascript - 如何使用 JavaScript 动态创建对象?
- python - 没有这样的文件或目录:Choregraphe 2.8 中的“file.json”错误
- android - Android 上的 QBluetoothDeviceDiscoveryAgent::ClassicMethod
- instagram - 为什么我的 Instagram 滤镜没有变焦和闪光灯?
- node.js - 带有动态对象的 Node.js,如何更新它?