【大家的项目】NFS > FUSE: 为什么我们用Rust实现了自己的NFS服务器
-
Rust语言中文社区
2023-09-30 22:47:21
-
数据库开发技术
-
原创

乐观地看FUSE
我喜欢文件。每个计算机系统都理解文件。每个程序都知道如何读取和写入文件。这是一个真正通用的API。因此,我喜欢FUSE的想法。FUSE的名字来源于Filesystem in Userspace,也就是“用户态文件系统”,是一套允许用户模式程序定义文件系统的Linux接口。
有了FUSE,不需要内核模块就可以构建文件系统驱动程序。Fuse是大量文件系统客户端的基础,包括NTFS甚至像SFTP或Amazon S3这样的远程“文件系统”。它还可以用来制作奇怪的文件系统。这些文件系统实际上并不是真正的文件系统,比如WikipediaFS,它允许人们使用自己的文本编辑器编辑维基百科文章。在Xethub,我们想要帮你用已有的工具本地访问任何版本的数据集。不用通过S3命令就能够直接浏览图像数据集还是很香的。
Webflow图片说明: 想象一下,如果你可以这样与任何文件互动
- 有两个不兼容的API版本 (libfuse2和libfuse3)
- 随着时间的推移还有很多其他的小变化 (参见FUSE_USE_VERSION)。
而且FUSE在Mac和Windows上不能原生地用,需要用户安装第三方驱动程序(MacFuse, WinFuse)。每一个这种驱动程序都可能存在细微的API不兼容性。问题的关键
是否有可能构建一个真正跨平台的用户空间文件系统接口?
为了回答这个问题,我回看了20年计算机科学历史并偶然发现了NFSv3。NFS
NFSv3是一个已经有20年历史的网络文件系统协议。它如此简单和普遍,以至于几乎每个操作系统都把它实现了一遍。
- 傻瓜服务器,智能客户端: (RFC 1813在第1.6节第4段中有明确说明) 这很好,因为我们只需要实现服务器,而智能的客户端已经被实现并优化了20多年。
- 简单的缓存一致性规则: ****服务器不定义缓存策略。客户端多智能都无所谓。因为协议定义了一种机制让服务器一有变化就通知客户端。这种实现比FUSE更简单、更高效。在实际应用中,FUSE守护进程本身必须明确地实现大量的缓存。使用NFS,我们可以避免所有这些额外的复杂性。
- NFS客户端知道它在通过网络通信: 这意味着NFS客户端和协议内置了我们可以现成用的超时、重试和失败的机制。无状态协议使得这些机制非常简洁。用在FUSE上,超时/失败行为必须在守护进程的每个地方都被可靠地实现。如果你卡在一次API调用,很容易就连带卡住守护进程和所有读取文件系统的程序。
- 实际上性能非常好。 至少在*nix上,本地网络与管道一样快。 Windows的话不确定,但我会很惊讶如果它不快。
总而言之,使用本地NFS而不是FUSE实现用户态文件系统使得更容易获得性能和韧性。我们可以利用现有的缓存支持和超过20年的强化而只需要实现一次服务器协议。所以去年当我感染新冠隔离的时候,我试了试用Rust实现了一个NFSv3服务器,结果非常好。我们在XetHub是怎么用NFS的
XetHub做出了世界上第一个原生、跨平台、用户态的文件系统实现,让你不需要任何内核驱动程序就可以挂载任意大的数据集。这使你能够在几秒钟内本地挂载约660 GB的 Llama 2模型或查询DuckDB数据库来分析parquet大文件并选出你需要的数据。所有这些目前都支持Linux、Mac 和Windows Pro(不幸的是不支持Windows Home)。Windows在体验上有一些小的奇特之处,但总体上是可用的。开源nfsserve
我们在Github上开源了我们的Rust NFS服务器实现nfsserve。如果你也是一个?Rust-acean,你可以使用cargo安装nfsserve="0.10"。
文档绝对需要多多维护,我们也欢迎接受任何的PR优化!你可以在readme中找到一些贡献的线索。我们会持续维护这个库,因为我们在pyxet中的xet mount实现和xet-core(我们同样开源了)实际上都依赖它。
我确信nfsserve还有很多重构和性能提升的空间,希望大家从这篇文章中有所收获!注解: XetHub开发了一个使用NFSv3协议而不是FUSE的跨平台用户态文件系统,从而实现了更好的性能和可靠性。他们已经开源了他们的NFS服务器Rust实现,用于他们的xet mount实现,并且支持Linux、Mac和Windows Pro。https://about.xethub.com/blog/nfs-fuse-why-we-built-nfs-server-rust