被HTTP吊打?复旦大学开展IPFS性能测试

2019-11-07

来自复旦大学的研究人员对IPFS的IO性能做了一项实验,并和HTTP进行对比,以验证IPFS网络处理请求时的延迟和吞吐量表现。

需要指出的是,该实验是研究人员选择在Amazon EC2服务器上进行部署不同的节点进行的。因此,他们也表示,“现有的工作仍然缺乏(对IPFS的)全面的研究”。

该研究主要面向数据IO性能,验证远程读取的延迟时间、延迟范围、吞吐量等。并对请求上采用大、小请求处理的类型加以划分,使得对比结果更加直观。图:IPFS与HTTP性能对比 来源Understanding I/O performance of IPFS storage: a client’s perspective,ACM,id3329052

远程读取操作的平均延迟:

当请求是小的请求时,在1k-4k间,HTTP延迟比IPFS低。遇到16-256k之间的文件,IPFS的延迟状况由于HTTP。当处理大文件请求时,IPFS在延迟上的表现不尽人意,尤其是请求大小超过16MB时,IPFS的处理时间接近了20秒。超过64MB时,延迟更是可以达到70秒,是HTTP(10秒)的7倍。

远程读取操作的延迟范围:

小的请求,IPFS的波动范围更小,HTTP则更大。但执行大的请求时,IPFS的延迟范围更大,波动也高于HTTP。

远程读取操作的吞吐量:

当处理小请求(1k-256k),两者的吞吐量差别不大,但总体上HTTP吞吐量要小于IPFS;当遇到大请求(1MB-61MB),HTTP吞吐量都高于HTTP。4MB时,HTTP吞吐量是IPFS的两倍,16MB时约为3倍,64MB时两者吞吐量接近7倍。总体上IPFS在小的请求上占优,但是遇到大的请求时,IPFS网络表现还不尽人意。

是什么原因导致了IPFS在处理大请求时比不上传统的HTTP?IPFS是一种点对点的分布式超媒体传输协议,整体的网络表现依赖于分布式节点。文件的读取受到节点自身及全网其它节点的影响。

主要的因素包括:

●节点数量和稳定性

●带宽

●地理位置

作为一个点对点的网络,IPFS节点越多,整体的表现也更好。

虽然IPFS创始人Juan Benet在Web3峰会上表示IPFS节点已经超过10万,网络增长了30倍。但是从2015年IPFS开始运行至今,IPFS网络的节点数量还不足以满足全球范围内的无障碍使用。很明显的例子是我们打开大文件时,速度很慢。另外,带宽仍然是关键。在现实中,它受到机房、运营商、本地路由的影响,任何一方都可以干预到网络表现。

作为点对点的网络,在节点有限的情况下,整体表现需要提高。最后还要考虑地理位置因素。假如99%的节点分布在北半球,而南半球只有你的唯一一个节点在南极,那么你和其它节点的通信将会很艰难,无论速度和效率都比不上距离近的节点。IPFS被看作是将取代HTTP。但无论是该研究报告的情况来看,还是实际体验,IPFS网络还有很多工作要做。

现阶段IPFS处于什么阶段?

近年来,IPFS迅速普及。有关IPFS的应用已经大量出现。图:IPFS创始人在2019年Web3峰会上展示IPFS生态应用

其中,最受关注之一是Filecoin——一个基于IPFS的去中心化分布式存储网络。官方表示主网上线(预计)时间为2020年3月。目前全球最大的加密数字货币交易所Coinbase已经开始对Filecoin进行资产上市审查,通过后将正式上市。作为IPFS协议栈的Filecoin,其成功与否将直接影响到IPFS的应用。

另外,IPFS生态也有基于区块链、面向Web3.0提供服务的应用,具有代表性的是下一代搜索引擎IPSE——一个基于IPFS的搜索引擎,可以帮助用户快速搜索IPFS网络上的哈希内容,让资源访问的流程极大简化,用户无需安装客户端即可获取星际文件系统上的文件。IPSE面向IPFS提供搜索,属于IPFS生态优秀的应用之一。在2019年的Web3.0峰会上,IPFS创始人介绍了包括IPSE在内的一大批IPFS应用。另外,IPFS底层的Libp2p正为以太坊、Polkadot等区块链的提供解决方案,成为它们的底层必备的基础设施。

除了区块链生态,IPFS还在整个科技领域展现它的作用。如微软、火狐、Opera等都已经对IPFS展开实际的研究应用。在地区上,欧洲、美国、中国等地区对IPFS保持着极高的关注度。尤其是在中国,大量的矿业布局IPFS存储挖矿。使得IPFS产业不仅有软件服务,还有硬件生态。


预计在2019年末到2020年第一季度,IPFS生态会发展会步入下一阶段。分布式的全球网络不仅要结构上的分布式,还要地理上的分布式。一个不断壮大的IPFS生态对于人们来说是一个好消息。虽然远景广大,到达目标还需要完成中间的过程。

通过实验研究表明,解析和下载操作都可能成为瓶颈,避免高延迟I / O操作,需要优化IPFS也和现实体验结果相符。从客户的角度评估IPFS数据I / O操作的性能,考察IPFS的文件请求表现,也为IPFS或者说去中心化分布式存储大规模商用提供了决策参考。