[TOC]

LSM Tree（Log-structured merge-tree）

磁盘读写特性：随机操作慢，顺序读写快

磁盘读写的动作

一次访盘请求（读/写）完成过程由三个动作组成：

因此在磁盘上读取扇区数据（一块数据）所需时间：

Ti/o=tseek +tla + n *twm

通常的文件读写都是提高读性能，但确降低了写性能

因为上面这些方法，都强加了总体的结构信息在数据上，数据被按照特定的方式放置，所以可以很快的找到特定的数据，但是却对写操作不友善，让写操作性能下降。比如，当我们需要更新hash或者B+树的结构时，需要同时更新文件系统中特定的部分，这就是上面说的比较慢的随机读写操作

LSM 则使用一种不同于上述四种的方法，保持了日志文件写性能，以及微小的读操作性能损失

如果数据更新或者插入完全无序的时候，比如先插入0 ，然后80000，然后200，然后666666，由于不在一个磁盘块中，就需要先去查找到这个数据。数据非常离散，那么就意味着每次查找的时候，它的叶子节点很可能都不在内存中，所以会有很多随机IO访问。并且随机写产生的子树的分裂等等，产生很多的磁盘碎片。

关键词：内存/磁盘，顺序写，层(level)，归并排序

顺序写log到磁盘，同时写到内存，等内存中数据达到一定的数量的时候再按照数据的排序方式有序的写入硬盘

会对数据按key划分为若干层(level)；每个level会对应若干文件，包括存在于内存中和落盘了的；每个文件内key都是有序的，同级的各个文件之间，一般也有序的；每层文件到达一定条件后，进行合并操作，然后放置到更高层

LSM Tree