特点

LevelDB is a fast key-value storage library written at Google that provides an ordered mapping from string keys to string values. KVDB is a key-value storage library base on leveldb, we separate the value and key when it is needed

特点

keys 和 value 的分离可根据阈值进行动态分离，即在KVDB中，可实时根据不同的业务需求进行分离阈值调整。
对于小于阈值的key-value 对，并没有进行分离，而是采用leveldb一样存放方式，都是放入sst当中。
在leveldb的基础上增加了垃圾回收机制，垃圾回收线程在后台进行，KVDB运行的线程优先级是主线程 > Compact 线程 > 后台垃圾回收线程。
垃圾回收支持自动在线回收和手动回收，同时在打开数据时也可选择是否要进行垃圾回收。
若是没有开启在线垃圾回收，将支持快照，若是在数据库运行期间发生了快照，那么快照以后的数据都不进行垃圾回收。
可进行手动设置每一个valuelog 大小。
levelDB 具有写放大和读放大，KVDB 因为kv分离了，可减少写放大和读放大，提高运行的效率。

数据组织形式

  record :
  checksum: uint32     // crc32c of type and data[] ; little-endian
  length: uint16       // record的长度
  Sequence: uint64     // record 中第一对kv所对应的sequence
  kv Number：uint16    // 这个record 中所具有的kv对数
  data:                //  保存的数据

  log中的data 的数据格式为：
  data：
       type:           uint8         // 是否要进行kv分离
       keysize:        uint16        // key的长度    
       key:                          // key值
       valuesize:      uint16        // value 的长度
       value:                        // value值

  data中value的数据格式为：  
  若是不分离则value保存的是存入的值，如是需要分离则保存为以下的格式     
  value:
      file number:    uint64        // kv对需要存入log的编号
      offset:         uint64        // 这个kv对起始位置在log中偏移，方便get的时候读取，采用随机读取方式
      kv_value_size:  uint64        // 指record中第一个kv对开始到该kv对的偏移

写流程

在原本leveldb的基础上加上了value的大小判断，若是大于设定的阈值，将会进行kv分离，写入batch中。若是小于阈值，则将会按照leveldb中原本的方式进行存储。

读流程

先从mem，imm和LSM 中查找到key值对应的value的值，解析出来后，若是已经kv分离的话，value保存的是log文件编号，偏移地址，以及value的大小。查找到的值若是不分离的，直接返回，若是分离，则需要根据value的值，进一步去log文件中查找。

garbage collection

创建一个独立后台线程，对需删除的vlog文件中无效 kv 进行删除，有效 kv重新存储到数据库中。利用管理类决定哪些vlog文件需删除。重新存储方案：为保证有效 kv 重新存储的正确性，不影响后续 kv 对正确存储，采用预分配时间序列的策略，在具体回收前，先为其分配一段不影响查找准确性的seq给有效kv对。

性能测试

测试环境

创建一个5万条kv记录的数据库，其中每条记录的key为16个字节，value为 1 M ，分离的阈值为 1 M，不开启snappy压缩，所以写入磁盘的文件大小就是数据的原始大小。

LevelDB:    version 1.23
CPU:        8 * AMD Ryzen 7 4800H with Radeon Graphics
CPUCache:   512 KB
Keys:       16 bytes each
Values:     1048576 bytes each (524288 bytes after compression)
Entries:    50000
Raw Size:   50000.8 MB (estimated)
File Size:  25000.8 MB (estimated)
WARNING: Snappy compression is not enabled

This project supports CMake out of the box.

写性能

leveldb

  fillseq      :       7865.658 micros/op;   127.1 MB/s     
  fillrandom   :      108742.624 micros/op;    9.2 MB/s     
  overwrite    :      184634.483 micros/op;    5.4 MB/s

KVDB

  fillseq      :       2069.794 micros/op;   483.1 MB/s     
  fillrandom   :       2118.600 micros/op;   472.0 MB/s     
  overwrite    :       2123.194 micros/op;   471.0 MB/s

分析：

对于大value的场景下，若不进行kv分离，LSM tree 中的底层很快就会被占满，需要向上合并，造成频繁的compact，进一步放大了写放大。若是kv分离以后，一个kv对所占用的空间极少，compact的触发的频次下降。减少了写放大，提高了写入的效率。
imm 转到 sst 的过程中，后台压缩线程会让主线程进入等待的状态，若不进行kv分离，一个imm很快就被占满，进入压缩状态，后续的put则需要等待。降低了写入效率。
整体上，写入的效率KVDB是要好的。这是因为leveldb在大value下的频繁的compact的原因。

读性能

leveldb

readrandom   :       13804.489 micros/op; (43405 of 50000 found)   
readrandom   :       3558.571 micros/op; (43374 of 50000 found)     
readseq      :       1325.517 micros/op; 
compact      :       1014576010.000 micros/op;
readrandom   :       3452.342 micros/op; (43318 of 50000 found)
readseq      :       977.001 micros/op;
fill100K     :    14104.420 micros/op;   6.8 MB/s (1000 ops)

KVDB

readrandom   :       3926.204 micros/op; (43405 of 50000 found)     
readrandom   :       4732.702 micros/op; (43374 of 50000 found)
readseq      :       1.285 micros/op; 
compact      :       218021.000 micros/op;
readrandom   :       5023.581 micros/op; (43318 of 50000 found)
readseq      :       0.653 micros/op; 
fill100K     :     12432.440 micros/op;  7.7 MB/s (1000 ops)

分析：

对于大value的场景下，kv分离以后，mem, imm, sst中存储的kv对数更多，内存中可缓存的sst也更多了，从概率上看，在内存中找到所需要的key的概率更大。
访问一个sst，可以跳过的kv对数更多，查找的也就更快。更大概率减少了无效的查找。
从压缩的时间来看，leveldb的压缩时间远大于KVDB的，也表明了大value下leveldb所要compact的次数多。fill100K 表明当写小value的时候，两者是相差无几的。

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
benchmarks		benchmarks
cmake		cmake
db		db
doc		doc
helpers/memenv		helpers/memenv
image		image
include/leveldb		include/leveldb
port		port
table		table
third_party		third_party
util		util
AUTHORS		AUTHORS
CMakeLists.txt		CMakeLists.txt
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
NEWS		NEWS
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

特点

数据组织形式

写流程

读流程

garbage collection

性能测试

测试环境

写性能

分析：

读性能

分析：

About

Releases

Packages

Languages

License

Buildings-Lei/kv-separate

Folders and files

Latest commit

History

Repository files navigation

特点

数据组织形式

写流程

读流程

garbage collection

性能测试

测试环境

写性能

分析：

读性能

分析：

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages