From 7f5b7b524c77636e1d82dfb42c0d3cff1b1dddd8 Mon Sep 17 00:00:00 2001 From: Yechi Ma <2662511702@qq.com> Date: Thu, 7 Nov 2024 13:40:49 +0800 Subject: [PATCH] modify BackgroundCompaction in README.md --- README.md | 24 +++++++++++++++++++++++- 1 file changed, 23 insertions(+), 1 deletion(-) diff --git a/README.md b/README.md index 4cacaa1..7463265 100644 --- a/README.md +++ b/README.md @@ -62,7 +62,7 @@ if (ddl <= microsecondsTimestamp) { } } ``` -### 3.3.2 修改Comapction流程 +### 3.3.3 修改Comapction流程 在ComapctRange函数中选中的最后一层,也就是代码中的max_level_with_files选中进行合并, 确保合并过程选中所有应该被覆盖度文件。 ``` @@ -85,6 +85,28 @@ void DBImpl::CompactRange(const Slice* begin, const Slice* end) { } ``` +在BackgroundCompaction函数中禁止直接跨层移动文件,确保所有的文件都能通过DoCompactionWork +函数被合并。 +``` +} else if (!is_manual && c->IsTrivialMove()) { +// // Move file to next level +// assert(c->num_input_files(0) == 1); +// FileMetaData* f = c->input(0, 0); +// c->edit()->RemoveFile(c->level(), f->number); +// c->edit()->AddFile(c->level() + 1, f->number, f->file_size, f->smallest, +// f->largest); +// status = versions_->LogAndApply(c->edit(), &mutex_); +// if (!status.ok()) { +// RecordBackgroundError(status); +// } +// VersionSet::LevelSummaryStorage tmp; +// Log(options_.info_log, "Moved #%lld to level-%d %lld bytes %s: %s\n", +// static_cast(f->number), c->level() + 1, +// static_cast(f->file_size), +// status.ToString().c_str(), versions_->LevelSummary(&tmp)); + } +``` + ## 实验中遇到的问题 ### 1. TTL存储的位置以及存储方式 我们最初的想法是把TTL跟value存储在一起,形式为``,这样Put操作会很简单,仅仅把两个字符串拼接起来即可,但这样的话,在Get操作中时,无法判断从何处分割TTL和value,所以我们决定在TTL和value之间添加一个标志符,存放形式改为``,这样,在Get操作时,只需先找到第一个下划线,下划线前面的为TTL,后面的为value,这样就能把TTL和value区分开来。但还有一个问题,判断条件为:`写入数据的时间+ TTL < 读取数据的时间 `,如果仅存放TTL,虽然在调用get时我们可以获得读取数据的时间,并通过解码value获得TTL,但我们没有办法获得写入数据的时间,所以只能通过在Put操作时,把写入数据的时间也写入value中,这样在Get时,就能获得写入数据的时间,从而判断是否过期。所以,我们又把value的形式改为``,这样,通过两个下划线把TTL、写入时间和value区分开来,就能实现在get操作时判断是否过期。但我们又想到,既然在get操作解码得到TTL和写入时间之后要加在一块,并且TTL和写入时间都是在get操作时与value进行编码,那么我们为什么不在get操作时就把TTL和写入时间加在一起,再与value编码呢,把写入时间+TTL记为DDL,这样就可以把value编码为``,在get操作时,只需解码得到DDL,然后拿当前时间跟DDL作比较,即可知道数据是否过期。