[core] Introduce deletion vector meta cache at bucket level #6407

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Open

bryndenZh wants to merge 6 commits into apache:master from bryndenZh:dv-cache

+812 −18

bryndenZh commented Oct 16, 2025

Purpose

In high-concurrency point query scenarios on the primary key table, we observed high CPU usage mainly caused by deserialization overhead of DV metadata. Currently, reading deletion vector metadata for a single bucket requires reading and deserializing a large number of entries from the index manifest, if the table has many partition and buckets.

This PR introduces a bucket-level dv meta cache which reduces CPU load and significantly improves QPS for single-bucket query scenarios on primary key tables.

Tests

API and Format

Documentation

岚谷 added 4 commits

October 15, 2025 16:33


          support dv meta cache

4d0e410


          update test

0667dac


          change CacheKey to inner class

e5811f4


          fix checkstyle

97ee458

JingsongLi reviewed

View reviewed changes

paimon-api/src/main/java/org/apache/paimon/options/CatalogOptions.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-api/src/main/java/org/apache/paimon/options/CatalogOptions.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-api/src/main/java/org/apache/paimon/options/CatalogOptions.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java

    
                  @Nullable

                  // Construct DataFile -> DeletionFile based on IndexFileMeta

                  public Map<String, DeletionFile> extractDeletionFileByMeta(

Contributor

JingsongLi Oct 16, 2025

Remove public and add @VisibleForTesting.

Author

bryndenZh Oct 22, 2025

remove public will lead to compilation problems

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java Outdated

    
                                      DELETION_VECTORS_INDEX,

                                      partitionBuckets.stream().map(Pair::getLeft).collect(Collectors.toSet()));

                      Map<Pair<BinaryRow, Integer>, Map<String, DeletionFile>> result = new HashMap<>();

                      partitionBuckets.forEach(

Contributor

JingsongLi Oct 16, 2025

Just use partitionFileMetas.forEach?

Author

bryndenZh Oct 22, 2025

I think unnecessary buckets need to be filtered out?

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/index/IndexFileHandler.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/utils/DVMetaCache.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/utils/DVMetaCache.java Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/utils/DVMetaCache.java Outdated Show resolved Hide resolved

JingsongLi reviewed

View reviewed changes

paimon-core/src/main/java/org/apache/paimon/utils/DVMetaCache.java Outdated

    
                  public DVMetaCache(long maxElementSize) {

                      this.cache =

                              Caffeine.newBuilder().maximumSize(maxElementSize).executor(Runnable::run).build();

Contributor

JingsongLi Oct 16, 2025 •

edited

Loading

Should it be set to max number of DVMetaCacheValue? And use softValues?

Author

bryndenZh Oct 22, 2025

I've added softValues. Do you mean to use List<DVMetaCacheValue> as the weight? I think the List might be empty, and those cache items won't be restricted because of the 0 weight

岚谷 added 2 commits

October 22, 2025 21:04


          fix comments

6510ac3


          change default value

1f9014a

bryndenZh requested a review from JingsongLi

October 24, 2025 08:07

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet