Commit f6ff2a0

and

committed

fix: avoid unsupported native local embedding batch mode

Legacy issue: investigate true llama-cpp native multi-sequence batch support for local embedding models such as bge-small-zh-v1.5-f16 (current runtime reports n_seq_max=1, so embed_batch uses sequential mode). Co-authored-by: GPT-5.4 <noreply@openai.com>

1 parent e352097 commit f6ff2a0Copy full SHA for f6ff2a0

3 files changed

+518

-8

lines changed

docs/design
- local-embedding-llama-cpp-design.md
openviking/models/embedder
- local_embedders.py
tests/unit
- test_local_embedder.py

3 files changed

+518

-8

lines changed

Comments

(0)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Commit f6ff2a0

3 files changed

3 files changed

File tree

3 files changed

3 files changed

0 commit comments