forgeplan embed

Генерирует векторные эмбеддинги для каждого артефакта в рабочем пространстве, чтобы семантический поиск мог находить связанные работы по смыслу, а не только по ключевым словам. Эмбеддинги хранятся вместе с метаданными LanceDB и используются командами forgeplan search --semantic и семантическими инструментами MCP.

Использование

forgeplan embed

Опции

  -h, --help     Вывести справку
  -V, --version  Вывести версию

Флаг функции

Команда embed скрыта за флагом функции Cargo semantic-search. Бинарный файл Forgeplan по умолчанию поставляется без семантического поиска, чтобы сохранить небольшой размер загрузки и избежать включения модели машинного обучения. Чтобы включить его, соберите из исходников:

cargo install --path crates/forgeplan-cli --features semantic-search

Без этого флага команда является заглушкой, не выполняющей никаких операций, которая выводит подсказку, указывающую на поиск по ключевым словам BM25 (который уже является производственным решением начиная с версии v0.18.0).

Что делает команда

Загружает модель эмбеддинга BGE-M3 через fastembed-rs.
Обходит каждый артефакт в LanceDB и объединяет заголовок + тело + теги.
Вычисляет 1024-мерный вектор для каждого артефакта.
Записывает векторы в столбец embedding таблицы artifacts.
Кэширует веса модели в .forgeplan/.fastembed_cache/ (игнорируется Git).

При первом запуске загружается около 500 МБ весов модели - последующие запуски используют кэш. Создание эмбеддингов для типичного рабочего пространства из 100 артефактов занимает 10-60 секунд в зависимости от вашего оборудования (по умолчанию используется CPU, CUDA/Metal при наличии).

Когда это нужно

Вы хотите использовать семантический поиск - запрос “найти артефакты о снижении доверия” должен выводить работы по R_eff / доказательствам, даже если эти точные слова не встречаются.
Вы создаёте рабочие процессы AI-агентов, где инструмент MCP извлекает связанный контекст по сходству, а не по ключевым словам.
Вы используете векторный поиск FPF KB (PRD-042) по корпусу методологии.

Когда это не нужно

Ваш корпус небольшой (<50 артефактов) - поиск по ключевым словам (BM25 + русская морфология, v0.18.0) находит всё.
Вы предпочитаете минимальную установку без зависимости от ML.
Вам нужны воспроизводимые сборки без загрузки модели размером ~500 МБ при первом запуске.

По умолчанию forgeplan search "query" теперь использует производственный BM25 (v0.18.0), который обрабатывает русское стеммирование, английский язык и удаление шума из шаблонов - это надёжная базовая функция поиска по ключевым словам, и её может быть достаточно.

Пример

# Сборка с включённым семантическим поиском
cargo install --path crates/forgeplan-cli --features semantic-search

# Генерируем эмбеддинги для всего рабочего пространства
forgeplan embed

# Теперь семантический поиск работает
forgeplan search "trust calculus" --semantic

См. также

Обзор CLI
forgeplan search - поиск по ключевым словам + семантический поиск
forgeplan reindex - перестроение метаданных (не затрагивает эмбеддинги)
forgeplan fpf search - поиск по базе знаний FPF