Перейти к содержимому
FRGEPLAN

forgeplan embed

Генерирует векторные эмбеддинги для каждого артефакта в рабочем пространстве, чтобы семантический поиск мог находить связанные работы по смыслу, а не только по ключевым словам. Эмбеддинги хранятся вместе с метаданными LanceDB и используются командами forgeplan search --semantic и семантическими инструментами MCP.

forgeplan embed
-h, --help Вывести справку
-V, --version Вывести версию

Команда embed скрыта за флагом функции Cargo semantic-search. Бинарный файл Forgeplan по умолчанию поставляется без семантического поиска, чтобы сохранить небольшой размер загрузки и избежать включения модели машинного обучения. Чтобы включить его, соберите из исходников:

Окно терминала
cargo install --path crates/forgeplan-cli --features semantic-search

Без этого флага команда является заглушкой, не выполняющей никаких операций, которая выводит подсказку, указывающую на поиск по ключевым словам BM25 (который уже является производственным решением начиная с версии v0.18.0).

  1. Загружает модель эмбеддинга BGE-M3 через fastembed-rs.
  2. Обходит каждый артефакт в LanceDB и объединяет заголовок + тело + теги.
  3. Вычисляет 1024-мерный вектор для каждого артефакта.
  4. Записывает векторы в столбец embedding таблицы artifacts.
  5. Кэширует веса модели в .forgeplan/.fastembed_cache/ (игнорируется Git).

При первом запуске загружается около 500 МБ весов модели - последующие запуски используют кэш. Создание эмбеддингов для типичного рабочего пространства из 100 артефактов занимает 10-60 секунд в зависимости от вашего оборудования (по умолчанию используется CPU, CUDA/Metal при наличии).

  • Вы хотите использовать семантический поиск - запрос “найти артефакты о снижении доверия” должен выводить работы по R_eff / доказательствам, даже если эти точные слова не встречаются.
  • Вы создаёте рабочие процессы AI-агентов, где инструмент MCP извлекает связанный контекст по сходству, а не по ключевым словам.
  • Вы используете векторный поиск FPF KB (PRD-042) по корпусу методологии.
  • Ваш корпус небольшой (<50 артефактов) - поиск по ключевым словам (BM25 + русская морфология, v0.18.0) находит всё.
  • Вы предпочитаете минимальную установку без зависимости от ML.
  • Вам нужны воспроизводимые сборки без загрузки модели размером ~500 МБ при первом запуске.

По умолчанию forgeplan search "query" теперь использует производственный BM25 (v0.18.0), который обрабатывает русское стеммирование, английский язык и удаление шума из шаблонов - это надёжная базовая функция поиска по ключевым словам, и её может быть достаточно.

Окно терминала
# Сборка с включённым семантическим поиском
cargo install --path crates/forgeplan-cli --features semantic-search
# Генерируем эмбеддинги для всего рабочего пространства
forgeplan embed
# Теперь семантический поиск работает
forgeplan search "trust calculus" --semantic