Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Important
- Локальный интерфейс командной строки Foundry доступен в предварительной версии. Общедоступные предварительные версии предоставляют ранний доступ к функциям, которые находятся в процессе активного развертывания.
- Функции, подходы и процессы могут изменяться или иметь ограниченные возможности до общедоступной доступности.
В этой статье содержится исчерпывающая справка по интерфейсу командной строки Foundry Local (CLI). Интерфейс командной строки упорядочивает команды в логические категории, помогая управлять моделями, управлять службой и поддерживать локальный кэш.
Prerequisites
- Установите Foundry Local.
- Локальный терминал, в котором доступен ИНТЕРФЕЙС командной
foundryстроки. - Убедитесь, что у вас есть доступ к интернету для первого скачивания (поставщики выполнения и модели).
- Azure RBAC: неприменимо (выполняется локально).
- Если у вас есть NPU Intel на Windows, установите драйвер NPU Intel NPU для оптимального ускорения NPU.
Установка Foundry Local
Установите Foundry Local с помощью диспетчера пакетов для операционной системы.
-
Windows: откройте терминал и выполните следующую команду:
winget install Microsoft.FoundryLocal -
macOS: откройте терминал и выполните следующую команду:
Кроме того, скачайте установщик из репозитория Foundry Local GitHub.brew tap microsoft/foundrylocal brew install foundrylocal
Проверьте установку:
foundry --version
Убедитесь, что у вас есть права администратора на установку программного обеспечения.
Tip
Если после установки появится ошибка подключения к службе (например, Request to local service failed), выполните команду foundry service restart.
Quick verification
Выполните эти команды, чтобы подтвердить, что интерфейс командной строки установлен и служба доступна.
Отобразить справку по CLI:
foundry --helpЭта команда выводит сведения об использовании и список доступных групп команд.
Reference: Overview
Проверьте состояние службы:
foundry service statusЭта команда выводит, запущена ли локальная служба Foundry и включает ее локальную конечную точку.
Справочник. Команды службы
Overview
Используйте встроенную справку для изучения команд и параметров.
Интерфейс командной строки упорядочивает команды в три основные категории:
- Модель: команды для управления и запуска моделей ИИ
- Служба: команды для управления локальной службой Foundry
- Cache: команды для управления локальным хранилищем моделей
Model commands
В следующей таблице приведены команды, связанные с управлением и выполнением моделей:
Note
Аргумент можно указать по model или идентификатору модели. Использование псевдонима:
- Выбирает лучшую модель для доступного оборудования автоматически. Например, если у вас есть gpu Nvidia, Foundry Local выбирает лучшую модель GPU. Если у вас есть поддерживаемый NPU, Foundry Local выбирает модель NPU.
- Позволяет использовать более короткое имя без необходимости запоминать идентификатор модели.
Если вы хотите запустить определенную модель, используйте идентификатор модели. Например, чтобы запустить qwen2.5-0.5b на процессоре, независимо от наличия другого оборудования, используйте: foundry model run qwen2.5-0.5b-instruct-generic-cpu.
| Command | Description |
|---|---|
foundry model --help |
Отображает все доступные команды, связанные с моделью, и их использование. |
foundry model run <model> |
Запускает указанную модель, скачивает ее, если она не кэшируется и запускает взаимодействие. |
foundry model list |
Выводит список всех доступных моделей для локального использования. При первом запуске он загружает поставщиков исполнения (EP) для вашего оборудования. |
foundry model list --filter <key>=<value> |
Перечисляет модели, отфильтрованные указанными критериями (устройство, задача, псевдоним, поставщик). |
foundry model info <model> |
Отображает подробные сведения о конкретной модели. |
foundry model info <model> --license |
Отображает сведения о лицензии для конкретной модели. |
foundry model download <model> |
Загружает модель в локальный кэш без его запуска. |
foundry model load <model> |
Загружает модель в службу. |
foundry model unload <model> |
Выгружает модель из службы. |
Сортировка списка моделей
Если для псевдонима доступно несколько вариантов идентификаторов модели, список моделей отображает модели в порядке приоритета. Первая модель в списке — это модель, которая выполняется, когда вы указываете модель с помощью alias.
Фильтрация списка моделей
Команда foundry model list поддерживает фильтрацию моделей с помощью --filter параметра. Модели можно фильтровать на основе одного атрибута с помощью пар "ключ-значение".
foundry model list --filter <key>=<value>
Эта команда выводит модели, соответствующие ключу фильтра и значению.
Справочник. Фильтрация списка моделей
Note
При первом запуске foundry model list после установки Foundry Local автоматически скачивает соответствующие поставщики выполнения (EPS) для конфигурации оборудования компьютера. Отображается индикатор хода выполнения, указывающий завершение загрузки перед отображением списка моделей.
Поддерживаемые ключи фильтра:
устройство — тип аппаратного устройства
Фильтрует модели по аппаратному устройству, на которое они работают.
Possible values:
-
CPU— модели центрального процессора -
GPU— модели единиц обработки графики -
NPU— модели единиц нейронной обработки
provider — поставщик выполнения
Фильтрует модели по поставщику выполнения или среде выполнения.
Possible values:
-
CPUExecutionProvider— выполнение на базе ЦПУ -
CUDAExecutionProvider— выполнение GPU NVIDIA CUDA -
WebGpuExecutionProvider— выполнение WebGPU -
QNNExecutionProvider- Выполнение нейронной сети Qualcomm (NPU) -
OpenVINOExecutionProvider— Выполнение Intel OpenVINO -
NvTensorRTRTXExecutionProvider— выполнение NVIDIA TensorRT -
VitisAIExecutionProvider— выполнение ИИ AMD Vitis
задача — тип задачи модели
Фильтрует модели по их предполагаемому варианту использования или задаче.
Common values:
-
chat-completion: модели общения с искусственным интеллектом -
text-generation: модели создания текста
псевдоним — псевдоним модели
Фильтрует модели по идентификатору псевдонима. Включает поддержку сопоставления символов-заместителей с суффиксом *.
Sample values:
phi4-cpuqwen2.5-coder-0.5b-instruct-generic-cpudeepseek-r1-distill-qwen-1.5b-generic-cpuphi-4-mini-instruct-generic-cpu
Специальные функции фильтра
Поддержка отрицания: Добавьте префикс к любому значению !, чтобы исключить соответствующие модели.
foundry model list --filter device=!GPU
Эта команда исключает модели GPU из результатов.
Справочник. Специальные функции фильтра
Сопоставление подстановочных знаков (только псевдоним): Добавьте * для сопоставления префиксов при фильтрации по псевдониму.
foundry model list --filter alias=qwen*
Эта команда возвращает модели, псевдоним которых начинается с qwen.
Справочник. Специальные функции фильтра
Examples
foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider
Эти примеры фильтруют список моделей по устройству, задаче и поставщику выполнения.
Справочник. Фильтрация списка моделей
Note
- Все сравнения не учитывают регистр.
- Для каждой команды можно использовать только один фильтр.
- Нераспознанные ключи фильтров приводят к ошибке.
Интерактивное выполнение модели
Запустите модель и взаимодействуйте с ней непосредственно в терминале:
foundry model run qwen2.5-0.5b
Foundry Local загружает модель при первом запуске, а затем запускает интерактивный сеанс. Введите запрос, чтобы получить ответ:
Why is the sky blue?
Tip
Замените qwen2.5-0.5b любым псевдонимом модели из каталога. Запустите foundry model list для просмотра доступных моделей. Foundry Local скачивает вариант, который лучше всего соответствует вашему оборудованию, например вариант CUDA для GPU NVIDIA или NPU для NPU для NPUs Qualcomm.
Service commands
В следующей таблице приведены команды, связанные с управлением и запуском локальной службы Foundry:
| Command | Description |
|---|---|
foundry service --help |
Отображает все доступные команды, связанные со службой, и их использование. |
foundry service start |
Запускает локальную службу Foundry. |
foundry service stop |
Останавливает локальную службу Foundry. |
foundry service restart |
Перезапуск локальной службы Foundry. |
foundry service status |
Отображает текущее состояние локальной службы Foundry. |
foundry service ps |
Выводит список всех моделей, загруженных в локальную службу Foundry. |
foundry service diag |
Отображает журналы локальной службы Foundry. |
foundry service set <options> |
Задает конфигурацию локальной службы Foundry. |
Cache commands
В следующей таблице приведены команды для управления локальным кэшем, в котором хранятся модели:
| Command | Description |
|---|---|
foundry cache --help |
Отображает все доступные команды, связанные с кэшем, и их использование. |
foundry cache location |
Отображает текущий каталог кэша. |
foundry cache list |
Выводит список всех моделей, хранящихся в локальном кэше. |
foundry cache cd <path> |
Изменяет каталог кэша на указанный путь. |
foundry cache remove <model> |
Удаляет модель из локального кэша. |
Execution providers
Поставщики выполнения — это аппаратно-специфичные библиотеки ускорения, которые выполняют модели как можно эффективнее на вашем устройстве.
Встроенные поставщики выполнения
Foundry Local включает исполнителя процессора, исполнителя WebGPU и исполнителя CUDA.
Поставщик выполнения ЦП использует Microsoft Линейная algebra Subroutines (MLAS) для запуска на любом ЦП и является резервным вариантом ЦП для Foundry Local.
Поставщик выполнения WebGPU использует Dawn, собственную реализацию веб-API для ускорения на любом GPU и является резервным вариантом GPU для Foundry Local.
Поставщик выполнения CUDA использует NVIDIA CUDA для ускорения на GPU NVIDIA. Для этого требуется серия NVIDIA GeForce RTX 30 и более поздних версий с минимальным рекомендуемым драйвером версии 32.0.15.5585 и CUDA версии 12.5. Это действует в соответствии с условиями следующего лицензионного соглашения: Лицензионное соглашение для комплектов средств разработки программного обеспечения NVIDIA — EULA.
Поставщики выполнения подключаемого модуля
Поставщики выполнения, перечисленные в следующей таблице, доступны для динамического скачивания и регистрации в Windows в зависимости от совместимости устройств и драйверов. Они подчиняются указанным условиям лицензии.
Foundry Local автоматически загружает эти поставщики выполнения при первом запуске. Провайдеры выполнения плагинов автоматически обновляются при появлении новых версий.
| Name (Vendor) | Requirements | License terms |
|---|---|---|
NvTensorRTRTXExecutionProvider (NVIDIA) |
NVIDIA GeForce RTX 30XX и более поздних версий с минимальным рекомендуемым драйвером версии 32.0.15.5585 и CUDA версии 12.5 | Лицензионное соглашение для комплектов средств разработки программного обеспечения NVIDIA — EULA |
OpenVINOExecutionProvider (Разведка) |
ЦП: Intel TigerLake (11-го поколения) и более поздних версий с минимальным рекомендуемым драйвером 32.0.100.9565 GPU: Intel AlderLake (12-го поколения) и более поздние версии с минимальным рекомендуемым драйвером 32.0.101.1029 NPU: Intel ArrowLake 15-го поколения и более поздние версии с минимальным рекомендуемым драйвером 32.0.100.4239 |
Лицензионное соглашение о коммерческом использовании дистрибутива Intel OBL версии 2025.02.12 |
QNNExecutionProvider (Qualcomm) |
Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU с минимальной версией драйвера 30.0.140.0 и более поздними версиями Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU с минимальной версией драйвера 30.0.140.0 и выше |
Чтобы просмотреть лицензию QNN, скачайте пакет SDK для Нейронной обработки Qualcomm®, извлеките ZIP-файл и откройте файл LICENSE.pdf. |
VitisAIExecutionProvider (AMD) |
Min: Adrenalin Edition 25.6.3 с драйвером NPU 32.00.0203.280 Max: Adrenalin Edition 25.9.1 с драйвером NPU 32.00.0203.297 |
Дополнительная лицензия не требуется |
Использование Open WebUI с локальным сервером
Подключите Open WebUI к Foundry Local для интерфейса чата на основе браузера, который работает полностью на устройстве.
Запустите модель и оставьте терминал открытым:
foundry model run qwen2.5-0.5bПолучите URL-адрес локальной конечной точки:
foundry service statusСкопируйте URL-адрес конечной точки. Foundry Local назначает динамический порт при каждом запуске службы.
Установите и запустите Open WebUI, а затем откройте
http://localhost:8080в браузере.Подключение Open WebUI к Foundry Local:
- Перейдите в раздел "Параметры>администратора>" подключения и включите прямые подключения.
- Перейдите к разделу "Параметры>">"Управление прямыми подключениями" и выберите +пункт .
- Задайте ДЛЯ URL-адреса
http://localhost:PORT/v1(заменитеPORTпорт на шаге 2) и запустите проверку подлинности в значение None. - Select Save.
Выберите модель из раскрывающегося списка и запустите чат.
Tip
Если модели не отображаются, запустите foundry model run <model> в терминале и перезагрузите Open WebUI. Если подключение завершается ошибкой, подтвердите порт с foundry service statusпомощью .
Обновление платформы локального уровня
Выполните команду для операционной системы, чтобы обновить Foundry Local.
-
Windows:
winget upgrade --id Microsoft.FoundryLocal -
macOS:
brew upgrade foundrylocal
Удаление Foundry Local
Выполните команду для операционной системы, чтобы удалить Foundry Local.
-
Windows:
winget uninstall Microsoft.FoundryLocal -
macOS:
brew rm foundrylocal brew untap microsoft/foundrylocal brew cleanup --scrub
Troubleshooting
Проблемы с подключением к службе
Если при выполнении команды foundry model listвы увидите следующую ошибку:
Exception: Request to local service failed.
Uri: http://127.0.0.1:0/foundry/list
The requested address is not valid in its context. (127.0.0.1:0)
Please check service status with 'foundry service status'.
Перезапустите службу :
foundry service restart
Эта команда исправляет случаи, когда служба выполняется, но недоступна из-за проблемы привязки портов.
Дополнительные рекомендации по устранению неполадок см. в рекомендациях и устранении неполадок.