Поделиться через


Сравнивайте и выбирайте модели с помощью рейтинга моделей на портале Microsoft Foundry (предварительный просмотр)

Замечание

Этот документ относится к порталу Microsoft Foundry (классическая модель).

🔄 Перейдите в новую документацию Microsoft Foundry, если вы используете новый портал.

Замечание

Этот документ относится к порталу Microsoft Foundry (new).

В этой статье показано, как упростить выбор моделей в каталоге моделей Microsoft Foundry, сравнивая модели в списках лидеров моделей (предварительная версия), доступных на портале Foundry. Это сравнение поможет вам принять обоснованные решения о том, какие модели соответствуют требованиям для конкретного варианта использования или приложения.

В этой статье показано, как упростить выбор моделей в каталоге моделей Microsoft Foundry с помощью таблиц лидеров моделей (предварительная версия) и параллельных функций сравнения на портале Microsoft Foundry. Эти функции позволяют понять производительность модели с помощью комплексных списков лидеров и прямых сравнений, помогая принимать обоснованные решения о том, какие модели лучше всего соответствуют вашим конкретным требованиям к использованию или приложению.

Вы можете анализировать и сравнивать модели с помощью:

  • Список лидеров моделей для быстрого определения высокопроизводительных моделей для обеспечения качества, безопасности, предполагаемой стоимости и списков лидеров пропускной способности
  • Компромиссные диаграммы для визуального сравнения производительности модели между двумя метриками, такими как качество и стоимость
  • Списки лидеров по сценариям, чтобы найти наиболее релевантный бенчмарк-лидерборд для вашего конкретного сценария.

Это важно

Элементы, обозначенные в этой статье как (предварительная версия), сейчас предлагаются в общедоступной предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в дополнительных условиях использования для предварительных версий Microsoft Azure.

Предпосылки

  • Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure , чтобы начать работу.

  • Проект Foundry.

Доступ к спискам лидеров модели

  1. Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry отключен. Эти действия относятся к Фаундри (классическая модель).
  2. Если вы еще не находитесь в проекте, выберите его.
  3. Выберите каталог моделей в левой области.
  1. Перейдите в раздел "Лидеры моделей " каталога моделей. В этом разделе показаны первые три лидера модели, ранжированные по качеству, безопасности, стоимости и производительности. Для получения дополнительных сведений можно выбрать любую из этих моделей.

    Снимок экрана с изображением выбранной модели из раздела рейтингов на главной странице каталога моделей.

  2. В разделе "Список лидеров моделей " каталога моделей выберите "Обзор списков лидеров ", чтобы перейти на целевую страницу списков лидеров модели , чтобы просмотреть полный набор доступных списков лидеров.

    Снимок экрана: точка входа из каталога моделей в таблицы лидеров моделей.

    На домашней странице отображаются основные моменты списка лидеров для критериев выбора модели. Качество является наиболее распространенным критерием выбора модели, за которым следует безопасность, стоимость и производительность.

    Снимок экрана: выделенные списки лидеров в качестве, стоимости и производительности.

  1. Если вы еще не находитесь в проекте, выберите его.

  2. Перейдите в раздел "Обнаружение " из верхней навигации, где можно просмотреть моментальный снимок таблицы лидеров модели на странице обзора. Вы можете отсортировать различные метрики, чтобы просмотреть первые 6 соответственно. Качество является наиболее распространенным критерием выбора модели, за которым следует безопасность, стоимость и производительность. Вы можете выбрать любую из этих моделей, чтобы перейти к соответствующим страницам сведений о модели. Чтобы просмотреть больше моделей, превышающих топ-6, выберите "Перейти к списку лидеров".

  3. Таблица лидеров модели выделяет топ-5 лучших по качеству, безопасности, пропускной способности и предполагаемой стоимости. Эти диаграммы можно развернуть для визуального просмотра верхней 10.

  4. После диаграмм можно найти полный рейтинг модели. Как и в топ-6, вы можете сортировать метрики, которые вам наиболее важны, и выбрать имя модели, чтобы перейти на соответствующую страницу деталей.

  5. Вы также можете выбрать 2-3 модели для подробного сравнения признаков в параллельном представлении.

Компромиссные диаграммы

Эта компромиссная диаграмма позволяет визуально сравнивать компромиссы на основе критериев, о которым вы заботитесь больше. Предположим, вы заботитесь больше о стоимости, чем качество, и вы обнаружите, что самая дешевле модель не является самой дешевой, вам может потребоваться компромисс между качеством, безопасностью, стоимостью и критериями пропускной способности. На наглядной сравнительной диаграмме можно сравнить, как модели показывают результаты по этим двум метрикам.

  1. Выберите раскрывающееся меню "Модели" , чтобы добавить или удалить модели из диаграммы компромисса.
  2. Выберите вкладку "Качество" и "Безопасность ", " Качество" и "Стоимость " и " Пропускная способность ", чтобы просмотреть эти диаграммы для выбранных моделей.
  3. Выберите "Сравнить между метриками" , чтобы получить доступ к сравнениям между несколькими парами этих измерений.

Снимок экрана: компромиссные диаграммы качества, стоимости и производительности.

Вы можете сравнить качество с предполагаемой стоимостью, пропускной способностью или безопасностью с помощью раскрывающегося списка для переключения.

Вы можете добавить или удалить модели из диаграммы компромисса с помощью селектора справа.

Просмотр списков лидеров по сценариям

Предположим, что у вас есть сценарий, требующий определенных возможностей модели. Например, предположим, что вы создаете чат-бота для ответов на вопросы, который требует устойчивости к вредоносному контенту, а также хороших возможностей для ответов на вопросы и рассуждений. Возможно, вам будет полезно сравнить модели в этих таблицах лидеров, подкрепленные тестами для конкретных возможностей.

Снимок экрана: таблицы лидеров качества по сценариям.

После изучения списков лидеров можно выбрать модель для использования.

Просмотр бенчмарков из карточки модели

  1. Выберите модель для вашего вкуса и выберите сведения о модели. Вы можете выбрать модель из одной из отображаемых таблиц лидеров, например в таблице лидеров качества в верхней части домашней страницы таблиц лидеров модели. В этом примере выберите gpt-4o. Это действие открывает страницу обзора модели.

  2. Перейдите на вкладку Benchmarks , чтобы проверить результаты теста для модели.

    Снимок экрана: вкладка

  3. Выберите "Сравнить с другими моделями".

  4. Перейдите в представление списка , чтобы получить более подробные результаты для каждой модели.

    Снимок экрана: пример представления сравнения тестов.

Анализ результатов бенчмарка

Если вы находитесь на вкладке "Тесты" для конкретной модели, вы можете собирать подробные сведения, чтобы лучше понять и интерпретировать результаты теста, включая:

  • Высокоуровневые статистические оценки: эти оценки качества ИИ, затрат, задержки и пропускной способности предоставляют краткий обзор производительности модели.

  • Сравнительная диаграмма: эти диаграммы отображают относительную позицию модели по сравнению с соответствующими моделями.

  • Таблица сравнения метрик: в этой таблице представлены подробные результаты для каждой метрики.

    Снимок экрана: вкладка

По умолчанию Foundry отображает средний индекс для различных метрик и наборов данных, чтобы обеспечить высокий уровень производительности модели.

Чтобы получить доступ к результатам теста для определенной метрики и набора данных, выполните указанные ниже действия.

  1. Нажмите кнопку "Развернуть" на диаграмме. Всплывающий график сравнения показывает подробные сведения и обеспечивает большую гибкость для сравнения.

    Снимок экрана: кнопка

  2. Выберите интересующую метрику и выберите различные наборы данных в зависимости от конкретного сценария. Для получения более подробных определений метрик и описаний общедоступных наборов данных, используемых для вычисления результатов, нажмите кнопку "Подробнее".

    Снимок экрана: диаграмма сравнения с определенными метрикой и набором данных.

Оцените результаты эталонного теста с вашими данными

В предыдущих разделах показаны результаты теста, вычисляемые корпорацией Майкрософт, с помощью общедоступных наборов данных. Однако вы можете попытаться повторно создать тот же набор метрик с данными.

  1. Вернитесь на вкладку Benchmarks в карточке модели.

  2. Выберите "Попробовать с собственными данными", чтобы оценить модель на ваших данных. Оценка данных помогает узнать, как модель выполняется в определенных сценариях.

    Снимок экрана, показывающий кнопку для выбора и оценки с собственными данными.

Сравнение моделей

Эта функция позволяет параллельно сравнивать до трех моделей одновременно в нескольких измерениях, включая тесты производительности, спецификации сведений о модели, поддерживаемые конечные точки и поддержку функций.

Используйте раскрывающийся список для выбора моделей, которые нужно сравнить.

Если вы хотите узнать еще больше о модели, вы можете просмотреть сведения или, если вы готовы начать использовать модель, можно развернуть.

Снимок экрана: интерфейс сравнения моделей в Microsoft Foundry.

Просмотр и анализ эталонных показателей на модельной карточке.

Выбрав модель, которая вас заинтересовала, будь то из списка лидеров или при просмотре каталога, перейдите на вкладку "Оценки", чтобы ознакомиться с результатами тестирования модели.

Замечание

Результаты тестирования, проведенные корпорацией Майкрософт, доступны для выбора моделей в каталоге моделей. Сведения о тестировании, сообщаемые поставщиками, включаются при наличии.

Если вы находитесь на вкладке "Эталонные показатели" для конкретной модели, вы можете собрать подробные сведения, чтобы лучше понять и интерпретировать результаты теста с помощью:

  • Результаты теста общедоступных данных: это высокоуровневые статистические оценки качества ИИ, безопасности, предполагаемой стоимости, задержки и пропускной способности, которые предоставляют краткий обзор производительности модели.

  • Сравнительная диаграмма: эти диаграммы отображают относительную позицию модели по сравнению с соответствующими моделями.

  • Таблица сравнения метрик: в этой таблице представлены подробные результаты для каждой метрики.

    Снимок экрана: таблица сравнения метрик на вкладке

По умолчанию Microsoft Foundry отображает средний индекс по различным метрикам и наборам данных, чтобы обеспечить высокий уровень производительности модели.

Чтобы получить доступ к результатам теста для определенной метрики и набора данных, выполните указанные ниже действия.

  1. Нажмите кнопку "Развернуть" на диаграмме. Всплывающий график сравнения показывает подробные сведения и обеспечивает большую гибкость для сравнения.

  2. Выберите интересующую метрику и выберите различные наборы данных в зависимости от конкретного сценария. Для получения более подробных определений метрик и описаний общедоступных наборов данных, используемых для вычисления результатов, нажмите кнопку "Подробнее".

Для параллельных сравнений моделей можно сравнить модели для оценки функций, метрик производительности и предполагаемых затрат для нескольких моделей.