Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Внедрением называют особый формат представления данных, который можно легко использовать в моделях и алгоритмах машинного обучения. Внедрение представляет собой представление семантического значения фрагмента текста с высокой информационной плотностью. Каждое внедрение представляет собой такой вектор чисел с плавающей запятой, что расстояние между двумя внедрениями в векторном пространстве коррелирует с семантическим сходством между двумя входными значениями в исходном формате. Например, если два текста похожи, их векторные представления также должны быть похожи. Встраивания поддерживают поиск векторного сходства в базах данных Azure, таких как Azure Cosmos DB для NoSQL, Azure Cosmos DB для MongoDB vCore, Azure SQL Database или Azure Database для PostgreSQL — гибкая серверная.
Как получить эмбеддинги
Чтобы получить вектор внедрения для фрагмента текста, мы создаем запрос к конечной точке внедрений, как показано в следующих фрагментах кода:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-10-21\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
Лучшие практики
Убедитесь, что входные данные не превышают максимальную длину
- Максимальная длина входного текста для наших последних моделей внедрения составляет 8 192 токенов. Перед выполнением запроса необходимо убедиться в том, что входные данные не превышают это ограничение.
- Если вы отправляете массив входных данных в одном запросе на внедрение, то максимальный размер этого массива составляет 2048.
- При отправке массива входных параметров в одном запросе, помните, что количество токенов в минуту в ваших запросах должно оставаться ниже ограничения квоты, установленного при развертывании модели. По умолчанию модели внедрения последних поколений 3 подлежат ограничению на 350 K TPM для каждого региона.
Ограничения и риски
В некоторых случаях наши модели внедрения могут быть ненадежными или представлять социальные риски и в отсутствие смягчающих мер могут причинить вред. Ознакомьтесь с нашими материалами по ответственному применению искусственного интеллекта.
Дальнейшие шаги
- Узнайте больше об использовании Azure OpenAI и эмбеддингов для выполнения поиска документов с помощью нашего руководства по эмбеддингам.
- Ознакомьтесь с дополнительными сведениями о базовых моделях, лежащих в основе Azure OpenAI.
- Сохраните ваши векторы и выполните поиск сходства с помощью выбранного вами сервиса.
- Поиск по искусственному интеллекту Azure
- Azure Cosmos DB для MongoDB vCore
- База данных SQL Azure
- Azure Cosmos DB для работы с NoSQL
- Azure Cosmos DB для PostgreSQL
- База данных Azure для PostgreSQL — гибкий сервер
- Кэш Azure для Redis
- Использование Eventhouse в качестве векторной базы данных — аналитика в режиме реального времени в Microsoft Fabric