Поделиться через


VECTOR_DISTANCE (Transact-SQL) (предварительная версия)

Применимо к: SQL Server 2025 (17.x) — предварительная версия базы данных SQLAzure Для Управляемого экземпляра SQL Azureв Microsoft Fabric

Примечание.

Этот тип данных находится в предварительной версии и подлежит изменению. Не забудьте прочитать условия использования предварительной версии в соглашениях об уровне обслуживания (SLA) для веб-служб.

Вычисляет расстояние между двумя векторами с помощью указанной метрики расстояния. Расстояние вектора всегда точно и не использует векторный индекс, даже если он доступен. Чтобы использовать векторный индекс и таким образом выполнить приблизительный поиск векторов, необходимо использовать функцию VECTOR_SEARCH . Дополнительные сведения о том, как работает индексирование векторов и векторный поиск, а также различия между точным и приблизительным поиском, см. векторах в ядре СУБД SQL.

Примечание.

VECTOR_DISTANCE доступен в Управляемом экземпляре SQL Azure, настроенном с помощью политики обновления Always-up-to-date .

Синтаксис

Соглашения о синтаксисе Transact-SQL

VECTOR_DISTANCE ( distance_metric, vector1, vector2 )

Аргументы

distance_metric

Строка с именем метрики расстояния, используемой для вычисления расстояния между двумя заданными векторами. Поддерживаются следующие метрики расстояния:

  • cosine - Косинус расстояние
  • euclidean - Евклидеан расстояние
  • dot - (Отрицательное) Dot product

vector1

Выражение, которое оценивает тип векторных данных.

vector2

Выражение, которое оценивает тип векторных данных.

Метрики расстояния

Метрическая Описание Диапазон Примеры
cosine Косинус (угловое) расстояние [0, 2] 0: идентичные векторы
2: противоположные векторы
euclidean Евклидеан расстояние [-∞, +∞] 0: идентичные векторы
dot Точка на основе продукта указание расстояния,
полученное путем вычисления отрицательного продукта dot
[-∞, +∞] Меньшие числа указывают на более похожие векторы

Возвращаемое значение

Функция возвращает скалярное значение с плавающей запятой , представляющее расстояние между двумя векторами с помощью указанной метрики расстояния.

Ошибка возвращается, если distance_metric не является допустимой метрикой и если указанные векторы не относятся к типу данных векторов.

Примеры

Подробные сведения о базе данных, используемой в примере, можно найти здесь: скачайте и импортируйте статью Википедии с векторными внедрениями.

В примерах предполагается наличие таблицы wikipedia_articles с именем столбца title_vector типа vector , в который хранятся встраивания заголовков статей Википедии. title_vector Предполагается, что внедрение создается с помощью модели внедрения, такой как text-embedding-ada-002 или text-embedding-3-small , который возвращает векторы с 1536 измерениями.

Дополнительные примеры, включая комплексные решения, см. в репозитории GitHub для векторного поиска базы данных SQL Azure.

Пример 1

В следующем примере создается вектор с тремя измерениями из строки с массивом JSON.

DECLARE @v1 VECTOR(2) = '[1,1]';
DECLARE @v2 VECTOR(2) = '[-1,-1]';

SELECT 
    VECTOR_DISTANCE('euclidean', @v1, @v2) AS euclidean,
    VECTOR_DISTANCE('cosine', @v1, @v2) AS cosine,
    VECTOR_DISTANCE('dot', @v1, @v2) AS negative_dot_product;

Пример 2

В следующем примере возвращаются самые похожие статьи из 10 самых похожих статей для данной статьи на основе расстояния между их векторами заголовка.

DECLARE @v AS VECTOR(1536);
SELECT @v = title_vector FROM [dbo].[wikipedia_articles] WHERE title = 'Alan Turing';

SELECT TOP(10) 
  id, 
  title, 
  VECTOR_DISTANCE('cosine', @v, title_vector) AS distance 
FROM 
  [dbo].[wikipedia_articles] 
ORDER BY
  distance

Пример 3

В следующем примере возвращаются все аналогичные статьи для данной статьи, основанные на расстоянии косинуса между векторами заголовков, выбирая только те, у которых расстояние меньше 0,3.

DECLARE @v AS VECTOR(1536);
SELECT @v = title_vector FROM [dbo].[wikipedia_articles] WHERE title = 'Alan Turing';

SELECT  
  id, 
  title,
  VECTOR_DISTANCE('cosine', @v, title_vector) AS distance
FROM 
  [dbo].[wikipedia_articles] 
WHERE
  VECTOR_DISTANCE('cosine', @v, title_vector) < 0.3
ORDER BY
  distance