Поделиться через


Функция ai_similarity

Область применения:отмечено галочкой Databricks SQL отмечено галочкой Databricks Runtime

Внимание

Эта функция предоставляется в режиме общедоступной предварительной версии.

Во время предварительной версии базовая языковая модель может обрабатывать несколько языков, но эта функция ИИ настраивается для английского языка.

Функция ai_similarity() вызывает модель создания искусственного интеллекта из API модели Databricks Foundation для сравнения двух строк и вычислений семантической оценки сходства с помощью SQL.

Требования

Внимание

Базовые модели, которые могут использоваться в настоящее время, лицензируются в соответствии с лицензией Apache 2.0, Авторским правом © The Apache Software Foundation или лицензией сообщества LLAMA 3.3, Авторским правом © Meta Platforms, Inc. Все права защищены. Клиенты отвечают за обеспечение соответствия применимым лицензиям модели.

Databricks рекомендует просматривать эти лицензии, чтобы обеспечить соответствие любым применимым условиям. Если модели появляются в будущем, которые лучше работают в соответствии с внутренними тестами Databricks, Databricks может изменить модель (и список применимых лицензий, предоставленных на этой странице).

  • Эта функция доступна только в рабочих областях с функциями ИИ, использующими API моделей Foundation, поддерживаемых в определённых регионах.
  • Эта функция недоступна в Классической версии SQL Azure Databricks.
  • Ознакомьтесь со страницей цен на Databricks SQL.
  • В Databricks Runtime 15.1 и более поздних версиях эта функция поддерживается в записных книжках Databricks, включая записные книжки, которые выполняются как задача в рабочем процессе Databricks.
  • Для повышения производительности рабочих нагрузок пакетного вывода требуется Среда выполнения Databricks Runtime 15.4 ML LTS.

Синтаксис

ai_similarity(expr1, expr2)

Аргументы

  • expr1: Выражение STRING.
  • expr2: Выражение STRING.

Возвраты

FLOAT Значение, представляющее семантику сходства между двумя входными строками. Оценка выходных данных является относительной и должна использоваться только для ранжирования. Оценка 1 означает, что два текста равны.

Примеры

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 10;

  Databricks Inc.