Поделиться через


Копирование данных из Google BigQuery версии 2 с помощью Фабрика данных Azure или Synapse Analytics

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

В этой статье описано, как с помощью действия копирования в Фабрике данных Azure и конвейерах Synapse Analytics копируются данные из Google BigQuery. Это продолжение статьи с обзором действия копирования, в которой представлены общие сведения о действии копирования.

Внимание

Соединитель Google BigQuery версии 2 обеспечивает улучшенную поддержку Google BigQuery. Если вы используете соединитель Google BigQuery версии 1 в решении, обновите соединитель Google BigQuery, так как версия 1 находится на этапе поддержки. Ваш поток обработки данных завершится ошибкой после 30 сентября 2025 г., если его не обновить. Дополнительные сведения о различиях между версиями 2 и V1 см. в этом разделе .

Поддерживаемые возможности

Этот соединитель Google BigQuery поддерживается для выполнения следующих возможностей:

Поддерживаемые возможности ИКР (инфракрасное излучение)
Действие копирования (источник/-) (1) (2)
Действие поиска (1) (2)

① Среда выполнения интеграции Azure ② Локальная среда выполнения интеграции

Список хранилищ данных, которые поддерживаются в качестве источников и приемников для действия копирования, приведен в таблице Поддерживаемые хранилища данных и форматы.

В службе предоставляется встроенный драйвер, который обеспечивает подключение. Поэтому не нужно вручную устанавливать драйвер для использования этого соединителя.

Примечание.

Этот соединитель Google BigQuery создан на основе API-интерфейсов BigQuery. Учтите, что в BigQuery ограничено максимальное число входящих запросов и применяются соответствующие квоты на каждый проект. Дополнительные сведения см. в разделе о квотах и ограничениях на запросы API. Не активируйте слишком много одновременных запросов к учетной записи.

Начало работы

Чтобы выполнить действие копирования с конвейером, можно воспользоваться одним из приведенных ниже средств или пакетов SDK:

Создание связанной службы для Google BigQuery с помощью пользовательского интерфейса

Выполните приведенные ниже действия, чтобы создать связанную службу для Google BigQuery с помощью пользовательского интерфейса портала Azure.

  1. Перейдите на вкладку "Управление" в рабочей области Фабрики данных Azure или Synapse и выберите "Связанные службы", после чего нажмите "Создать":

  2. Найдите Google BigQuery и выберите соединитель.

    Снимок экрана: соединитель Google BigQuery.

  3. Настройте сведения о службе, проверьте подключение и создайте связанную службу.

    Снимок экрана: конфигурация связанной службы для Google BigQuery.

Сведения о конфигурации соединителя

Следующие разделы содержат сведения о свойствах, которые используются для определения сущностей, относящихся к соединителю Google BigQuery.

Свойства связанной службы

Для связанной службы Google BigQuery поддерживаются следующие свойства.

Свойство Описание: Обязательное поле
тип Свойство type должно иметь значение GoogleBigQueryV2. Да
версия Версия, которую вы указали. Рекомендуется обновить до последней версии, чтобы воспользоваться новыми улучшениями. Да для версии 1.1
projectId Идентификатор проекта BigQuery по умолчанию для отправки запросов. Да
тип аутентификации Механизм проверки подлинности OAuth 2.0, используемый для проверки подлинности.
Допустимые значения: UserAuthentication и ServiceAuthentication. В разделах ниже описываются дополнительные свойства и приведены примеры JSON для поддерживаемых типов проверки подлинности.
Да

Использование проверки подлинности пользователей

Задайте для свойства authenticationType значение UserAuthentication и укажите следующие свойства вместе с универсальными свойствами, описанными в предыдущем разделе:

Свойство Описание: Обязательное поле
clientId Идентификатор приложения, используемого для создания маркера обновления. Да
клиентский секрет Секрет приложения, используемого для создания маркера обновления. Пометьте это поле как SecureString, чтобы безопасно хранить его, или добавьте ссылку на секрет, хранящийся в Azure Key Vault. Да
refreshtoken Маркер обновления, полученный из Google, используемый для авторизации доступа к BigQuery. Сведения о том, как его получить, см. здесь и здесь. Пометьте это поле как SecureString, чтобы безопасно хранить его, или добавьте ссылку на секрет, хранящийся в Azure Key Vault. Да

Пример:

{
    "name": "GoogleBigQueryLinkedService",
    "properties": {
        "type": "GoogleBigQueryV2",
        "version": "1.1",
        "typeProperties": {
            "projectId" : "<project ID>",
            "authenticationType" : "UserAuthentication",
            "clientId": "<client ID>",
            "clientSecret": {
                "type": "SecureString",
                "value":"<client secret>"
            },
            "refreshToken": {
                "type": "SecureString",
                "value": "<refresh token>"
            }
        }
    }
}

Использование проверки подлинности службы

Задайте для свойства authenticationType значение ServiceAuthentication и укажите перечисленные ниже свойства вместе с универсальными свойствами, описанными в предыдущем разделе.

Свойство Описание: Обязательное поле
Содержимое ключевого файла Файл ключа в формате JSON, который используется для проверки подлинности учетной записи службы. Пометьте это поле как SecureString, чтобы безопасно хранить его, или добавьте ссылку на секрет, хранящийся в Azure Key Vault. Да

Пример:

{
    "name": "GoogleBigQueryLinkedService",
    "properties": {
        "type": "GoogleBigQueryV2",
        "version": "1.1",
        "typeProperties": {
            "projectId": "<project ID>",
            "authenticationType": "ServiceAuthentication",
            "keyFileContent": {
                "type": "SecureString",
                "value": "<key file JSON string>"
            }
        }
    }
}

Свойства набора данных

Полный список разделов и свойств, доступных для определения наборов данных, см. в статье о наборах данных. В этом разделе содержится список свойств, поддерживаемых набором данных Google BigQuery.

Чтобы скопировать данные из Google BigQuery, задайте для свойства типа набора данных значение GoogleBigQueryV2Object. Поддерживаются следующие свойства:

Свойство Описание: Обязательное поле
тип Свойство типа набора данных должно иметь значение : GoogleBigQueryV2Object Да
набор данных Имя набора данных Google BigQuery. Нет (если свойство query указано в источнике действия)
таблица Имя таблицы. Нет (если свойство query указано в источнике действия)

Пример

{
    "name": "GoogleBigQueryDataset",
    "properties": {
        "type": "GoogleBigQueryV2Object",
        "linkedServiceName": {
            "referenceName": "<Google BigQuery linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [],
        "typeProperties": {
            "dataset": "<dataset name>",
            "table": "<table name>"
        }
    }
}

Свойства действия копирования

Полный список разделов и свойств, используемых для определения действий, см. в статье Конвейеры и действия в фабрике данных Azure. В этом разделе содержится список свойств, поддерживаемых типом источника Google BigQuery.

GoogleBigQuerySource в качестве типа источника

Чтобы скопировать данные из Google BigQuery, задайте тип источника в действии копирования в GoogleBigQueryV2Source. В разделе source действия копирования поддерживаются следующие свойства:

Свойство Описание: Обязательное поле
тип Свойство type источника действия копирования должно иметь значение GoogleBigQueryV2Source. Да
запрос Используйте пользовательский SQL-запрос для чтения данных. Например, "SELECT * FROM MyTable". Дополнительные сведения см. в синтаксисе запросов. Нет (если заданы набор данных и таблица в наборе данных)

Пример:

"activities":[
    {
        "name": "CopyFromGoogleBigQuery",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Google BigQuery input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "GoogleBigQueryV2Source",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Свойства действия поиска

Подробные сведения об этих свойствах см. в разделе Действие поиска.

Жизненный цикл и обновление соединителя Google BigQuery

В следующей таблице показаны этап выпуска и журналы изменений для различных версий соединителя Google BigQuery:

Версия Этап выпуска Журнал изменений
Google BigQuery V1 Окончание поддержки /
Google BigQuery V2 (версия 1.0) GA версия доступна • Проверка подлинности службы поддерживается средой выполнения интеграции Azure и локальной средой выполнения интеграции.
Свойства trustedCertPathuseSystemTrustStoreи emailkeyFilePath не поддерживаются, так как они доступны только в локальной среде выполнения интеграции.

requestGoogleDriveScope не поддерживается. Вам потребуется дополнительно применить разрешение в службе Google BigQuery, указав области API Google Drive и данные диска запросов.

additionalProjects не поддерживается. В качестве альтернативы запросите общедоступный набор данных с помощью консоли Google Cloud.

• ЧИСЛО считывается как тип данных десятичный.

• Метка времени и DateTime считываются как тип данных DateTimeOffset.
Google BigQuery версии 2 (версия 1.1) GA версия доступна • Исправлена ошибка: при выполнении нескольких инструкций query теперь возвращает результаты первой инструкции после исключения инструкций оценки, а не всегда возвращая результат первой инструкции.

Обновление соединителя Google BigQuery

Чтобы обновить соединитель Google BigQuery, выполните следующее:

  • От версии 1 до версии 2:
    Создайте связанную службу Google BigQuery и настройте ее, ссылаясь на свойства связанной службы.

  • От версии V2 1.0 до версии 1.1:
    На странице Изменить связанную службу выберите 1.1 в качестве версии. Дополнительные сведения см. в разделе "Свойства связанной службы".

Список хранилищ данных, поддерживаемых в рамках функции копирования в качестве источников и приемников, см. в разделе Поддерживаемые хранилища данных.