Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Выпуски OCR (версия чтения)
Важно
Выберите выпуск Read, который лучше всего соответствует вашим требованиям.
| Ввод | Примеры | Читать выпуск | Польза |
|---|---|---|---|
| Изображения: общие, в естественных условиях | метки, уличные знаки и плакаты | OCR для изображений (версия 4.0) | Оптимизировано для общих образов, не являющихся документами, с улучшенным синхронным API, что упрощает внедрение OCR в сценарии взаимодействия с пользователем. |
| Документы: цифровые и сканированные, включая изображения | книги, статьи и отчеты | Модель чтения с системой интеллектуальной обработки документов | Оптимизировано для обработки отсканированных и цифровых документов с большим объемом текста с помощью асинхронного API для автоматизации интеллектуальной обработки документов в масштабе. |
О Azure Vision версии 3.2 GA Read
Ищете новейшую версию Azure Vision 3.2 (GA) Read? Все будущие улучшения функции чтения OCR входят в состав двух ранее перечисленных услуг. Дополнительные обновления для Azure Vision версии 3.2 отсутствуют. Дополнительные сведения см. в разделе Call Azure Vision 3.2 GA Read API и Quickstart: Azure Vision v3.2 GA Read.
Начните работать с Azure Vision в инструментах Foundry, используя REST API или клиентские библиотеки. API чтения предоставляет алгоритмы ИИ для извлечения текста из изображений и возврата их в виде структурированных строк. Выполните следующие действия, чтобы установить пакет в приложение и попробовать пример кода для основных задач.
Используйте клиентская библиотека оптического распознавания символов (OCR), чтобы считывать печатный и рукописный текст из изображения. Служба OCR может читать видимый текст в изображении и преобразовывать его в символьный поток. Дополнительные сведения о распознавании текста см. в обзоре OCR. В этом разделе используется последний пакет Azure Vision в инструментах Foundry.
Совет
Вы также можете извлечь текст из локального изображения. См. методы ComputerVisionClient , такие как ReadInStreamAsync. Кроме того, ознакомьтесь с примером кода GitHub для сценариев с использованием локальных образов.
Справочная документация | Исходный код библиотеки | Пакет (NuGet) | Примеры
Необходимые условия
- Подписка Azure: Создайте бесплатно.
- Visual Studio IDE или текущая версия .NET Core.
-
Ресурс Azure Vision. Вы можете использовать бесплатный тарифный план (
F0), чтобы попробовать службу, а затем перейти на платный план для рабочих нужд. - Ключ и конечная точка из ресурса, создаваемого для подключения приложения к Azure Vision.
- После развертывания ресурса Azure Vision выберите Go to resource.
- В левой области выберите "Ключи" и "Конечная точка".
- Скопируйте один из ключей и конечную точку для использования позже в кратком руководстве.
Создание переменных среды
В этом примере напишите учетные данные в переменные среды на локальном компьютере, на котором выполняется приложение.
Перейдите на портал Azure. Если ресурс, созданный в разделе "Предварительные требования" , развернут успешно, выберите "Перейти к ресурсу " в разделе "Дальнейшие действия". Вы можете найти ключ и конечную точку в разделе "Управление ресурсами" на странице "Ключи и конечная точка" ресурса Face. Ключ ресурса не совпадает с идентификатором Azure подписки.
Чтобы задать переменную среды для ключа и конечной точки, откройте окно консоли и следуйте инструкциям для операционной системы и среды разработки.
- Чтобы задать
VISION_KEYпеременную среды, замените<your_key>одним из ключей ресурса. - Чтобы задать переменную среды, замените
VISION_ENDPOINTконечной точкой для вашего ресурса.
Важно
Мы рекомендуем Microsoft Entra ID проверку подлинности с помощью управляемых удостоверений для ресурсов Azure, чтобы избежать хранения учетных данных в приложениях, работающих в облаке.
Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. При использовании ключей API безопасно храните их в Azure Key Vault, регулярно поворачивайте ключи и ограничивайте доступ к Azure Key Vault с помощью управления доступом на основе ролей и ограничений доступа к сети. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.
Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
После добавления переменных среды может потребоваться перезапустить все запущенные программы, которые будут считывать переменные среды, включая окно консоли.
Чтение печатного и рукописного текста
Создайте новое приложение C#.
С помощью Visual Studio создайте проект Console App (.NET Framework) для C#, Windows, консоли.
После создания проекта установите клиентную библиотеку:
- Щелкните правой кнопкой мыши решение проекта в Обозреватель решений и выберите Manage NuGet Packages for Solution.
- В открываемом диспетчере пакетов нажмите кнопку "Обзор". Выберите "Включить предварительную версию".
- Найдите и выберите
Microsoft.Azure.CognitiveServices.Vision.ComputerVision. - В диалоговом окне сведений выберите проект и выберите последнюю стабильную версию. Затем нажмите кнопку "Установить".
В каталоге проекта откройте файл Program.cs в предпочтительном редакторе или интегрированной среде разработки. Замените содержимое Program.cs следующим кодом.
using System; using System.Collections.Generic; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models; using System.Threading.Tasks; using System.IO; using Newtonsoft.Json; using Newtonsoft.Json.Linq; using System.Threading; using System.Linq; namespace ComputerVisionQuickstart { class Program { // Add your Computer Vision key and endpoint static string key = Environment.GetEnvironmentVariable("VISION_KEY"); static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT"); private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg"; static void Main(string[] args) { Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example"); Console.WriteLine(); ComputerVisionClient client = Authenticate(endpoint, key); // Extract text (OCR) from a URL image using the Read API ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait(); } public static ComputerVisionClient Authenticate(string endpoint, string key) { ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials(key)) { Endpoint = endpoint }; return client; } public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile) { Console.WriteLine("----------------------------------------------------------"); Console.WriteLine("READ FILE FROM URL"); Console.WriteLine(); // Read text from URL var textHeaders = await client.ReadAsync(urlFile); // After the request, get the operation location (operation ID) string operationLocation = textHeaders.OperationLocation; Thread.Sleep(2000); // Retrieve the URI where the extracted text will be stored from the Operation-Location header. // We only need the ID and not the full URL const int numberOfCharsInOperationId = 36; string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId); // Extract the text ReadOperationResult results; Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}..."); Console.WriteLine(); do { results = await client.GetReadResultAsync(Guid.Parse(operationId)); } while ((results.Status == OperationStatusCodes.Running || results.Status == OperationStatusCodes.NotStarted)); // Display the found text. Console.WriteLine(); var textUrlFileResults = results.AnalyzeResult.ReadResults; foreach (ReadResult page in textUrlFileResults) { foreach (Line line in page.Lines) { Console.WriteLine(line.Text); } } Console.WriteLine(); } } }В качестве дополнительного шага см. определите способ обработки данных. Например, чтобы явно указать последнюю GA модель, отредактируйте
ReadAsyncвызов, как показано. Пропустите параметр или используйте"latest", чтобы использовать самую последнюю модель GA (общедоступной версии).// Read text from URL with a specific model version var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");Запустите приложение.
- В меню отладки выберите "Начать отладку".
Выход
Azure Vision - .NET quickstart example
----------------------------------------------------------
READ FILE FROM URL
Extracting text from URL file printed_text.jpg...
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
Calories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
Очистка ресурсов
Если вы хотите очистить и удалить подписку Foundry Tools, можно удалить ресурс или группу ресурсов. При удалении группы ресурсов также удаляются все другие ресурсы, связанные с ним.
Дальнейшие действия
В этом кратком руководстве вы узнали, как установить клиентскую библиотеку OCR и использовать API Read. Далее узнайте больше о функциях API для чтения.
Используйте клиентская библиотека оптического распознавания символов (OCR), чтобы считывать печатный и рукописный текст из удаленного изображения. Служба OCR может читать видимый текст в изображении и преобразовывать его в символьный поток. Дополнительные сведения о распознавании текста см. в обзоре OCR.
Совет
Вы также можете считывать текст из локального изображения. См. методы ComputerVisionClientOperationsMixin , например read_in_stream. Кроме того, ознакомьтесь с примером кода GitHub для сценариев с использованием локальных образов.
Справочная документация | Исходный код библиотеки | Пакет (PiPy) | Примеры
Необходимые условия
- Подписка Azure: Создайте бесплатно.
- Python 3.x.
- Установка Python должна содержать pip. Вы можете проверить, установлен ли pip, запустите
pip --versionв командной строке. Получите pip, установив последнюю версию Python. -
An Azure Vision in Foundry Tools resource. Вы можете использовать бесплатный тарифный план (
F0), чтобы попробовать службу, а затем перейти на платный план для рабочих нужд. - Ключ и конечная точка из ресурса, создаваемого для подключения приложения к Azure Vision.
- После развертывания ресурса Azure Vision выберите Go to resource.
- В левой области выберите "Ключи" и "Конечная точка".
- Скопируйте один из ключей и конечную точку для использования позже в кратком руководстве.
Создание переменных среды
В этом примере напишите учетные данные в переменные среды на локальном компьютере, на котором выполняется приложение.
Перейдите на портал Azure. Если ресурс, созданный в разделе "Предварительные требования" , развернут успешно, выберите "Перейти к ресурсу " в разделе "Дальнейшие действия". Вы можете найти ключ и конечную точку в разделе "Управление ресурсами" на странице "Ключи и конечная точка" ресурса Face. Ключ ресурса не совпадает с идентификатором Azure подписки.
Чтобы задать переменную среды для ключа и конечной точки, откройте окно консоли и следуйте инструкциям для операционной системы и среды разработки.
- Чтобы задать
VISION_KEYпеременную среды, замените<your_key>одним из ключей ресурса. - Чтобы задать переменную среды, замените
VISION_ENDPOINTконечной точкой для вашего ресурса.
Важно
Мы рекомендуем Microsoft Entra ID проверку подлинности с помощью управляемых удостоверений для ресурсов Azure, чтобы избежать хранения учетных данных в приложениях, работающих в облаке.
Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. При использовании ключей API безопасно храните их в Azure Key Vault, регулярно поворачивайте ключи и ограничивайте доступ к Azure Key Vault с помощью управления доступом на основе ролей и ограничений доступа к сети. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.
Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
После добавления переменных среды может потребоваться перезапустить все запущенные программы, которые будут считывать переменные среды, включая окно консоли.
Чтение печатного и рукописного текста
Установите клиентская библиотека.
В окне консоли выполните следующую команду:
pip install --upgrade azure-cognitiveservices-vision-computervisionУстановите библиотеку Pillow.
pip install pillowСоздайте файл приложения Python quickstart-file.py. Затем откройте его в предпочтительном редакторе или интегрированной среде разработки.
Замените содержимое quickstart-file.py следующим кодом.
from azure.cognitiveservices.vision.computervision import ComputerVisionClient from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes from msrest.authentication import CognitiveServicesCredentials from array import array import os from PIL import Image import sys import time ''' Authenticate Authenticates your credentials and creates a client. ''' subscription_key = os.environ["VISION_KEY"] endpoint = os.environ["VISION_ENDPOINT"] computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key)) ''' END - Authenticate ''' ''' OCR: Read File using the Read API, extract text - remote This example will extract text in an image, then print results, line by line. This API call can also extract handwriting style text (not shown). ''' print("===== Read File - remote =====") # Get an image with text read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png" # Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True) # Get the operation location (URL with an ID at the end) from the response read_operation_location = read_response.headers["Operation-Location"] # Grab the ID from the URL operation_id = read_operation_location.split("/")[-1] # Call the "GET" API and wait for it to retrieve the results while True: read_result = computervision_client.get_read_result(operation_id) if read_result.status not in ['notStarted', 'running']: break time.sleep(1) # Print the detected text, line by line if read_result.status == OperationStatusCodes.succeeded: for text_result in read_result.analyze_result.read_results: for line in text_result.lines: print(line.text) print(line.bounding_box) print() ''' END - Read File - remote ''' print("End of Computer Vision quickstart.")В качестве дополнительного шага см. определите способ обработки данных. Например, чтобы явно указать последнюю модель общедоступной версии, измените инструкцию
read, как показано ниже. Пропуск параметра или использование"latest"автоматически применяет самую последнюю модель GA (общедоступной версии).# Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True, model_version="2022-04-30")Запустите приложение с помощью команды
pythonв вашем файле быстрого запуска.python quickstart-file.py
Выход
===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]
End of Azure Vision quickstart.
Очистка ресурсов
Если вы хотите очистить и удалить подписку Foundry Tools, можно удалить ресурс или группу ресурсов. При удалении группы ресурсов также удаляются все другие ресурсы, связанные с ним.
Дальнейшие действия
В этом кратком руководстве вы узнали, как установить клиентскую библиотеку OCR и использовать API Read. Далее узнайте больше о функциях API для чтения.
Используйте клиентскую библиотеку оптического распознавания символов (OCR), чтобы читать печатный и рукописный текст с Read API. Служба OCR может читать видимый текст в изображении и преобразовывать его в символьный поток. Дополнительные сведения о распознавании текста см. в обзоре OCR.
Совет
Вы также можете считывать текст из локального изображения. См. методы ComputerVisionClient , такие как readInStream. Кроме того, ознакомьтесь с примером кода GitHub для сценариев с использованием локальных образов.
Справочная документация | Пакет (npm) | Образцы
Необходимые условия
- Подписка Azure: Создайте бесплатно.
- Текущая версия Node.js.
-
An Azure Vision in Foundry Tools resource. Вы можете использовать бесплатный тарифный план (
F0), чтобы попробовать службу, а затем перейти на платный план для рабочих нужд. - Ключ и конечная точка из ресурса, создаваемого для подключения приложения к Azure Vision.
- После развертывания ресурса Azure Vision выберите Go to resource.
- В левой области выберите "Ключи" и "Конечная точка".
- Скопируйте один из ключей и конечную точку для использования позже в кратком руководстве.
Создание переменных среды
В этом примере напишите учетные данные в переменные среды на локальном компьютере, на котором выполняется приложение.
Перейдите на портал Azure. Если ресурс, созданный в разделе "Предварительные требования" , развернут успешно, выберите "Перейти к ресурсу " в разделе "Дальнейшие действия". Вы можете найти ключ и конечную точку в разделе "Управление ресурсами" на странице "Ключи и конечная точка" ресурса Face. Ключ ресурса не совпадает с идентификатором Azure подписки.
Чтобы задать переменную среды для ключа и конечной точки, откройте окно консоли и следуйте инструкциям для операционной системы и среды разработки.
- Чтобы задать
VISION_KEYпеременную среды, замените<your_key>одним из ключей ресурса. - Чтобы задать переменную среды, замените
VISION_ENDPOINTконечной точкой для вашего ресурса.
Важно
Мы рекомендуем Microsoft Entra ID проверку подлинности с помощью управляемых удостоверений для ресурсов Azure, чтобы избежать хранения учетных данных в приложениях, работающих в облаке.
Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. При использовании ключей API безопасно храните их в Azure Key Vault, регулярно поворачивайте ключи и ограничивайте доступ к Azure Key Vault с помощью управления доступом на основе ролей и ограничений доступа к сети. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.
Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
После добавления переменных среды может потребоваться перезапустить все запущенные программы, которые будут считывать переменные среды, включая окно консоли.
Чтение печатного и рукописного текста
Создайте новое приложение Node.js.
В окне консоли создайте новый каталог для приложения и перейдите к нему.
mkdir myapp cd myappВыполните команду
npm init, чтобы создать приложение Node.js с файломpackage.json. Выберите ввод для любых запросов.npm initЧтобы установить клиентскую библиотеку, установите npm пакеты
ms-rest-azureи@azure/cognitiveservices-computervision.npm install ms-rest-azure npm install @azure/cognitiveservices-computervisionУстановите асинхронный модуль:
npm install asyncФайл приложения
package.jsonобновляется с помощью зависимостей.Создайте файл ,index.jsи откройте его в текстовом редакторе.
Вставьте следующий код в файл index.js .
'use strict'; const async = require('async'); const fs = require('fs'); const https = require('https'); const path = require("path"); const createReadStream = require('fs').createReadStream const sleep = require('util').promisify(setTimeout); const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient; const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials; /** * AUTHENTICATE * This single client is used for all examples. */ const key = process.env.VISION_KEY; const endpoint = process.env.VISION_ENDPOINT; const computerVisionClient = new ComputerVisionClient( new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint); /** * END - Authenticate */ function computerVision() { async.series([ async function () { /** * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API * Extracts text from images using OCR (optical character recognition). */ console.log('-------------------------------------------------'); console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF'); console.log(); // URL images containing printed and/or handwritten text. // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff). const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg'; // Recognize text in printed image from a URL console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop()); const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL); printRecText(printedResult); // Perform read and await the result from URL async function readTextFromURL(client, url) { // To recognize text in a local image, replace client.read() with readTextInStream() as shown: let result = await client.read(url); // Operation ID is last path segment of operationLocation (a URL) let operation = result.operationLocation.split('/').slice(-1)[0]; // Wait for read recognition to complete // result.status is initially undefined, since it's the result of read while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); } return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff. } // Prints all text from Read result function printRecText(readResults) { console.log('Recognized text:'); for (const page in readResults) { if (readResults.length > 1) { console.log(`==== Page: ${page}`); } const result = readResults[page]; if (result.lines.length) { for (const line of result.lines) { console.log(line.words.map(w => w.text).join(' ')); } } else { console.log('No recognized text.'); } } } /** * * Download the specified file in the URL to the current local folder * */ function downloadFilesToLocal(url, localFileName) { return new Promise((resolve, reject) => { console.log('--- Downloading file to local directory from: ' + url); const request = https.request(url, (res) => { if (res.statusCode !== 200) { console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`); reject(); } var data = []; res.on('data', (chunk) => { data.push(chunk); }); res.on('end', () => { console.log(' ... Downloaded successfully'); fs.writeFileSync(localFileName, Buffer.concat(data)); resolve(); }); }); request.on('error', function (e) { console.log(e.message); reject(); }); request.end(); }); } /** * END - Recognize Printed & Handwritten Text */ console.log(); console.log('-------------------------------------------------'); console.log('End of quickstart.'); }, function () { return new Promise((resolve) => { resolve(); }) } ], (err) => { throw (err); }); } computerVision();В качестве дополнительного шага см. определите способ обработки данных. Например, чтобы явно указать последнюю модель общедоступной версии, измените инструкцию
read, как показано ниже. Пропуск параметра или использование"latest"автоматически применяет самую последнюю модель GA (общедоступной версии).let result = await client.read(url,{modelVersion:"2022-04-30"});Запустите приложение с помощью команды
nodeв вашем файле быстрого запуска.node index.js
Выход
-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF
Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
-------------------------------------------------
End of quickstart.
Очистка ресурсов
Если вы хотите очистить и удалить подписку Foundry Tools, можно удалить ресурс или группу ресурсов. При удалении группы ресурсов также удаляются все другие ресурсы, связанные с ним.
Дальнейшие действия
В этом кратком руководстве вы узнали, как установить клиентскую библиотеку OCR и использовать API Read. Далее узнайте больше о функциях API для чтения.
Используйте REST API оптического распознавания символов (OCR) для чтения печатного и рукописного текста.
Примечание
В этом кратком руководстве используются команды cURL для вызова REST API. Вы также можете вызвать REST API с помощью языка программирования. Примеры GitHub см. в примерах C#, Python, Java и JavaScript.
Необходимые условия
- Подписка Azure: Создайте бесплатно.
- установлен cURL.
-
An Azure Vision in Foundry Tools resource. Вы можете использовать бесплатный тарифный план (
F0), чтобы попробовать службу, а затем перейти на платный план для рабочих нужд. - Ключ и конечная точка из ресурса, создаваемого для подключения приложения к Azure Vision.
- После развертывания ресурса Azure Vision выберите Go to resource.
- В левой области выберите "Ключи" и "Конечная точка".
- Скопируйте один из ключей и конечную точку для использования позже в кратком руководстве.
Чтение печатного и рукописного текста
Служба оптического распознавания символов (OCR) может извлекать видимый текст в изображении или документе и преобразовывать его в поток символов. Дополнительные сведения об извлечении текста см. в обзоре OCR.
Вызовите API для чтения
Чтобы создать и запустить пример, сделайте следующее:
Скопируйте следующую команду в текстовый редактор.
Внесите следующие изменения в команду, если это необходимо:
- Замените значение
<key>на ваш ключ. - Замените первую часть URL-адреса запроса (
https://westcentralus.api.cognitive.microsoft.com/) текстом в URL-адресе собственной конечной точки.Примечание
Новые ресурсы, созданные после 1 июля 2019 г., будут использовать пользовательские имена поддомена. Дополнительные сведения и полный список региональных конечных точек см. в разделе "Пользовательские имена поддомена" для средств Foundry.
- При необходимости измените URL-адрес изображения в тексте запроса (
https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png) на URL-адрес другого изображения, который необходимо проанализировать.
- Замените значение
Откройте окно командной строки.
Вставьте команду из текстового редактора в окно командной строки и выполните команду.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
Ответ содержит Operation-Location заголовок, значение которого является уникальным URL-адресом. Этот URL-адрес используется для запроса результатов операции чтения. Срок действия URL-адреса истекает через 48 часов.
При необходимости укажите версию модели
В качестве дополнительного шага см. определите способ обработки данных. Например, чтобы явно указать последнюю модель общедоступной версии, используйте model-version=2022-04-30 в качестве параметра. Пропуск параметра или использование model-version=latest автоматически применяет самую последнюю модель GA (общедоступной версии).
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
Получите результаты чтения
Скопируйте следующую команду в текстовый редактор.
Замените URL-адрес значением
Operation-Location, скопированным в предыдущей процедуре.Замените значение
<key>на ваш ключ.Откройте окно консоли.
Вставьте команду из текстового редактора в окно консоли и выполните команду.
curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}"
Проверка ответа
Успешный ответ возвращается в формате JSON. Пример приложения анализирует и отображает успешный ответ в окне консоли, как показано в следующем примере:
{
"status": "succeeded",
"createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
"lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
"analyzeResult": {
"version": "3.2",
"readResults": [
{
"page": 1,
"angle": 0,
"width": 338,
"height": 479,
"unit": "pixel",
"lines": [
{
"boundingBox": [
25,
14,
318,
14,
318,
59,
25,
59
],
"text": "NOTHING",
"appearance": {
"style": {
"name": "other",
"confidence": 0.971
}
},
"words": [
{
"boundingBox": [
27,
15,
294,
15,
294,
60,
27,
60
],
"text": "NOTHING",
"confidence": 0.994
}
]
}
]
}
]
}
}
Очистка ресурсов
Если вы хотите очистить и удалить подписку Foundry Tools, можно удалить ресурс или группу ресурсов. При удалении группы ресурсов также удаляются все другие ресурсы, связанные с ним.
Дальнейшие действия
В этом кратком руководстве вы узнали, как вызвать функцию REST API чтения. Далее узнайте больше о функциях API для чтения.