Distribuire modelli di Machine Learning in Azure

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1 azureml di Phyton SDK v1

Importante

Questo articolo fornisce informazioni sull'uso di Azure Machine Learning SDK v1. SDK v1 è deprecato a partire dal 31 marzo 2025. Il supporto per questo terminerà il 30 giugno 2026. È possibile installare e usare l'SDK v1 fino a tale data. I flussi di lavoro esistenti che usano SDK v1 continueranno a funzionare dopo la data di fine del supporto. Tuttavia, potrebbero essere esposti a rischi per la sicurezza o a modifiche di rilievo nel caso di cambiamenti dell'architettura del prodotto.

È consigliabile passare all'SDK v2 prima del 30 giugno 2026. Per altre informazioni su SDK v2, vedere Che cos'è l'interfaccia della riga di comando di Azure Machine Learning e Python SDK v2? e il Riferimento SDK v2.

Informazioni su come distribuire il modello di Machine Learning o Deep Learning come servizio Web nel cloud di Azure.

Nota

Gli endpoint di Azure Machine Learning (v2) offrono un'esperienza di distribuzione migliore e più semplice. Gli endpoint supportano scenari di inferenza batch e in tempo reale. Gli endpoint forniscono un'unica interfaccia per richiamare e gestire le distribuzioni di modelli tra i tipi di calcolo. Consultare Che cosa sono gli endpoint di Azure Machine Learning?.

Flusso di lavoro per la distribuzione di un modello

Il flusso di lavoro è simile, indipendentemente da dove si distribuisce il modello:

Registrare il modello.
Preparare uno script di immissione.
Preparare una configurazione di inferenza.
Distribuire il modello in locale per assicurarsi che tutto funzioni correttamente.
Scegliere una destinazione di calcolo.
Distribuire il modello nel cloud.
Testare il servizio Web risultante.

Per altre informazioni sui concetti relativi al flusso di lavoro di distribuzione di Machine Learning, consultare Gestire, distribuire e monitorare modelli con Azure Machine Learning.

Prerequisiti

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Importante

Alcuni comandi dell'interfaccia della riga di comando di Azure in questo articolo usano l'estensione azure-cli-ml, o v1, per Azure Machine Learning. Il supporto per l'interfaccia della riga di comando v1 è terminato il 30 settembre 2025. Microsoft non fornirà più supporto tecnico o aggiornamenti per questo servizio. I flussi di lavoro esistenti che usano l'interfaccia della riga di comando v1 continueranno a funzionare dopo la data di fine del supporto. Tuttavia, potrebbero essere esposti a rischi per la sicurezza o a modifiche di rilievo nel caso di cambiamenti dell'architettura del prodotto.

È consigliabile passare all'estensione ml, o v2, il prima possibile. Per altre informazioni sull'estensione v2, vedere Estensione dell'interfaccia della riga di comando di Azure Machine Learning e Python SDK v2.

Un'area di lavoro di Azure Machine Learning. Per altre informazioni, vedere Creare risorse dell'area di lavoro.
Un modello. Gli esempi in questo articolo usano un modello preaddestrato.
Un computer in grado di eseguire Docker, ad esempio un'istanza di ambiente di calcolo.

Connettersi all'area di lavoro

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Per visualizzare le aree di lavoro a cui si ha accesso, usare i comandi seguenti:

az login
az account set -s <subscription>
az ml workspace list --resource-group=<resource-group>

SI APPLICA A:Azure Machine Learning SDK v1 per Python

from azureml.core import Workspace
ws = Workspace(subscription_id="<subscription_id>",
               resource_group="<resource_group>",
               workspace_name="<workspace_name>")

Per ulteriori informazioni sull'uso dell'SDK per connettersi a un'area di lavoro, consultare la documentazione di Azure Machine Learning SDK per Python.

Registrare il modello

Una situazione tipica per un servizio di Machine Learning distribuito è che siano necessari i componenti seguenti:

Risorse che rappresentano il modello specifico da distribuire (ad esempio un file modello pytorch).
Codice che viene eseguito nel servizio ed esegue il modello su un determinato input.

Azure Machine Learnings consente di dividere la distribuzione in due componenti separati, in modo da poter mantenere lo stesso codice, aggiornando semplicemente il modello. Viene definito il meccanismo in base al quale si carica un modello separatamente dal codice come "registrazione del modello".

Quando si registra un modello, il modello viene caricato nel cloud (nell'account di archiviazione predefinito dell'area di lavoro) e quindi montato nello stesso ambiente di calcolo in cui è in esecuzione il servizio Web.

I seguenti esempi illustrano come registrare un modello.

Importante

È consigliabile usare solo i modelli creati o ottenuti da una fonte attendibile. È consigliabile considerare i modelli serializzati come codice, perché sono state individuate vulnerabilità di sicurezza in molti formati comuni. Inoltre, è possibile che venga intenzionalmente eseguito il training dei modelli con finalità dannose, per fornire un output distorto o inaccurato.

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

I comandi seguenti scaricano un modello per poi registrarlo nell'area di lavoro di Azure Machine Learning:

wget https://aka.ms/bidaf-9-model -O model.onnx --show-progress
az ml model register -n bidaf_onnx \
    -p ./model.onnx \
    -g <resource-group> \
    -w <workspace-name>

Impostare -p sul percorso di una cartella o di un file da registrare.

Per ulteriori informazioni su az ml model register, consultare la documentazione di riferimento.

Registrare un modello da un processo di training di Azure Machine Learning

Se si necessita di registrare un modello creato in precedenza tramite un processo di training di Azure Machine Learning, è possibile specificare l'esperimento, l'esecuzione e il percorso del modello:

az ml model register -n bidaf_onnx --asset-path outputs/model.onnx --experiment-name myexperiment --run-id myrunid --tag area=qna

Il parametro --asset-path fa riferimento alla posizione cloud del modello. In questo esempio viene usato il percorso di un singolo file. Per includere più file nella registrazione del modello, impostare --asset-path sul percorso di una cartella contenente i file.

Per ulteriori informazioni su az ml model register, consultare la documentazione di riferimento.

Registrare un modello da un file locale

È possibile registrare un modello specificando il percorso locale del modello. È possibile specificare il percorso di una cartella o di un singolo file nel computer locale.

import urllib.request
from azureml.core.model import Model

# Download model
urllib.request.urlretrieve("https://aka.ms/bidaf-9-model", "model.onnx")

# Register model
model = Model.register(ws, model_name="bidaf_onnx", model_path="./model.onnx")

Per includere più file nella registrazione del modello, impostare model_path sul percorso di una cartella contenente i file.

Per ulteriori informazioni, consultare la documentazione per la Classe del modello.

Registrare un modello da un processo di training di Azure Machine Learning

Quando si usa l'SDK per eseguire il training di un modello, è possibile ricevere un oggetto Run o un oggetto AutoMLRun, a seconda di come sia stato eseguito il training del modello. Ciascun oggetto può essere usato per registrare un modello creato da un'esecuzione dell'esperimento.

Registrare un modello da un oggetto azureml.core.Run:

SI APPLICA A:Azure Machine Learning SDK v1 per Python
```
model = run.register_model(model_name='bidaf_onnx',
                           tags={'area': 'qna'},
                           model_path='outputs/model.onnx')
print(model.name, model.id, model.version, sep='\t')
```
Il parametro model_path fa riferimento alla posizione cloud del modello. In questo esempio viene usato il percorso di un singolo file. Per includere più file nella registrazione del modello, impostare model_path sul percorso di una cartella contenente i file. Per ulteriori informazioni, consultare la documentazione di Run.register_model.
Registrare un modello da un oggetto azureml.train.automl.run.AutoMLRun:

SI APPLICA A:Azure Machine Learning SDK v1 per Python
```
description = 'My AutoML Model'
model = run.register_model(description = description,
                            tags={'area': 'qna'})

print(run.model_id)
```
In questo esempio i metric parametri e iteration non vengono specificati, quindi l'iterazione con la metrica primaria migliore viene registrata. Il valore model_id restituito dall'esecuzione viene usato al posto di un nome modello.

Per ulteriori informazioni, consultare la documentazione di AutoMLRun.register_model.

Per distribuire un modello registrato da un oggetto AutoMLRun, è consigliabile farlo tramite il pulsante di distribuzione one-select nello Studio di Azure Machine Learning.

Nota

È anche possibile registrare un modello da un file locale tramite il portale dell'interfaccia utente dell'area di lavoro.

Attualmente, nell'interfaccia utente sono disponibili due opzioni per caricare un file modello locale:

Da file locali, che registra un modello v2.
Da file locali (basati sul framework) che registra un modello v1.

Solo i modelli registrati tramite l'ingresso Da file locali (basati sul framework) (noti come modelli v1) possono essere distribuiti come servizi Web usando SDKv1/CLIv1.

Definire uno script di immissione fittizio

Lo script di avvio riceve i dati inviati a un servizio Web distribuito e li passa al modello. Restituisce quindi la risposta del modello al client. Lo script è specifico al modello. Lo script di immissione deve riconoscere i dati previsti e restituiti dal modello.

Le due operazioni da eseguire nello script di immissione sono le seguenti:

Caricamento del modello (usando una funzione denominata init())
Esecuzione del modello sui dati di input (usando una funzione denominata run())

Per la distribuzione iniziale, usare uno script di immissione fittizio che stampa i dati ricevuti.

import json


def init():
    print("This is init")


def run(data):
    test = json.loads(data)
    print(f"received data {test}")
    return f"test is {test}"

Salvare il file come echo_score.py all'interno di una directory denominata source_dir. Questo script fittizio restituisce i dati inviati, quindi non usa il modello. Tuttavia, è utile per testare che lo script di assegnazione dei punteggi sia in esecuzione.

Definire una configurazione di inferenza

Una configurazione di inferenza descrive i file e il contenitore Docker da usare durante l'inizializzazione del servizio Web. Tutti i file all'interno della directory di origine, incluse le sottodirectory, vengono compressi e caricati nel cloud quando si distribuisce il servizio Web.

La configurazione di inferenza seguente specifica che la distribuzione di Machine Learning usa il file echo_score.py nella ./source_dir directory per elaborare le richieste in ingresso e che usa l'immagine Docker con i pacchetti Python specificati nell'ambiente project_environment .

È possibile usare qualsiasi ambiente di inferenza di Azure Machine Learning curato come immagine Docker di base durante la creazione dell'ambiente di progetto. Le dipendenze necessarie vengono installate nella parte superiore. L'immagine Docker risultante viene archiviata nel repository associato all'area di lavoro.

Nota

Il caricamento della directory di origine di inferenza di Azure Machine Learning non tiene conto di .gitignore o .amlignore

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Una configurazione di inferenza minima può essere scritta come segue:

{
    "entryScript": "echo_score.py",
    "sourceDirectory": "./source_dir",
    "environment": {
        "docker": {
            "arguments": [],
            "baseDockerfile": null,
            "baseImage": "mcr.microsoft.com/azureml/openmpi3.1.2-ubuntu18.04",
            "enabled": false,
            "sharedVolumes": true,
            "shmSize": null
        },
        "environmentVariables": {
            "EXAMPLE_ENV_VAR": "EXAMPLE_VALUE"
        },
        "name": "my-deploy-env",
        "python": {
            "baseCondaEnvironment": null,
            "condaDependencies": {
                "channels": [],
                "dependencies": [
                    "python=3.6.2",
                    {
                        "pip": [
                            "azureml-defaults"
                        ]
                    }
                ],
                "name": "project_environment"
            },
            "condaDependenciesFile": null,
            "interpreterPath": "python",
            "userManagedDependencies": false
        },
        "version": "1"
    }
}

Salvare il file con il nome dummyinferenceconfig.json.

Per una descrizione più approfondita delle configurazioni di inferenza, vedere questo articolo.

Nell'esempio seguente viene illustrato come creare un ambiente minimo senza dipendenze pip, usando lo script di assegnazione dei punteggi fittizi definito in precedenza.

from azureml.core import Environment
from azureml.core.model import InferenceConfig

env = Environment(name="project_environment")
dummy_inference_config = InferenceConfig(
    environment=env,
    source_directory="./source_dir",
    entry_script="./echo_score.py",
)

Per ulteriori informazioni sugli ambienti, vedere Creare e gestire ambienti per il training e la distribuzione.

Per ulteriori informazioni sulla configurazione dell'inferenza, consultare la documentazione della classe InferenceConfig.

Definire una configurazione di distribuzione

Una configurazione di distribuzione specifica la quantità di memoria e core necessari per l'esecuzione del servizio Web. Inoltre, fornisce i dettagli di configurazione del servizio Web sottostante. Ad esempio, una configurazione di distribuzione consente di specificare che il servizio richiede 2 gigabyte di memoria, 2 core CPU, 1 core GPU e abilita la scalabilità automatica.

Le opzioni disponibili per una configurazione di distribuzione variano a seconda della destinazione di calcolo scelta. In una distribuzione locale, è possibile specificare solo la porta in cui viene gestito il servizio Web.

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Le voci del documento deploymentconfig.json vengono mappate ai parametri per LocalWebservice.deploy_configuration. La tabella seguente descrive il mapping tra le entità nel documento JSON e i parametri per il metodo:

Entità JSON	Parametro per il metodo	Descrizione
`computeType`	ND	La destinazione di calcolo. Per le destinazioni locali, il valore deve essere `local`.
`port`	`port`	La porta locale su cui esporre l'endpoint HTTP del servizio.

Il codice JSON seguente è un esempio di configurazione della distribuzione da usare con l'interfaccia della riga di comando:

{
    "computeType": "local",
    "port": 32267
}

Salvare il codice JSON come file denominato deploymentconfig.json.

Per ulteriori informazioni, consultare lo schema di distribuzione.

Il seguente codice Python illustra come creare una configurazione di distribuzione locale:

from azureml.core.webservice import LocalWebservice

deployment_config = LocalWebservice.deploy_configuration(port=6789)

Distribuire il modello di Machine Learning

Sei pronto a implementare il tuo modello.

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Sostituire bidaf_onnx:1 con il nome del modello e il relativo numero di versione.

az ml model deploy -n myservice \
    -m bidaf_onnx:1 \
    --overwrite \
    --ic dummyinferenceconfig.json \
    --dc deploymentconfig.json \
    -g <resource-group> \
    -w <workspace-name>

service = Model.deploy(
    ws,
    "myservice",
    [model],
    dummy_inference_config,
    deployment_config,
    overwrite=True,
)
service.wait_for_deployment(show_output=True)

print(service.get_logs())

Per ulteriori informazioni, consultare la documentazione per Model.deploy() e Webservice.

Chiamare il modello

Verificare che il modello echo sia stato distribuito correttamente. Dovrebbe essere possibile eseguire una richiesta di attività e una richiesta di punteggio:

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

curl -v http://localhost:32267
curl -v -X POST -H "content-type:application/json" \
    -d '{"query": "What color is the fox", "context": "The quick brown fox jumped over the lazy dog."}' \
    http://localhost:32267/score

import requests
import json

uri = service.scoring_uri
requests.get("http://localhost:6789")
headers = {"Content-Type": "application/json"}
data = {
    "query": "What color is the fox",
    "context": "The quick brown fox jumped over the lazy dog.",
}
data = json.dumps(data)
response = requests.post(uri, data=data, headers=headers)
print(response.json())

Definire uno script di immissione

È ora possibile caricare il modello. Prima di tutto, modificare lo script di immissione:

import json
import numpy as np
import os
import onnxruntime
from nltk import word_tokenize
import nltk


def init():
    nltk.download("punkt")
    global sess
    sess = onnxruntime.InferenceSession(
        os.path.join(os.getenv("AZUREML_MODEL_DIR"), "model.onnx")
    )


def run(request):
    print(request)
    text = json.loads(request)
    qw, qc = preprocess(text["query"])
    cw, cc = preprocess(text["context"])

    # Run inference
    test = sess.run(
        None,
        {"query_word": qw, "query_char": qc, "context_word": cw, "context_char": cc},
    )
    start = np.asscalar(test[0])
    end = np.asscalar(test[1])
    ans = [w for w in cw[start : end + 1].reshape(-1)]
    print(ans)
    return ans


def preprocess(word):
    tokens = word_tokenize(word)

    # split into lower-case word tokens, in numpy array with shape of (seq, 1)
    words = np.asarray([w.lower() for w in tokens]).reshape(-1, 1)

    # split words into chars, in numpy array with shape of (seq, 1, 1, 16)
    chars = [[c for c in t][:16] for t in tokens]
    chars = [cs + [""] * (16 - len(cs)) for cs in chars]
    chars = np.asarray(chars).reshape(-1, 1, 1, 16)
    return words, chars

Salvare il file come score.py all'interno di source_dir.

Notare l'uso della AZUREML_MODEL_DIR variabile di ambiente per individuare il modello registrato. Ora che sono stati aggiunti alcuni pacchetti pip.

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

{
    "entryScript": "score.py",
    "sourceDirectory": "./source_dir",
    "environment": {
        "docker": {
            "arguments": [],
            "baseDockerfile": null,
            "baseImage": "mcr.microsoft.com/azureml/openmpi3.1.2-ubuntu18.04",
            "enabled": false,
            "sharedVolumes": true,
            "shmSize": null
        },
        "environmentVariables": {
            "EXAMPLE_ENV_VAR": "EXAMPLE_VALUE"
        },
        "name": "my-deploy-env",
        "python": {
            "baseCondaEnvironment": null,
            "condaDependencies": {
                "channels": [],
                "dependencies": [
                    "python=3.6.2",
                    {
                        "pip": [
                            "azureml-defaults",
                            "nltk",
                            "numpy",
                            "onnxruntime"
                        ]
                    }
                ],
                "name": "project_environment"
            },
            "condaDependenciesFile": null,
            "interpreterPath": "python",
            "userManagedDependencies": false
        },
        "version": "2"
    }
}

Salvare il file con nome inferenceconfig.json

SI APPLICA A:Azure Machine Learning SDK v1 per Python

env = Environment(name='myenv')
python_packages = ['nltk', 'numpy', 'onnxruntime']
for package in python_packages:
    env.python.conda_dependencies.add_pip_package(package)

inference_config = InferenceConfig(environment=env, source_directory='./source_dir', entry_script='./score.py')

Per altre informazioni, consultare la documentazione relativa a LocalWebservice, Model.deploy() e Webservice.

Effettuare nuovamente la distribuzione e chiamare il servizio

Effettuare nuovamente la distribuzione del servizio:

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Sostituire bidaf_onnx:1 con il nome del modello e il relativo numero di versione.

az ml model deploy -n myservice \
    -m bidaf_onnx:1 \
    --overwrite \
    --ic inferenceconfig.json \
    --dc deploymentconfig.json \
    -g <resource-group> \
    -w <workspace-name>

service = Model.deploy(
    ws,
    "myservice",
    [model],
    inference_config,
    deployment_config,
    overwrite=True,
)
service.wait_for_deployment(show_output=True)

print(service.get_logs())

Per ulteriori informazioni, consultare la documentazione per Model.deploy() e Webservice.

Assicurarsi quindi di poter inviare una richiesta post al servizio:

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

curl -v -X POST -H "content-type:application/json" \
    -d '{"query": "What color is the fox", "context": "The quick brown fox jumped over the lazy dog."}' \
    http://localhost:32267/score

import requests

uri = service.scoring_uri

headers = {"Content-Type": "application/json"}
data = {
    "query": "What color is the fox",
    "context": "The quick brown fox jumped over the lazy dog.",
}
data = json.dumps(data)
response = requests.post(uri, data=data, headers=headers)
print(response.json())

Scegliere una destinazione di calcolo

La destinazione di calcolo usata per ospitare il modello influisce sul costo e sulla disponibilità dell'endpoint distribuito. Usare questa tabella per scegliere una destinazione di calcolo appropriata.

Destinazione di calcolo	Utilizzo	Supporto GPU	Descrizione
Servizio Web locale	Test/debug		Usare per attività limitate di test e risoluzione dei problemi. L'accelerazione hardware dipende dall'uso di librerie nel sistema locale.
Azure Machine Learning Kubernetes	Inferenza in tempo reale	Sì	Eseguire carichi di lavoro di inferenza nel cloud.
Istanze di Azure Container	Inferenza in tempo reale Consigliato solo per scopi di sviluppo/test.		Usare per carichi di lavoro basati su CPU su scala ridotta che richiedono meno di 48 GB di RAM. Non richiede la gestione di un cluster. Adatto solo per i modelli di dimensioni inferiori a 1 GB. Supportato nella finestra di progettazione.

Nota

Per la scelta dello SKU di un cluster, eseguire prima lo scale up e poi lo scale out. Iniziare con un computer dotato del 150% della RAM richiesta dal modello, profilare il risultato e trovare un computer con le prestazioni necessarie. Dopo aver appreso questo, aumentare il numero di computer in base alla necessità di inferenza simultanea.

Nota

Distribuire nel cloud

Dopo aver confermato che il servizio funziona in locale e aver scelto una destinazione di calcolo remota, si è pronti per la distribuzione nel cloud.

Modificare la configurazione di distribuzione in modo che corrisponda alla destinazione di calcolo scelta, in questo caso Istanze di Azure Container:

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Le opzioni disponibili per una configurazione di distribuzione variano a seconda della destinazione di calcolo scelta.

{
    "computeType": "aci",
    "containerResourceRequirements":
    {
        "cpu": 0.5,
        "memoryInGB": 1.0
    },
    "authEnabled": true,
    "sslEnabled": false,
    "appInsightsEnabled": false
}

Salvare il file come re-deploymentconfig.json.

Per ulteriori informazioni, consultare questa guida di riferimento.

from azureml.core.webservice import AciWebservice

deployment_config = AciWebservice.deploy_configuration(
    cpu_cores=0.5, memory_gb=1, auth_enabled=True
)

Effettuare nuovamente la distribuzione del servizio:

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

Sostituire bidaf_onnx:1 con il nome del modello e il relativo numero di versione.

az ml model deploy -n myservice \
    -m bidaf_onnx:1 \
    --overwrite \
    --ic inferenceconfig.json \
    --dc re-deploymentconfig.json \
    -g <resource-group> \
    -w <workspace-name>

Per visualizzare i log del servizio, usare il comando seguente:

az ml service get-logs -n myservice \
    -g <resource-group> \
    -w <workspace-name>

service = Model.deploy(
    ws,
    "myservice",
    [model],
    inference_config,
    deployment_config,
    overwrite=True,
)
service.wait_for_deployment(show_output=True)

print(service.get_logs())

Per ulteriori informazioni, consultare la documentazione per Model.deploy() e Webservice.

Chiamare il servizio Web remoto

Quando si distribuisce in remoto, potrebbe essere abilitata l'autenticazione con chiave. L'esempio seguente illustra come ottenere la chiave del servizio con Python per effettuare una richiesta di inferenza.

import requests
import json
from azureml.core import Webservice

service = Webservice(workspace=ws, name="myservice")
scoring_uri = service.scoring_uri

# If the service is authenticated, set the key or token
key, _ = service.get_keys()

# Set the appropriate headers
headers = {"Content-Type": "application/json"}
headers["Authorization"] = f"Bearer {key}"

# Make the request and display the response and logs
data = {
    "query": "What color is the fox",
    "context": "The quick brown fox jumped over the lazy dog.",
}
data = json.dumps(data)
resp = requests.post(scoring_uri, data=data, headers=headers)
print(resp.text)

print(service.get_logs())

Consultare l'articolo sulle applicazioni client per l'utilizzo di servizi Web per altri client di esempio in altre lingue.

Come configurare i messaggi di posta elettronica in Studio

Per iniziare a ricevere messaggi di posta elettronica quando il processo, l'endpoint online o l'endpoint batch sono stati completati o se si verifica un problema (non riuscito, annullato), seguire questa procedura:

In studio di Azure ML, passare alle impostazioni selezionando l'icona ingranaggio.
Selezionare la scheda Notifiche Email.
Abilitare o disabilitare le notifiche e-mail per un evento specifico.

Screenshot delle impostazioni di studio di ML nella scheda delle notifiche tramite e-mail.

Informazioni sullo stato del servizio

Durante la distribuzione del modello, è possibile che lo stato del servizio cambi prima del completamento della distribuzione.

La seguente tabella descrive i diversi stati del servizio:

Stato del servizio Web	Descrizione	Stato finale?
Transizione	Il servizio è in fase di distribuzione.	NO
Non salutare	Il servizio è stato distribuito ma non è attualmente raggiungibile.	NO
Non pianificabile	Il servizio non può essere distribuito in questo momento a causa della mancanza di risorse.	NO
Operazione non riuscita	Il servizio non è riuscito a eseguire la distribuzione a causa di un errore o di un arresto anomalo.	Sì
Sano	Il servizio è integro e l'endpoint è disponibile.	Sì

Suggerimento

Durante la distribuzione, le immagini Docker per le destinazioni di calcolo vengono compilate e caricate dal Registro Azure Container (ACR). Per impostazione predefinita, Azure Machine Learning crea un ACR che usa il livello di servizio base. La modifica di ACR per l'area di lavoro al livello Standard o Premium può ridurre il tempo necessario per la compilazione e distribuzione delle immagini nelle destinazioni di calcolo. Per altre informazioni, vedere Livelli di servizio di Registro Azure Container.

Nota

Se si distribuisce un modello nel servizio Azure Kubernetes, è consigliabile abilitare Monitoraggio di Azure per tale cluster. Ciò consente di comprendere l'integrità complessiva del cluster e l'utilizzo delle risorse. Potrebbero essere utili anche le risorse seguenti:

Se si sta provando a distribuire un modello in un cluster non integro o in overload, si prevede che si verifichino problemi. Per informazioni sulla risoluzione dei problemi del cluster del servizio Azure Kubernetes, contattare il supporto del servizio Azure Kubernetes.

Eliminare risorse

Interfaccia della riga di comando di Azure
Python SDK

SI APPLICA A:estensione ML dell'interfaccia della riga di comando di Azure v1

# Get the current model id
import os

stream = os.popen(
    'az ml model list --model-name=bidaf_onnx --latest --query "[0].id" -o tsv'
)
MODEL_ID = stream.read()[0:-1]
MODEL_ID

az ml service delete -n myservice
az ml service delete -n myaciservice
az ml model delete --model-id=<MODEL_ID>

Per eliminare un servizio Web distribuito, usare az ml service delete <name of webservice>.

Per eliminare un modello registrato dall'area di lavoro, usare az ml model delete <model id>

Altre informazioni sull'eliminazione di un servizio Web e sull'eliminazione di un modello.

service.delete()
model.delete()

Per eliminare un servizio Web distribuito, usare service.delete(). Per eliminare un modello registrato, usare model.delete().

Per altre informazioni, vedere la documentazione per Webservice.delete() e Model.delete().

Passaggi successivi

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-10-30

Condividi tramite

Distribuire modelli di Machine Learning in Azure

Flusso di lavoro per la distribuzione di un modello

Prerequisiti

Connettersi all'area di lavoro

Registrare il modello

Registrare un modello da un processo di training di Azure Machine Learning

Definire uno script di immissione fittizio

Definire una configurazione di inferenza

Definire una configurazione di distribuzione

Distribuire il modello di Machine Learning

Chiamare il modello

Definire uno script di immissione

Effettuare nuovamente la distribuzione e chiamare il servizio

Scegliere una destinazione di calcolo

Distribuire nel cloud

Chiamare il servizio Web remoto

Come configurare i messaggi di posta elettronica in Studio

Informazioni sullo stato del servizio

Eliminare risorse

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive