Condividi tramite


Panoramica sulla deduplicazione dei dati

Che cos’è la deduplicazione dei dati?

La deduplicazione dei dati, spesso chiamata "dedupe" in breve, è una funzione che può aiutare a ridurre l'impatto dei dati ridondanti sui costi di archiviazione. Quando è abilitata, la deduplicazione dei dati consente di ottimizzare lo spazio disponibile in un volume cercando parti duplicate nel volume stesso. Le parti duplicate del set di dati del volume vengono archiviate una sola volta e, facoltativamente, possono essere compresse per ottenere un risparmio di spazio aggiuntivo. La deduplicazione dei dati consente di ottimizzare le ridondanze senza compromettere la fedeltà o l'integrità dei dati. Altre informazioni su come funziona la deduplicazione dei dati sono disponibili in "Come funziona la deduplicazione dei dati?" sezione della pagina Informazioni sulla deduplicazione dei dati .

Important

KB4025334 contains a roll up of fixes for Data Deduplication, including important reliability fixes, and we strongly recommend installing it when using Data Deduplication with Windows Server 2016 and Windows Server 2019.

Perché è utile la deduplicazione dei dati?

La deduplicazione dei dati consente agli amministratori di archiviazione di ridurre i costi associati alla duplicazione dei dati. Large datasets often have a lot of duplication, which increases the costs of storing the data. For example:

  • Le condivisioni file utente possono contenere molte copie dello stesso file o di file simili.
  • I guest di virtualizzazione possono essere quasi identici da una macchina virtuale a un'altra.
  • Gli snapshot di backup possono presentare differenze trascurabili tra un backup giornaliero e un altro.

Il risparmio di spazio ottenibile con la deduplicazione dei dati dipende dal set di dati o dal carico di lavoro del volume. I set di dati con duplicazione elevata potrebbero registrare percentuali di ottimizzazione fino al 95% o una riduzione di 20 volte dell'uso dello spazio di archiviazione. Nella tabella seguente sono illustrati i vantaggi in termini di risparmio di spazio offerti dalla deduplicazione per vari tipi di contenuto:

Scenario Content Risparmio di spazio tipico
User documents Documenti aziendali, foto, musica, video e così via 30-50%
Deployment shares File binari del software, file CAB, simboli e altro 70-80%
Virtualization libraries File ISO, file disco rigido virtuale e così via 80-95%
Condivisione generale di file Tutte le opzioni sopra 50-60%

Note

Se vuoi semplicemente liberare spazio su un volume, è consigliabile usare Sincronizzazione file di Azure con il tiering del cloud abilitato. Questa soluzione consente di memorizzare nella cache i file a cui si accede più di frequente in locale e di archiviare i file a cui si accede più raramente in livelli nel cloud, risparmiando spazio di archiviazione locale e garantendo al tempo stesso le prestazioni. Per informazioni dettagliate, vedere Pianificazione di una distribuzione di Sincronizzazione file di Azure.

Quando è possibile usare la deduplicazione dei dati?

Scenario illustration Description
Illustrazione dei file server. File server per utilizzo generico: i file server per utilizzo generico sono file server che possono contenere uno dei tipi di condivisioni seguenti:
  • Team shares
  • Cartelle home utente
  • Work folders
  • Quote di sviluppo software
I file server per utilizzo generico sono buoni candidati per la deduplicazione dei dati, vista la tendenza degli utenti ad avere molte copie o versioni dello stesso file. Le condivisioni di sviluppo software possono trarre molti vantaggi dalla deduplicazione perché molti file binari restano sostanzialmente invariati da una build all'altra.
Illustrazione dei server VDI. Distribuzioni VDI (Virtual Desktop Infrastructure): i server VDI, ad esempio Servizi Desktop remoto, offrono alle organizzazioni un'opzione leggera per il provisioning di desktop agli utenti. Esistono molti motivi per cui le organizzazioni si affidano a questa tecnologia:
  • Application deployment: You can quickly deploy applications across your enterprise. Ciò è molto utile quando si hanno applicazioni che vengono aggiornate di frequente, usate raramente o difficili da gestire.
  • Application consolidation: When you install and run applications from a set of centrally managed virtual machines, you eliminate the need to update applications on client computers. Questa opzione riduce anche la quantità di larghezza di banda necessaria per accedere alle applicazioni.
  • Remote Access: Users can access enterprise applications from devices such as home computers, kiosks, low-powered hardware, and operating systems other than Windows.
  • Accesso alle succursali: le distribuzioni VDI possono offrire prestazioni migliori delle applicazioni per i lavoratori delle succursali che devono accedere agli archivi dati centralizzati. Le applicazioni a elevato uso di dati talvolta non hanno protocolli client/server ottimizzati per connessioni a bassa velocità.
Le distribuzioni VDI sono ottime candidate per la deduplicazione dei dati perché i dischi rigidi virtuali che consentono il funzionamento dei desktop remoti per gli utenti sono essenzialmente identici. Inoltre, la Deduplicazione dei dati può essere utile con il cosiddetto storm di avvio VDI, che è il calo delle prestazioni di archiviazione quando molti utenti si connettono simultaneamente ai propri desktop per iniziare la giornata.
Illustrazione delle applicazioni di backup. Le destinazioni di backup, ad esempio le applicazioni di backup virtualizzate: le applicazioni di backup, ad esempio Microsoft Data Protection Manager (DPM), sono ottimi candidati per la deduplicazione dei dati a causa della duplicazione significativa tra gli snapshot di backup.
Illustrazione di altri carichi di lavoro. Other workloads: Other workloads may also be excellent candidates for Data Deduplication.