UTF8Encoding.GetEncoder Метод

Определение

Получает кодировщик, который преобразует последовательность символов Юникода в кодировке UTF-8 в байтах.

public:
 override System::Text::Encoder ^ GetEncoder();
public override System.Text.Encoder GetEncoder();
override this.GetEncoder : unit -> System.Text.Encoder
Public Overrides Function GetEncoder () As Encoder

Возвращаемое значение

Объект, Encoder который преобразует последовательность символов Юникода в последовательность байтов в кодировке UTF-8.

Примеры

В следующем примере метод используется GetEncoder для получения кодировщика для преобразования последовательности символов в последовательность байтов в кодировке UTF-8.

using System;
using System.Text;

class UTF8EncodingExample {
    public static void Main() {
        Char[] chars = new Char[] {'a', 'b', 'c', '\u0300', '\ua0a0'};
        Byte[] bytes;

        Encoder utf8Encoder = Encoding.UTF8.GetEncoder();

        int byteCount = utf8Encoder.GetByteCount(chars, 2, 3, true);
        bytes = new Byte[byteCount];
        int bytesEncodedCount = utf8Encoder.GetBytes(chars, 2, 3, bytes, 0, true);

        Console.WriteLine(
            "{0} bytes used to encode characters.", bytesEncodedCount
        );

        Console.Write("Encoded bytes: ");
        foreach (Byte b in bytes) {
            Console.Write("[{0}]", b);
        }
        Console.WriteLine();
    }
}
Imports System.Text
Imports Microsoft.VisualBasic.Strings

Class UTF8EncodingExample
    
    Public Shared Sub Main()
        'Characters:
        ' ChrW(97) = a
        ' ChrW(98) = b
        ' ChrW(99) = c
        ' ChrW(768) = `
        ' ChrW(41120) = valid unicode code point, but not a character
        Dim chars() As Char = {ChrW(97), ChrW(98), ChrW(99), ChrW(768), ChrW(41120)}
        Dim bytes() As Byte
        
        Dim utf8Encoder As Encoder = Encoding.UTF8.GetEncoder()
        
        Dim byteCount As Integer = utf8Encoder.GetByteCount(chars, 2, 3, True)
        bytes = New Byte(byteCount - 1) {}
        Dim bytesEncodedCount As Integer = utf8Encoder.GetBytes( _
            chars, 2, 3, bytes, 0, True _
        )
        
        Console.WriteLine("{0} bytes used to encode characters.", bytesEncodedCount)
        
        Console.Write("Encoded bytes: ")
        Dim b As Byte
        For Each b In  bytes
            Console.Write("[{0}]", b)
        Next b
        Console.WriteLine()
    End Sub
End Class

Комментарии

Метод Encoder.GetBytes преобразует последовательные блоки символов в последовательные блоки байтов таким образом, как GetBytes и метод. Однако между вызовами сохраняется информация о состоянии, Encoder поэтому она может правильно кодировать последовательности символов, охватывающие блоки. Он Encoder также сохраняет конечные символы в конце блоков данных и использует конечные символы в следующей операции кодирования. Например, блок данных может завершиться несоответствующим высоким суррогатом, и соответствующий низкий суррогат может находиться в следующем блоке данных. Таким образом, GetDecoder и GetEncoder они полезны для сетевых операций передачи и файлов, так как эти операции часто имеют дело с блоками данных вместо полного потока данных.

Если включено обнаружение ошибок, то throwOnInvalidCharacters есть параметр конструктора имеет trueзначение, обнаружение ошибок также включено в Encoder возвращаемом этим методом. Если обнаружена ошибка и обнаружена недопустимая последовательность, состояние кодировщика не определено и обработка должна остановиться.

Применяется к

См. также раздел