Поделиться через


IdnMapping.GetAscii Метод

Определение

Кодирует строку меток доменных имен, включающих символы Юникода за пределами диапазона символов US-ASCII в строку отображаемых символов Юникода в диапазоне символов US-ASCII (U+0020 до U+007E). Строка форматируется в соответствии со стандартом IDNA.

Перегрузки

Имя Описание
GetAscii(String)

Кодирует строку меток доменных имен, состоящих из символов Юникода, в строку отображаемых символов Юникода в диапазоне символов US-ASCII символов. Строка форматируется в соответствии со стандартом IDNA.

GetAscii(String, Int32)

Кодирует подстроку меток доменных имен, включающих символы Юникода за пределами диапазона символов US-ASCII. Подстрока преобразуется в строку отображаемых символов Юникода в диапазоне символов US-ASCII и форматируется в соответствии со стандартом IDNA.

GetAscii(String, Int32, Int32)

Кодирует указанное количество символов в подстроке меток доменных имен, включающих символы Юникода за пределами диапазона символов US-ASCII. Подстрока преобразуется в строку отображаемых символов Юникода в диапазоне символов US-ASCII и форматируется в соответствии со стандартом IDNA.

GetAscii(String)

Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs

Кодирует строку меток доменных имен, состоящих из символов Юникода, в строку отображаемых символов Юникода в диапазоне символов US-ASCII символов. Строка форматируется в соответствии со стандартом IDNA.

public:
 System::String ^ GetAscii(System::String ^ unicode);
public string GetAscii(string unicode);
member this.GetAscii : string -> string
Public Function GetAscii (unicode As String) As String

Параметры

unicode
String

Строка для преобразования, состоящая из одной или нескольких меток доменных имен, разделенных разделителями меток.

Возвращаемое значение

Эквивалент строки, указанной unicode параметром, состоящий из отображаемых символов Юникода в диапазоне символов US-ASCII (U+0020 до U+007E) и отформатирован в соответствии со стандартом IDNA.

Исключения

unicode равно null.

unicode является недопустимым AllowUnassigned в зависимости от свойств и UseStd3AsciiRules стандарта IDNA.

Примеры

В следующем примере метод используется GetAscii(String) для преобразования массива международных доменных имен в Punycode, который представляет собой эквивалент, состоящий из символов в диапазоне символов US-ASCII. Затем GetUnicode(String) метод преобразует доменное имя Punycode обратно в исходное доменное имя, но заменяет исходные разделители меток стандартным разделителем меток.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      string[] names = { "bücher.com", "мойдомен.рф", "παράδειγμα.δοκιμή",
                         "mycharity\u3002org",
                         "prose\u0000ware.com", "proseware..com", "a.org",
                         "my_company.com" };
      IdnMapping idn = new IdnMapping();

      foreach (var name in names) {
         try {
            string punyCode = idn.GetAscii(name);
            string name2 = idn.GetUnicode(punyCode);
            Console.WriteLine("{0} --> {1} --> {2}", name, punyCode, name2);
            Console.WriteLine("Original: {0}", ShowCodePoints(name));
            Console.WriteLine("Restored: {0}", ShowCodePoints(name2));
         }
         catch (ArgumentException) {
            Console.WriteLine("{0} is not a valid domain name.", name);
         }
         Console.WriteLine();
      }
   }

   private static string ShowCodePoints(string str1)
   {
      string output = "";
      foreach (var ch in str1)
         output += $"U+{(ushort)ch:X4} ";

      return output;
   }
}
// The example displays the following output:
//    bücher.com --> xn--bcher-kva.com --> bücher.com
//    Original: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
//    Restored: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
//
//    мойдомен.рф --> xn--d1acklchcc.xn--p1ai --> мойдомен.рф
//    Original: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
//    Restored: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
//
//    παράδειγμα.δοκιμή --> xn--hxajbheg2az3al.xn--jxalpdlp --> παράδειγμα.δοκιμή
//    Original: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
//    Restored: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
//
//    mycharity。org --> mycharity.org --> mycharity.org
//    Original: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+3002 U+006F U+0072 U+0067
//    Restored: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+002E U+006F U+0072 U+0067
//
//    prose ware.com is not a valid domain name.
//
//    proseware..com is not a valid domain name.
//
//    a.org --> a.org --> a.org
//    Original: U+0061 U+002E U+006F U+0072 U+0067
//    Restored: U+0061 U+002E U+006F U+0072 U+0067
//
//    my_company.com --> my_company.com --> my_company.com
//    Original: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D
//    Restored: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim names() As String = { "bücher.com", "мойдомен.рф", "παράδειγμα.δοκιμή",
                                "mycharity" + ChrW(&h3002) + "org",
                                "prose" + ChrW(0) + "ware.com", "proseware..com", "a.org", 
                                "my_company.com" }
      Dim idn As New IdnMapping()
      
      For Each name In names
         Try
            Dim punyCode As String = idn.GetAscii(name)
            Dim name2 As String = idn.GetUnicode(punyCode)
            Console.WriteLine("{0} --> {1} --> {2}", name, punyCode, name2) 
            Console.WriteLine("Original: {0}", ShowCodePoints(name))
            Console.WriteLine("Restored: {0}", ShowCodePoints(name2))
         Catch e As ArgumentException 
            Console.WriteLine("{0} is not a valid domain name.", name)
         End Try
         Console.WriteLine()
      Next   
   End Sub
   
   Private Function ShowCodePoints(str1 As String) As String
      Dim output As String = ""
      For Each ch In str1
         output += String.Format("U+{0} ", Convert.ToUInt16(ch).ToString("X4"))
      Next
      Return output
   End Function
End Module
' The example displays the following output:
'    bücher.com --> xn--bcher-kva.com --> bücher.com
'    Original: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
'    Restored: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
'    
'    мойдомен.рф --> xn--d1acklchcc.xn--p1ai --> мойдомен.рф
'    Original: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
'    Restored: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
'    
'    παράδειγμα.δοκιμή --> xn--hxajbheg2az3al.xn--jxalpdlp --> παράδειγμα.δοκιμή
'    Original: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
'    Restored: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
'    
'    mycharity。org --> mycharity.org --> mycharity.org
'    Original: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+3002 U+006F U+0072 U+0067
'    Restored: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+002E U+006F U+0072 U+0067
'    
'    prose ware.com is not a valid domain name.
'    
'    proseware..com is not a valid domain name.
'    
'    a.org --> a.org --> a.org
'    Original: U+0061 U+002E U+006F U+0072 U+0067
'    Restored: U+0061 U+002E U+006F U+0072 U+0067
'    
'    my_company.com --> my_company.com --> my_company.com
'    Original: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D
'    Restored: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D

Комментарии

Параметр unicode задает строку одной или нескольких меток, состоящих из допустимых символов Юникода. Метки разделяются разделителями меток. Параметр unicode не может начинаться с разделителя меток, но он может включать и при необходимости заканчиваться разделителем. Разделители меток — FULL STOP (период, U+002E), IDEOGRAPHIC FULL STOP (U+3002), FULLWIDTH FULL STOP (U+FF0E) и HALFWIDTH IDEOGRAPHIC FULL STOP (U+FF61). Например, доменное имя "www.adatum.com" состоит из меток, "www", "adatum" и "com", разделенных периодами.

Метка не может содержать один из следующих символов:

Метод GetAscii преобразует все разделители меток в FULL STOP (период, U+002E).

Если unicode нет символов за пределами диапазона символов US-ASCII и нет символов в диапазоне символов US-ASCII запрещено, метод возвращает unicode без изменений.

Примечания для тех, кто вызывает этот метод

В .NET Framework 4.5 IdnMapping класс поддерживает разные версии стандарта IDNA в зависимости от используемой операционной системы:

См. раздел "Технический стандарт Юникода" #46. Обработка совместимости IDNA для различий в том, как эти стандарты обрабатывают определенные наборы символов.

Применяется к

GetAscii(String, Int32)

Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs

Кодирует подстроку меток доменных имен, включающих символы Юникода за пределами диапазона символов US-ASCII. Подстрока преобразуется в строку отображаемых символов Юникода в диапазоне символов US-ASCII и форматируется в соответствии со стандартом IDNA.

public:
 System::String ^ GetAscii(System::String ^ unicode, int index);
public string GetAscii(string unicode, int index);
member this.GetAscii : string * int -> string
Public Function GetAscii (unicode As String, index As Integer) As String

Параметры

unicode
String

Строка для преобразования, состоящая из одной или нескольких меток доменных имен, разделенных разделителями меток.

index
Int32

Отсчитываемое от нуля смещение unicode , указывающее начало подстроки для преобразования. Операция преобразования продолжается до конца unicode строки.

Возвращаемое значение

Эквивалент подстроки, указанной параметром unicode и index параметрами, состоящим из отображаемых символов Юникода в диапазоне символов US-ASCII (U+0020 до U+007E) и отформатирован в соответствии со стандартом IDNA.

Исключения

unicode равно null.

index меньше нуля.

–или–

index больше длины unicode.

unicode является недопустимым AllowUnassigned в зависимости от свойств и UseStd3AsciiRules стандарта IDNA.

Комментарии

index Параметры unicode определяют подстроку с одной или несколькими метками, состоящими из допустимых символов Юникода. Метки разделяются разделителями меток. Первый символ подстроки не может начинаться с разделителя меток, но он может включать и при необходимости заканчиваться разделителем. Разделители меток — FULL STOP (период, U+002E), IDEOGRAPHIC FULL STOP (U+3002), FULLWIDTH FULL STOP (U+FF0E) и HALFWIDTH IDEOGRAPHIC FULL STOP (U+FF61). Например, доменное имя "www.adatum.com" состоит из меток, "www", "adatum" и "com", разделенных периодами.

Метка не может содержать один из следующих символов:

Метод GetAscii преобразует все разделители меток в FULL STOP (период, U+002E).

Если unicode нет символов за пределами диапазона символов US-ASCII и нет символов в диапазоне символов US-ASCII запрещено, метод возвращает unicode без изменений.

Примечания для тех, кто вызывает этот метод

В .NET Framework 4.5 IdnMapping класс поддерживает разные версии стандарта IDNA в зависимости от используемой операционной системы:

См. раздел "Технический стандарт Юникода" #46. Обработка совместимости IDNA для различий в том, как эти стандарты обрабатывают определенные наборы символов.

Применяется к

GetAscii(String, Int32, Int32)

Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs
Исходный код:
IdnMapping.cs

Кодирует указанное количество символов в подстроке меток доменных имен, включающих символы Юникода за пределами диапазона символов US-ASCII. Подстрока преобразуется в строку отображаемых символов Юникода в диапазоне символов US-ASCII и форматируется в соответствии со стандартом IDNA.

public:
 System::String ^ GetAscii(System::String ^ unicode, int index, int count);
public string GetAscii(string unicode, int index, int count);
member this.GetAscii : string * int * int -> string
Public Function GetAscii (unicode As String, index As Integer, count As Integer) As String

Параметры

unicode
String

Строка для преобразования, состоящая из одной или нескольких меток доменных имен, разделенных разделителями меток.

index
Int32

Отсчитываемое от нуля смещение unicode , указывающее начало подстроки.

count
Int32

Число символов, которые необходимо преобразовать в подстроке, которая начинается с позиции, указанной index в строке unicode .

Возвращаемое значение

Эквивалент подстроки, указанной параметром unicode, indexи count параметрами, состоящими из отображаемых символов Юникода в диапазоне символов US-ASCII (U+0020 до U+007E) и отформатирован в соответствии со стандартом IDNA.

Исключения

unicode равно null.

index или count меньше нуля.

–или–

index больше длины unicode.

–или–

index больше длины unicode минуса count.

unicode является недопустимым AllowUnassigned в зависимости от свойств и UseStd3AsciiRules стандарта IDNA.

Примеры

В следующем примере метод используется GetAscii(String, Int32, Int32) для преобразования международного доменного имени в доменное имя, соответствующее стандарту IDNA. Затем GetUnicode(String, Int32, Int32) метод преобразует стандартизированное доменное имя обратно в исходное доменное имя, но заменяет исходные разделители меток стандартным разделителем меток.

// This example demonstrates the GetAscii and GetUnicode methods.
// For sake of illustration, this example uses the most complex
// form of those methods, not the most convenient.

using System;
using System.Globalization;

class Sample
{
    public static void Main()
    {
/*
   Define a domain name consisting of the labels: GREEK SMALL LETTER
   PI (U+03C0); IDEOGRAPHIC FULL STOP (U+3002); GREEK SMALL LETTER
   THETA (U+03B8); FULLWIDTH FULL STOP (U+FF0E); and "com".
*/
    string name = "\u03C0\u3002\u03B8\uFF0Ecom";
    string international;
    string nonInternational;

    string msg1 = "the original non-internationalized \ndomain name:";
    string msg2 = "Allow unassigned characters?:     {0}";
    string msg3 = "Use non-internationalized rules?: {0}";
    string msg4 = "Convert the non-internationalized domain name to international format...";
    string msg5 = "Display the encoded domain name:\n\"{0}\"";
    string msg6 = "the encoded domain name:";
    string msg7 = "Convert the internationalized domain name to non-international format...";
    string msg8 = "the reconstituted non-internationalized \ndomain name:";
    string msg9 = "Visually compare the code points of the reconstituted string to the " +
                  "original.\n" +
                  "Note that the reconstituted string contains standard label " +
                  "separators (U+002e).";
// ----------------------------------------------------------------------------
    CodePoints(name, msg1);
// ----------------------------------------------------------------------------

    IdnMapping idn = new IdnMapping();

    Console.WriteLine(msg2, idn.AllowUnassigned);
    Console.WriteLine(msg3, idn.UseStd3AsciiRules);
    Console.WriteLine();
// ----------------------------------------------------------------------------
    Console.WriteLine(msg4);
    international = idn.GetAscii(name, 0, name.Length);
    Console.WriteLine(msg5, international);
    Console.WriteLine();
    CodePoints(international, msg6);
// ----------------------------------------------------------------------------
    Console.WriteLine(msg7);
    nonInternational = idn.GetUnicode(international, 0, international.Length);
    CodePoints(nonInternational, msg8);
    Console.WriteLine(msg9);
    }
// ----------------------------------------------------------------------------
    static void CodePoints(string value, string title)
    {
    Console.WriteLine("Display the Unicode code points of {0}", title);
    foreach (char c in value)
        {
        Console.Write("{0:x4} ", Convert.ToInt32(c));
        }
        Console.WriteLine();
        Console.WriteLine();
    }
}
/*
This code example produces the following results:

Display the Unicode code points of the original non-internationalized
domain name:
03c0 3002 03b8 ff0e 0063 006f 006d

Allow unassigned characters?:     False
Use non-internationalized rules?: False

Convert the non-internationalized domain name to international format...
Display the encoded domain name:
"xn--1xa.xn--txa.com"

Display the Unicode code points of the encoded domain name:
0078 006e 002d 002d 0031 0078 0061 002e 0078 006e 002d 002d 0074 0078 0061 002e 0063 006f
006d

Convert the internationalized domain name to non-international format...
Display the Unicode code points of the reconstituted non-internationalized
domain name:
03c0 002e 03b8 002e 0063 006f 006d

Visually compare the code points of the reconstituted string to the original.
Note that the reconstituted string contains standard label separators (U+002e).

*/
' This example demonstrates the GetAscii and GetUnicode methods.
' For sake of illustration, this example uses the most complex
' form of those methods, not the most convenient.

Imports System.Globalization

Class Sample
    Public Shared Sub Main()

'   Define a domain name consisting of the labels: GREEK SMALL LETTER
'   PI (U+03C0); IDEOGRAPHIC FULL STOP (U+3002); GREEK SMALL LETTER
'   THETA (U+03B8); FULLWIDTH FULL STOP (U+FF0E); and "com".

        Dim name As String = "π。θ.com"
        Dim international As String
        Dim nonInternational As String

        Dim msg1 As String = "the original non-internationalized " & vbCrLf & "domain name:"
        Dim msg2 As String = "Allow unassigned characters?:     {0}"
        Dim msg3 As String = "Use non-internationalized rules?: {0}"
        Dim msg4 As String = "Convert the non-internationalized domain name to international format..."
        Dim msg5 As String = "Display the encoded domain name:" & vbCrLf & """{0}"""
        Dim msg6 As String = "the encoded domain name:"
        Dim msg7 As String = "Convert the internationalized domain name to non-international format..."
        Dim msg8 As String = "the reconstituted non-internationalized " & vbCrLf & "domain name:"
        Dim msg9 As String = "Visually compare the code points of the reconstituted string to the " & _
                             "original." & vbCrLf & _
                             "Note that the reconstituted string contains standard label " & _
                             "separators (U+002e)."
        ' ----------------------------------------------------------------------------
        CodePoints(name, msg1)
        ' ----------------------------------------------------------------------------
        Dim idn As New IdnMapping()

        Console.WriteLine(msg2, idn.AllowUnassigned)
        Console.WriteLine(msg3, idn.UseStd3AsciiRules)
        Console.WriteLine()
        ' ----------------------------------------------------------------------------
        Console.WriteLine(msg4)
        international = idn.GetAscii(name, 0, name.Length)
        Console.WriteLine(msg5, international)
        Console.WriteLine()
        CodePoints(international, msg6)
        ' ----------------------------------------------------------------------------
        Console.WriteLine(msg7)
        nonInternational = idn.GetUnicode(international, 0, international.Length)
        CodePoints(nonInternational, msg8)
        Console.WriteLine(msg9)
    End Sub

    ' ----------------------------------------------------------------------------
    Shared Sub CodePoints(ByVal value As String, ByVal title As String)
        Console.WriteLine("Display the Unicode code points of {0}", title)
        Dim c As Char
        For Each c In  value
            Console.Write("{0:x4} ", Convert.ToInt32(c))
        Next c
        Console.WriteLine()
        Console.WriteLine()

    End Sub
End Class
'
'This code example produces the following results:
'
'Display the Unicode code points of the original non-internationalized
'domain name:
'03c0 3002 03b8 ff0e 0063 006f 006d
'
'Allow unassigned characters?:     False
'Use non-internationalized rules?: False
'
'Convert the non-internationalized domain name to international format...
'Display the encoded domain name:
'"xn--1xa.xn--txa.com"
'
'Display the Unicode code points of the encoded domain name:
'0078 006e 002d 002d 0031 0078 0061 002e 0078 006e 002d 002d 0074 0078 0061 002e 0063 006f
'006d
'
'Convert the internationalized domain name to non-international format...
'Display the Unicode code points of the reconstituted non-internationalized
'domain name:
'03c0 002e 03b8 002e 0063 006f 006d
'
'Visually compare the code points of the reconstituted string to the original.
'Note that the reconstituted string contains standard label separators (U+002e).
'

Комментарии

indexПараметры Unicodeи count параметры определяют подстроку с одной или несколькими метками, состоящими из допустимых символов Юникода. Метки разделяются разделителями меток. Первый символ подстроки не может начинаться с разделителя меток, но он может включать и при необходимости заканчиваться разделителем. Разделители меток — FULL STOP (период, U+002E), IDEOGRAPHIC FULL STOP (U+3002), FULLWIDTH FULL STOP (U+FF0E) и HALFWIDTH IDEOGRAPHIC FULL STOP (U+FF61). Например, доменное имя "www.adatum.com" состоит из меток, "www", "adatum" и "com", разделенных периодами.

Метка не может содержать один из следующих символов:

Метод GetAscii преобразует все разделители меток в FULL STOP (период, U+002E). Если подстрока не содержит символов за пределами диапазона символов US-ASCII, а символы в диапазоне символов US-ASCII запрещены, метод возвращает подстроку без изменений.

Примечания для тех, кто вызывает этот метод

В .NET Framework 4.5 IdnMapping класс поддерживает разные версии стандарта IDNA в зависимости от используемой операционной системы:

См. раздел "Технический стандарт Юникода" #46. Обработка совместимости IDNA для различий в том, как эти стандарты обрабатывают определенные наборы символов.

Применяется к