Откатить разбиение слов, используемое в Full-Text Search, к предыдущей версии.

Область применения: SQL Server База данных SQL Azure

Замечание

В SQL Server 2025 (17.x) процесс отмены разбиения слов в предыдущие версии изменился. Дополнительные сведения см. в разделе "Изменение лексического анализатора и фильтра Full-Text Search в SQL Server 2025".

SQL Server устанавливает и включает версию средств разбиения слов и стеммеров для всех языков, поддерживаемых Full-Text Search, за исключением корейского языка. В этой статье описывается способ переключения из данной версии этих компонентов в предыдущую версию или обратно из предыдущей версии в новую версию.

В этой статье не рассматриваются следующие языки:

Язык Description
English Чтобы вернуть или восстановить английские компоненты, см. статью "Изменить анализатор слов и фильтр для полнотекстового поиска в SQL Server 2025".
Датский, польский и турецкий Сторонние средства разбиения слов для датских, польских и турецких, которые были включены в предыдущие выпуски SQL Server, заменяются компонентами Майкрософт.
Чешский и греческий Добавлены средства разбиения по словам для чешского и греческого языков. Предыдущие выпуски SQL Server Full-Text Search не поддерживают эти два языка.
корейский Средства разбиения слов и стеммера для корейского языка не обновлены в этой версии.

Общую информацию о средствах разбиения слов и стеммерах см. в разделе Настройка и управление средствами разбиения слов и стеммерами для поиска (SQL Server).

Общие сведения о возврате к использованию и восстановлении средств разбиения по словам и парадигматических модулей

Инструкции по возврату к использованию и восстановлению средств разбиения по словам и парадигматических модулей зависят от языка. В следующей таблице приведены три набора действий, которые могут потребоваться для возврата к предыдущей версии компонентов.

Caution

Неправильное редактирование реестра может серьезно повредить вашу систему. Перед внесением изменений в реестр рекомендуется создать резервную копию всех важных данных.

Текущий файл Предыдущий файл Число затронутых языков Действия для файлов Действия для записей реестра
NaturalLanguage6.dll NaturalLanguage6.dll 34 Получите и установите предыдущую версию NaturalLanguage6.dllфайла, перезаписав текущую версию файла. Действия не требуется.

Ключи и значения реестра не изменились в этой версии.
(Другое имя файла) NaturalLanguage6.dll 5 Получите и установите предыдущую версию NaturalLanguage6.dllфайла, перезаписав текущую версию файла. Измените набор записей реестра, указав в них предыдущую версию компонентов.
(Другое имя файла) (Другое имя файла) 6 Действия не требуется.

Программа установки SQL Server копирует текущие и предыдущие версии компонентов в папку Binn .
Измените набор записей реестра, указав в них предыдущую версию компонентов.

Предупреждение

Если вы замените текущую версию файла NaturalLanguage6.dll другой версией, то изменится поведение всех языков, использующих этот файл.

Файлы, описанные в этой статье, — это файлы DLL, установленные в папке MSSQL\Binn для экземпляра SQL Server. Полный путь обычно выглядит следующим образом:

C:\Program Files\Microsoft SQL Server\<instance>\MSSQL\Binn

Языки, у которых именем файла текущего и предыдущего средства разбиения по словам является NaturalLanguage6.dll

Для языков в следующей таблице имя файла текущего и предыдущего разбиения слов равно NaturalLanguage6.dll. Чтобы вернуть или восстановить эти компоненты, необходимо перезаписать NaturalLanguage6.dll другой версией того же файла. Вам не нужно изменять записи реестра, так как записи реестра не изменились для этого выпуска.

Предупреждение

Если вы замените текущую версию файла NaturalLanguage6.dll другой версией, то изменится поведение всех языков, использующих этот файл.

Список затронутых языков

Язык Сокращение, используемое в реестре Идентификатор языкового стандарта (LCID)
Бенгальский ben 1093
Болгарский bgr 1026
Каталанский cat 1027
Испанский esn 3082
Французский fra 1036
Гуджарати guj 1095
Иврит heb 1037
Хинди hin 1081
Хорватский hrv 1050
Индонезийский ind 1057
Исландский isl 1039
Итальянский ita 1040
Каннада kan 1099
Литовский lth 1063
Латышский lvi 1062
Малаялам mal 1 100
Маратхи mar 1102
Малайский msl 1086
Нейтральные Neutral 0000
Норвежский букмол nor 1044
Панджаби pan 1094
португальский (Бразилия) ptb 1046
Португальский ptg 2070
Румынский rom 1048
Словацкий sky 1051
Словенский slv 1060
Сербский — кириллица srb 3098
Сербский — латиница srl 2074
Шведский sve 1053
Тамильский tam 1097
Телугу tel 1098
Украинский ukr 1058
Урду urd 1056
Вьетнамский vit 1066

Предыдущая таблица отсортирована в алфавитном порядке по столбцу «Аббревиатура».

  1. Перейдите в папку Binn, описанную ранее.

  2. Выполнить резервное копирование версии NaturalLanguage6.dll SQL Server в другое расположение.

  3. Скопируйте предыдущую версию NaturalLanguage6.dll из Binn папки экземпляра SQL Server 2008 R2 (10.50.x) или SQL Server 2008 (10.0.x) в папку Binn экземпляра SQL Server.

    Предупреждение

    Это изменение влияет на все языки, используемые NaturalLanguage6.dll как в текущей, так и в предыдущей версии.

  4. Перезапуск SQL Server.

Языки, для которых имя файла предыдущего разделителя слов NaturalLanguage6.dll

Для языков в следующей таблице имя файла предыдущей версии средства разбиения по словам отличается от имени файла новой версии. Предыдущее имя файла — NaturalLanguage6.dll. Чтобы вернуться к предыдущей версии, необходимо перезаписать текущую версию NaturalLanguage6.dll с более ранней версией того же файла. Необходимо также изменить набор записей реестра, чтобы указать предыдущую или текущую версию компонентов.

Предупреждение

Если вы замените текущую версию файла NaturalLanguage6.dll другой версией, то изменится поведение всех языков, использующих этот файл.

Список затронутых языков

Язык Аббревиатура
применяется в
реестр
LCID (Идентификатор языкового стандарта)
Арабский ara 1025
Немецкий deu 1031
Японский jpn 1041
Голландский nld 1043
русский rus 1049

Предыдущая таблица отсортирована в алфавитном порядке по столбцу «Аббревиатура».

Используйте следующие инструкции совместно со списком значений в разделе Имена файлов и значения реестра для возврата к использованию и восстановления средств разбиения по словам и стеммеров.

  1. Перейдите в папку Binn, описанную ранее.

  2. Не удаляйте файлы для текущей версии компонентов из Binn папки.

  3. Выполнить резервное копирование версии NaturalLanguage6.dll SQL Server в другое расположение.

  4. Скопируйте предыдущую версию NaturalLanguage6.dll из Binn папки экземпляра SQL Server 2008 R2 (10.50.x) или SQL Server 2008 (10.0.x) в Binn папку нового экземпляра SQL Server.

    Предупреждение

    Это изменение влияет на все языки, используемые NaturalLanguage6.dll как в текущей, так и в предыдущей версии.

  5. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\<InstanceRoot>\MSSearch\CLSID

  6. Чтобы добавить новые ключи для идентификаторов классов COM для предыдущих интерфейсов средства разбиения по словам и стеммера для выбранного языка, выполните следующие действия.

    1. Добавьте новый ключ со значением из таблицы для предыдущего разделителя слов.

    2. Обновите (по умолчанию) данные этого ключевого значения, указав имя файла предыдущего средства разбиения по словам из таблицы.

    3. Если выбранный язык использует стеммер, добавьте новый ключ со значением из таблицы для предыдущего стеммера.

    4. Если выбранный язык использует стеммер, обновите данные ключа (По умолчанию) до имени файла предыдущего стеммера из таблицы.

  7. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\<InstanceRoot>\MSSearch\Language\<language_key> <language_key> представляет сокращение языка, используемого в реестре; например, fra для французского и esn испанского языка.

  8. Обновите значение ключа WBreakerClass на значение из таблицы для данного средства разбиения слов.

  9. Если выбранный язык использует стеммер, обновите StemmerClass значение ключа до значения из таблицы для текущего стеммера.

  10. Перезапуск SQL Server.

Имена файлов и значения реестра для восстановления средств разбиения по словам и стеммеров

Используйте следующий список имен файлов и записей реестра совместно с инструкциями из предыдущего раздела. Используйте предыдущие значения, чтобы вернуться к использованию предыдущей версии, либо используйте текущие значения, чтобы восстановить текущую версию компонентов.

Следующий список отсортирован по алфавиту по сокращению, используемому для каждого языка.

Арабский (ara) — LCID 1025

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID 7efd3c7e-9e4b-4a93-9503-decd74c0ac6d 483b0283-25db-4c92-9c15-a65925cb95ce
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID 04b37e30-c9a9-4a7d-8f20-792fc87ddf71 нет
Текущее имя файла MSWB7.dll нет

Немецкий (deu) - LCID 1031

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID 45eaca36-dbe9-4e4a-a26d-5c201902346d 65170ae4-0ad2-4fa5-b3ba-7cd73e2da825
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID dfa00c33-bf19-482e-a791-3c785b0149b4 8a474d89-6e2f-419c-8dd5-9b50edc8c787
Текущее имя файла MsWb7.dll MsWb7.dll

Японский (jpn) — LCID 1041

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID e1e8f15e-8bec-45df-83bf-50ff84d0cab5 3d5df14f-649f-4cbc-853d-f18fede9cf5d
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID 04096682-6ece-4e9e-90c1-52d81f0422ed нет
Текущее имя файла MsWb70011.dll нет

Голландский (nld) - LCID 1043

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID 2c9f6beb-c5b0-42b6-a5ee-84c24dc0d8ef f7a465ee-13fb-409a-b878-195b420433af
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID 69483c30-a9af-4552-8f84-a0796ad5285b cf923cb5-1187-43ab-b053-3e44bed65ffa
Текущее имя файла MsWb7.dll MsWb7.dll

Русский (rus) — LCID 1049

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID 2cb6cda4-1c14-4392-a8ec-81eef1f2e079 e06a0ddd-e81a-4e93-8a8d-f386c3a1b670
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID aaa3d3bd-6de7-4317-91a0-d25e7d3babc3 d42c8b70-adeb-4b81-a52f-c09f24f77dfa
Текущее имя файла MsWb7.dll MsWb7.dll

Языки, для которых предыдущее и текущее имя файла не NaturalLanguage6.dll

Для языков в следующей таблице имена файлов предыдущих средств разбиения слов и стеммеров отличаются от имен файлов новых версий. Имя предыдущего и текущего файла не является NaturalLanguage6.dll. Вам не нужно заменить файлы, так как программа установки SQL Server копирует текущие и предыдущие версии компонентов в папку Binn . Однако необходимо изменить набор записей реестра, чтобы указать предыдущую или текущую версию компонентов.

Список затронутых языков

Язык Сокращение, используемое в реестре LCID (Идентификатор языкового стандарта)
Упрощенный китайский chs 2052
Традиционный китайский cht 1028
Тайский tha 1054
китайский (традиционный) zh-hk 3076
китайский (традиционный) zh-mo 5124
китайский (упрощенный) zh-sg 4100

Предыдущая таблица отсортирована в алфавитном порядке по столбцу «Аббревиатура».

Используйте следующие инструкции совместно со списком значений в разделе Имена файлов и значения реестра для возврата к использованию и восстановления средств разбиения по словам и стеммеров.

  1. Не удаляйте файлы для текущей версии компонентов из Binn папки.

  2. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\<InstanceRoot>\MSSearch\CLSID

  3. Чтобы добавить новые ключи для идентификаторов классов COM для предыдущих интерфейсов средства разбиения по словам и стеммера для выбранного языка, выполните следующие действия.

    1. Добавьте новый ключ со значением из таблицы для предыдущего разделителя слов.

    2. Обновите (по умолчанию) данные этого ключевого значения, указав имя файла предыдущего средства разбиения по словам из таблицы.

    3. Если выбранный язык использует стеммер, добавьте новый ключ со значением из таблицы для предыдущего стеммера.

    4. Если выбранный язык использует стеммер, обновите данные ключа (По умолчанию) до имени файла предыдущего стеммера из таблицы.

  4. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\<InstanceRoot>\MSSearch\Language\<language_key> <language_key> представляет сокращение языка, используемого в реестре; например, fra для французского и esn испанского языка.

  5. Обновите значение ключа WBreakerClass на значение из таблицы для данного средства разбиения слов.

  6. Если выбранный язык использует стеммер, обновите StemmerClass значение ключа до значения из таблицы для текущего стеммера.

  7. Перезапуск SQL Server.

Имена файлов и значения реестра для восстановления средств разбиения по словам и стеммеров

Используйте следующий список имен файлов и записей реестра совместно с инструкциями из предыдущего раздела. Используйте предыдущие значения, чтобы вернуться к использованию предыдущей версии, либо используйте текущие значения, чтобы восстановить текущую версию компонентов.

Следующий список отсортирован по алфавиту по сокращению, используемому для каждого языка.

Китайский язык (упрощённый) (chs) — LCID 2052

Компонент Разделитель слов
Предыдущий идентификатор CLSID 12ce94a0-defb-11d2-b31d-00600893a857
Предыдущее имя файла chsbrkr.dll
Текущий идентификатор CLSID e0831c90-bab0-4ca5-b9bd-ea254b538dac
Текущее имя файла MsWb70804.dll

Традиционный китайский (cht) - LCID 1028

Компонент Разделитель слов
Предыдущий идентификатор CLSID 1680e7c3-9430-4a51-9b82-1e7e7aee5258
Предыдущее имя файла chtbrkr.dll
Текущий идентификатор CLSID e9b1df65-08f1-438b-8277-ef462b23a792
Текущее имя файла MsWb70404.dll

Тайский (tha) - LCID 1054

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID cca22cf4-59fe-11d1-bbff-00c04fb97fda cedc01c7-59fe-11d1-bbff-00c04fb97fda
Предыдущее имя файла Thawbrkr.dll Thawbrkr.dll
Текущий идентификатор CLSID f70c0935-6e9f-4ef1-9f06-7876536db900 нет
Текущее имя файла MsWb7001e.dll нет

Китайский традиционный (zh-hk) - LCID 3076

Компонент Разделитель слов
Предыдущий идентификатор CLSID 1680e7c3-9430-4a51-9b82-1e7e7aee5258
Предыдущее имя файла chtbrkr.dll
Текущий идентификатор CLSID e9b1df65-08f1-438b-8277-ef462b23a792
Текущее имя файла MsWb70404.dll

Китайский традиционный (zh-mo) - LCID 5124

Компонент Разделитель слов
Предыдущий идентификатор CLSID 1680e7c3-9430-4a51-9b82-1e7e7aee5258
Предыдущее имя файла chtbrkr.dll
Текущий идентификатор CLSID e9b1df65-08f1-438b-8277-ef462b23a792
Текущее имя файла MsWb70404.dll

Китайский упрощенный (zh-sg) — LCID 4100

Компонент Разделитель слов
Предыдущий идентификатор CLSID 12ce94a0-defb-11d2-b31d-00600893a857
Предыдущее имя файла chsbrkr.dll
Текущий идентификатор CLSID e0831c90-bab0-4ca5-b9bd-ea254b538dac
Текущее имя файла MsWb70804.dll