Поделиться через


Языковая поддержка анализа тональности и интеллектуального анализа мнений

В данной статье рассматривается, какие языки поддерживаются анализом тональности и интеллектуальным анализом мнений. Как облачные API, так и контейнеры Docker поддерживают одни и те же языки.

Языковая поддержка анализа тональности

Всего поддерживаемых языковых кодов: 94

Язык Код языка Примечания.
Африкаанс af
Албанский sq
Амхарский am
Арабский ar
Армянский hy
Ассамский язык as
Азербайджанский az
Баскский eu
Белорусский (новый) be
Бенгальский bn
Боснийский bs
Бретон (новое) br
Болгарский bg
Бирманский my
Каталанский ca
Китайский (упрощенное письмо) zh-hans Также допускается zh
Китайский, традиционное письмо zh-hant
Хорватский hr
Чешский cs
датский da
Голландский nl
Английский en
Эсперанто (новый) eo
Эстонский et
Филиппинский fil
Финский fi
французский fr
Галисийский gl
Грузинский ka
немецкий de
Греческий el
Гуджарати gu
Хауса (новая) ha
Иврит he
Хинди hi
Венгерский hu
Индонезийский id
Ирландский ga
Итальянский it
Японский ja
Яванский язык (новый) jv
Каннада kn
Казахский kk
Кхмерский km
Корейский ko
Курдский (Курманжи) ku
Киргизский ky
Лаосский lo
Латиница (новая) la
Латышский lv
Литовский lt
Македонский mk
Малагасийский mg
Малайский ms
Малаялам ml
Маратхи mr
Монгольский mn
Непальский ne
Норвежский no
Ория or
Оромо (новое) om
Пушту ps
Персидский fa
Польский pl
Португальский (Португалия) pt-PT Также допускается pt
португальский (Бразилия) pt-BR
Панджаби pa
Румынский ro
Русский ru
Санскрит (новое) sa
Шотландский Гейлик (новое) gd
Сербский sr
Синдхи (новое) sd
Синхала (новая) si
Словацкий sk
Словенский sl
Сомалийский so
Испанский es
Sundanese (новое) su
Суахили sw
Шведский sv
Тамильский ta
Телугу te
Тайский th
Турецкий tr
Украинский uk
Урду ur
Уйгур ug
Узбекский uz
Вьетнамский vi
Валлийский cy
западный фризский (новый) fy
Xhosa (новый) xh
Йидиш (новый) yi

Поддержка языков для анализа мнений

Всего поддерживаемых языковых кодов: 94

Язык Код языка Примечания.
Afrikaans (new) af
Албанский (новый) sq
Амхарич (новое) am
Арабский ar
Армянский (новый) hy
Ассамский (новый) as
Азербайджан (новое) az
Баскское (новое) eu
Белорусский (новый) be
Бенгальский bn
Боснийский (новый) bs
Бретон (новое) br
Болгарский (новый) bg
Бирмский (новый) my
Каталонский (новый) ca
Китайский (упрощенное письмо) zh-hans Также допускается zh
Китайский (традиционное) (новое) zh-hant
Хорватский (новый) hr
Чешская (новая) cs
датский da
Голландский nl
Английский en
Эсперанто (новый) eo
Эстония (новая) et
Филиппино (новое) fil
Финский fi
французский fr
Галицийский (новый) gl
Грузинский (новый) ka
немецкий de
Греческий el
Гуджарати (новое) gu
Хауса (новая) ha
Иврит (новое) he
Хинди hi
Венгерский hu
Индонезийский id
Ирландский (новый) ga
Итальянский it
Японский ja
Яванский язык (новый) jv
Каннада (новая) kn
Казах (новое) kk
Кхмер (новая) km
Корейский ko
Курдский (Курманжи) ku
Кыргыз (новое) ky
Лаос (новое) lo
Латиница (новая) la
Латышский (новый) lv
Литовский язык (новый) lt
Македонский (новый) mk
Малагаси (новое) mg
Малайский (новый) ms
Малаялам (новая) ml
Маратхи mr
Монгольский (новый) mn
Непали (новое) ne
Норвежский no
Одия (новая) or
Оромо (новое) om
Пашто (новое) ps
Персидский (новый) fa
Польский pl
Португальский (Португалия) pt-PT Также допускается pt
португальский (Бразилия) pt-BR
Пенджаби (новое) pa
Румынский (новый) ro
Русский ru
Санскрит (новое) sa
Шотландский Гейлик (новое) gd
Сербский (новый) sr
Синдхи (новое) sd
Синхала (новая) si
Словацкий (новый) sk
Словенский (новое) sl
Сомалийский (новый) so
Испанский es
Sundanese (новое) su
суахили (новый) sw
Шведский sv
Тамильский ta
Телугу te
Тайский (новое) th
Турецкий tr
Украинский (новый) uk
Урду (новое) ur
Уйгур (новое) ug
Узбекистан (новое) uz
Вьетнамцы (новые) vi
Валлийский (новый) cy
западный фризский (новый) fy
Xhosa (новый) xh
Йидиш (новый) yi

Многоязычная опция (только для анализа пользовательской тональности)

С помощью пользовательского анализа тональности можно обучить модель на одном языке и использовать её для классификации документов на другом языке. Эта функция очень полезна, так как позволяет экономить время и усилия. Она устраняет необходимость создавать отдельные проекты для каждого языка, и в одном проекте можно использовать многоязычный набор данных. Набор данных не обязательно должен быть построен на одном языке, но при создании проекта или позже в параметрах проекта необходимо включить параметр многоязычности. Если при оценивании вы определили, что модель плохо работает на определенных языках, рассмотрите добавление дополнительных данных на таких языках в набор для обучения.

Вы можете полностью обучить свой проект документам на английском языке и запрашивать его на французском, немецком, китайском, японском, корейском и других языках. Настраиваемый анализ тональности упрощает масштабирование ваших проектов на нескольких языках, используя многоязычные технологии для обучения ваших моделей.

Когда вы обнаружите, что определенный язык работает не так хорошо, как другие языки, вы можете добавить документы для этого языка в свой проект.

Вы не должны добавлять одинаковое количество документов для каждого языка. Вы должны создать большую часть проекта на одном языке и добавить лишь несколько документов на тех языках, которые работают не очень хорошо. Если вы создадите проект преимущественно на английском языке и начнете тестировать его на французском, немецком и испанском языках, вы можете заметить, что немецкий язык работает не так хорошо, как два других языка. В этом случае попробуйте добавить 5 % исходных английских документов на немецком языке, обучите новую модель и снова протестируйте на немецком языке. Вы должны получить лучшие результаты для запросов на немецком языке. Чем больше документов с метками вы добавите, тем больше вероятность того, что результаты станут лучше.

Когда вы добавляете данные на другом языке, не стоит опасаться, что они негативно повлияют на остальные языки.

Следующие шаги