Категории вреда в безопасности содержимого искусственного интеллекта Azure
- Статья
В этом руководстве описаны все категории вреда и рейтинги, которые azure AI Content Safety использует для флага содержимого. Содержимое текста и изображения используют один и тот же набор флагов.
Категории вреда
Безопасность содержимого признает четыре отдельные категории нежелательного содержимого.
Категория | Description | Термин API |
---|---|---|
Ненависть и справедливость | Ненависть и справедливость относятся к любому содержимому, которое атакует или использует дискриминационный язык со ссылкой на человека или группу удостоверений на основе определенных атрибутов этих групп. Это включает в себя, но не ограничивается следующими:
|
Hate |
Половой | Сексуальный описывает язык, связанный с анатомическими органами и гениталиями, романтическими отношениями и сексуальными актами, действия, изображаемые в эротических или ласковых терминах, в том числе те, которые изображаются как нападение или принудительный сексуальный насильственный акт против воли человека. Это включает в себя, но не ограничивается следующими:
|
Sexual |
Насилие | Насилие описывает язык, связанный с физическими действиями, предназначенными для того, чтобы повредить, ранить, повредить или убить кого-то или что-то; описывает оружие, оружие и связанные сущности. Это включает в себя, но не ограничивается:
|
Violence |
Самоповредение | Самоповреждение описывает язык, связанный с физическими действиями, предназначенными для намеренного повреждения, травмы, повреждения тела или убийства себя. Это включает в себя, но не ограничивается:
|
SelfHarm |
Классификация может быть многометкой. Например, когда пример текста проходит через модель модерации текста, его можно классифицировать как сексуальное содержимое и насилие.
Уровни серьезности
Каждая категория вреда, применяемая служба, также поставляется с оценкой уровня серьезности. Уровень серьезности предназначен для указания серьезности последствий отображения помеченного содержимого.
Текст: текущая версия текстовой модели поддерживает полный масштаб серьезности 0-7. Классификатор обнаруживает все уровни серьезности по этому масштабу. Если пользователь указывает, он может возвращать серьезность в усеченном масштабе от 0, 2, 4 и 6; каждый из двух смежных уровней сопоставляется с одним уровнем.
[0,1]
->0
[2,3]
->2
[4,5]
->4
[6,7]
->6
Изображение. Текущая версия модели образа поддерживает обрезную версию полного масштаба серьезности 0-7. Классификатор возвращает только значения серьезности 0, 2, 4 и 6.
0
2
4
6
Изображение с текстом: текущая версия мультимодальной модели поддерживает полный масштаб серьезности 0-7. Классификатор обнаруживает все уровни серьезности по этому масштабу. Если пользователь указывает, он может возвращать серьезность в усеченном масштабе от 0, 2, 4 и 6; каждый из двух смежных уровней сопоставляется с одним уровнем.
[0,1]
->0
[2,3]
->2
[4,5]
->4
[6,7]
->6
Текстовое содержимое
Предупреждение
Вкладка "Определения серьезности" в этом документе содержит примеры вредного содержимого, которое может беспокоить некоторых читателей.
Уровни серьезности ненависти и справедливости
Степень серьезности | Description | Пример текста |
---|---|---|
Уровень 0 | Содержимое, содержащее ненависть и справедливость, связанные с терминами, используемыми в общем смысле, и подходит для всех целевых аудиторий, включая детей. В том числе:
|
I hate cats. |
Уровень 1 | Содержимое, содержащее ненависть и справедливость, используемые в общем смысле, но может получить другое значение, основанное на контексте, и не различает группы личности и другие в предвзятом или отрицательном способе. В том числе:
|
Black people should not be killed by police or mistreated just because of their skin color. |
Уровень 2 | Содержимое, содержащее положительную характеризацию или защиту групп удостоверений, которые вызывают благоприятный эмоциональный ответ. В том числе:
|
I hate you. |
Уровень 3 | Содержимое, содержащее предрассудки, суждение, стереотипную характеризацию или негативную тональность. В том числе:
|
I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all. |
Уровень 4 | Содержимое, содержащее прямые словесные оскорбления, негативные комментарии и расовые оскорбления, используемые в качестве описания групп удостоверений с намерением повредить людей на основе их атрибутов. В том числе:
|
All [identity group] are ugly. |
Уровень 5 | Содержимое, содержащее дегуманизацию или дерогацию отдельных лиц или групп, которые приводят к снижению тональности путем дегуманизации, насилия, отрицания событий, издевательств или запугивания поведения. В том числе:
|
The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof. |
Уровень 6 | Содержимое на основе негативных тональности и ненависти речи к группам удостоверений. Ссылаясь на характеристики групп, которые различают группу удостоверений и другие, и призывая принять меры против групп удостоверений на основе их атрибутов. К ней может относиться:
|
Send [identity group] back to the gas chambers. |
Уровень 7 | Содержимое на основе негативных тональности, отображая намерение преступления ненависти и преследования, вызывая враждебное эмоциональное реагирование и различая группы личности и другие, что приводит к преступности. В том числе:
|
Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because… |
Уровни сексуальной серьезности
Степень серьезности | Description | Пример текста |
---|---|---|
Уровень 0 | Содержимое, содержащее сексуально связанные термины, используемые в общем смысле, что безвредно для всех целевых аудиторий, включая детей.
|
The sports bra and yoga pants were too tight for comfort. |
Уровень 1 | Содержимое, содержащее сексуально связанные термины, используемые в общем смысле, но может получить другое значение в зависимости от контекста. К ним относятся:
|
Fewer young adults are having sex than in previous generations. |
Уровень 2 | Содержимое, содержащее сексуально связанные термины в вымышленном или реальном мире опыт, которые не являются чрезвычайно графическими. К ним относятся:
|
My husband and I introduced a vibrator to our sex life and it has really made a difference. |
Уровень 3 | Содержание с сексуально связанными терминами в случаях, содержащих некоторые графические материалы, мнения, выражения предвзятости, предрассудков, суждений или мнения мнения по вопросам, связанным с сексом. К ним относятся:
|
We made out for a while, and he started to feel me up. I felt a bulge in his pants. |
Уровень 4 | Содержимое, описывающее сексуальные фантазии, профессиональную секс-промышленность и рекламу, и сексуальное воспроизведение животных. К ним относятся:
|
I got into BDSM because I had some friends into the lifestyle and it piqued my interest. I like using silk, scarves, collars, and bondage… |
Уровень 5 | Контент, описывающий эротические шоу или опыт как личный опыт, BDSM с четким согласием, и эротические истории и веб-сайты. К ним относятся:
|
We both climaxed at the same time. |
Уровень 6 | Содержание, описывающее запрос сексуальных коммерческих услуг, содержащее подробные описания сексуальной активности, насильственных сексуальных злоупотреблений и изнасилований, а также неконсенсуальные обмены властью, злоупотребление и voyeurism. К ним относятся:
|
I love forced sex, it's so much hotter. |
Уровень 7 | Содержимое, используемое для поощрения, одобрения, прославления экстремальных форм сексуального рабства. Содержимое, которое является экстремальным или незаконным. К ним относятся:
|
I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son. |
Уровни серьезности насилия
Степень серьезности | Description | Пример текста |
---|---|---|
Уровень 0 | Содержимое, содержащее ненасильственные действия или термины, связанные с насилием, используются в общем смысле, что безвредно для всех целевых аудиторий, включая детей. В том числе:
|
According to our child and parent testers, here are the best long-range soakers for soft blasters for toddlers suitable for epic water battles. |
Уровень 1 | Содержимое, содержащее термины или действия, связанные с насилием, которые используются в общем смысле, но могут получить другое значение в зависимости от контекста. В том числе:
|
Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights. |
Уровень 2 | Содержимое, содержащее термины, связанные с насилием, или действует в вымышленном или реальном мире опыт, которые не являются чрезвычайно графическими и без славения или одобрения злонамеренного. В том числе:
|
Physical punishment is a way to correct bad behavior and doesn’t cause harm to children. |
Уровень 3 | Содержание с терминами или действиями, связанными с насилием, в случаях, содержащих некоторые графические материалы, мнения, которые выражают предвзятые, предубежденные, судимые или мнения о насилии. В том числе:
|
Some people just need to be slapped. |
Уровень 4 | Содержание, описывающее незапланированное обоснование, почему жертвы физически злоупотребляют, необоснованным возмездием положительных качеств злоупотреблений, угроз насильственных актов и фантазий, связанных с тем, как навредить другому человеку, и среднему горку. В том числе:
|
Victims of abuse deserve to be hit. They push and push until they get what they deserve. |
Уровень 5 | Контент, направленный на дальнейшее насилие, предоставляя прямые инструкции о том, как нанести ущерб конкретным лицам или группам. В том числе:
|
Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught. |
Уровень 6 | Содержание, описывающее экстремистские группы и террористические организации, массовые убийства и явный физический ущерб в высоком горке, а также продвижение терроризма и его пропаганды. В том числе:
|
We must kill them all. God wills it, and society will be better for it. |
Уровень 7 | Содержимое, используемое для описания, похвалы, поддержки, поощрения, одобрения, славения экстремальных форм насилия. Контент, поддерживающий террористические организации и радикализует, инструктирует или обучает. В том числе:
|
Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight. |
Уровни серьезности самоповредения
Степень серьезности | Description | Пример текста |
---|---|---|
Уровень 0 — безопасный | Содержимое, содержащее термины, связанные с самовосхищением, используются в общем смысле, что безвредно для всех целевых аудиторий, включая детей. В том числе:
|
I appreciate your hard work, but you don't need to keep killing yourself over this project. |
Уровень 1 | Содержимое, содержащее термины, связанные с самовосхищением, используемые в общем смысле, но могут получить другое значение в зависимости от контекста. В том числе:
|
Binging and purging may be a warning sign for people with a history of extreme weight loss. |
Уровень 2 | Содержимое, содержащее термины, связанные с самоповреждениями, или действует в вымышленном или реальном мире, которые не являются чрезвычайно графическими. В том числе:
|
Oedipus stabbed his eyes in despair. |
Уровень 3 | Содержание с терминами или действиями, связанными с самообслуживанием, в случаях, содержащих некоторые графические материалы, мнения, выражения предвзятости, предубежденности, суждений или мнений о самовосхищении. В том числе:
|
I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice? |
Уровень 4 | Содержимое, которое высмеивает жертв или выживших самоубийства или самоубийца, неисправное возмездие положительных качеств, фантазий или желаний самоповредения, и содержит явно графическое содержимое, включающее смерть, вскрытие, преступление или место смерти. В том числе:
|
It's hilarious when [identity group] kill themselves. |
Уровень 5 | Контент, направленный на дальнейшее продвижение самоповредения, предоставляя прямые инструкции о том, как выполнить самоповредение или издевательств жертву. В том числе:
|
Go kill yourself, you are worthless. |
Уровень 6 | Содержимое, описывающее подробные и явные инструкции о том, как совершить самоубийство. В том числе:
|
Here is a quick guide to do-it-yourself suicide. One method is asphyxia suicide by inhaling helium inside a plastic bag. |
Уровень 7 | Содержимое, используемое для одобрения и славы самоубийства или других серьезных актов самоубийства. В том числе:
|
Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble. |
Содержимое изображения
Предупреждение
Вкладка "Определения серьезности" в этом документе содержит примеры вредного содержимого, которое может беспокоить некоторых читателей.
Уровни серьезности ненависти и справедливости
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но может содержать ненавидимые и справедливые изображения без тональности или нейтральных тональности в недискриминационных способах в следующих контекстах или аналогичных:
|
Неконфедератные флаги, например флаги стран или государств, которые пересекают флаги.
|
Низкая | Содержимое, содержащее либо положительные тональности, ложные положительные настроения, либо отрицательные, предвзятые настроения, отличающие группы личности от других. Это содержимое предназначено для активации эмоционального ответа. В том числе:
|
Представления движения "Ненавидимая речь" представления деприоритизованных кандидатов на работу, таких как кандидаты с ограниченными возможностями в параметрах собеседования |
Средняя | Содержимое, содержащее негативное действие тональности в отношении групп удостоверений и других, что приводит к продвижению действий в отношении групп удостоверений и тональности превосходства. В том числе:
|
Изображение, которое способствует социальному избеганию [групп удостоверений] Образы, изображающие теорию расового улучшения и евгенику |
Высокая | Содержимое, содержащее негативные настроения и ненавидительную речь в отношении групп удостоверений, ведущих к созданию речи ненависти или преступлениям ненависти. В том числе:
|
Антиземитическое изображение изображения , изображающее "Южный крест", который имеет синий соленый (диагонали крест) с принадлежностью к очевидному насилию (например, оружие в отображении или использовании) |
Уровни сексуальной серьезности
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но содержит сексуально связанные изображения, используемые в общем смысле. В том числе:
|
Представления обнимать или делать несексуальные физические контакты Представления, изображающие физическое отображение любви, такие как поцелуй без языка и без наготы |
Низкая | Содержимое, содержащее сексуальное предложение поведения или действия. В том числе:
|
Изображения людей |
Средняя | Содержимое, содержащее коммерческое и любительское эротические и /или порнографическое содержимое без визуального фотографического проникновения и обнаженных участников, участвующих в сексуальных сценах, предназначенных для сексуального пробуждения. В том числе:
|
Изображение полового акта, которое может быть частично окклудировано, но по-прежнему ясно присутствует на изображении |
Высокая | Содержание, содержащее явное подробное изображение сексуальных органов и сексуальных актов, включая незаконные акты. В том числе:
|
Изображение участия в сексуальной деятельности с животными или трупами |
Уровни серьезности насилия
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но содержит связанные с насилием изображения, используемые в общем смысле. В том числе:
|
Изображение нереалистичного оружия и лезвийных инструментов |
Низкая | Содержимое, содержащее насилие, связанное с изображениями и действиями в реальном мире или вымышленных контекстах с низким горем. В том числе:
|
Изображение флагов ИГИЛ/Аль-Каиды |
Средняя | Содержимое, содержащее умеренное графическое насилие и насильственные акты, направленные на идентифицированный целевой объект. В том числе:
|
Изображение использования силы и принуждения агрессивно доминировать или запугать человека |
Высокая | Содержимое, содержащее явное подробное изображение насилия и насильственных действий в высоком горке. В том числе:
|
Изображение смерти при выполнении террористическими группами, определяемыми флагами и символами ИГИЛ |
Уровни серьезности самоповредения
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но содержит самоопасное изображение, используемое в общем смысле. В том числе:
|
Изображение прыжка с парашютом из плоскости |
Низкая | Содержимое, содержащее самоповреждение, связанное с изображением и действует в реальном мире или вымышленном контексте с низким гором. В том числе:
|
Представления действий, связанных с самовредностью, инструментами, травмами и эмоциональным состоянием |
Средняя | Содержимое, содержащее умеренное графическое изображение, связанное с самоубийцом и самоубийством. В том числе:
|
Представления об использовании силы и принуждения агрессивно доминировать или запугать человека в самовосхиждение |
Высокая | Содержимое, содержащее явное подробное изображение самоубийца и самоубийства в высоком горке. В том числе:
|
Изображение преднамеренного самоубийства, где человек совершил самоубийство, прыгнув с высоты здания |
Многомодальное (изображение с текстом) содержимое
Предупреждение
Вкладка "Определения серьезности" в этом документе содержит примеры вредного содержимого, которое может беспокоить некоторых читателей.
Уровни серьезности ненависти и справедливости
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но может содержать ненавидимый и справедливый текст и визуальные элементы, используемые в универсальных и безопасных контекстах, таких как:
|
Сценарий: изображение с наложением текста Изображение: Доброкачественная фотография человека СМС: Attends rally wearing sneakers |
Низкая | Содержимое, содержащее положительную характеризацию или защиту групп удостоверений, отображает дискриминацию, стереотипы и предрассудки, суждения, мнения или взгляды, связанные с речью ненависти или целевыми группами личности. К ним относятся:
|
Сценарий: изображение с наложением текста Изображение: Доброкачественная фотография человека СМС: Everyone assumes that I got high grades in math because I’m Asian. I did. Обоснование: подразумевает расовые стереотипы. |
Средняя | Содержимое, содержащее оскорбления, издевательства, запугивание, де-гуманизацию или дерогацию отдельных лиц или групп. К ним относятся:
|
Сценарий: изображение с наложением текста Изображение: Доброкачественная фотография человека с Паркинсоном СМС: This guy just Friended and Unfriended me 45 times in 15 seconds. Does anyone know him? Обоснование: подразумевает издевательство из-за инвалидности |
Высокая | Содержимое, содержащее речь о ненависти в качестве пропаганды, угрожающей или призывающей к насилию против групп удостоверений, радикализует, вербовцев или призывает людей присоединиться к экстремистским усилиям или распространить речь о ненависти. К ним относятся:
|
Сценарий: изображение и текст чередуются Never forget that everything [image of Adolf Hitler] did in Germany was legal. |
Уровни сексуальной серьезности
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но может содержать термины сексуального характера или визуальные элементы, используемые в универсальных и безопасных контекстах, таких как:
|
Сценарий: изображение с наложением текста Изображение: скунк СМС: Looks aren’t everything, be careful who you marry, and check your mirrors too. |
Низкая | Содержание, которое выражает предубежденные, сужденные или мнения мнения о сексуально связанных темах или упоминает сексуально связанные термины в вымышленном или реальном опыте, которые не являются чрезвычайно графическими. К ним относятся:
|
Сценарий: изображение и текст чередуются I hope they debate social issues I want [image of a person cupping their ear, representing "to hear"] about how a representative wants to regulate female sexual organs. |
Средняя | Содержимое, описывающее сексуальное возбуждение и активность в явных и графических терминах или визуальных элементах, включая фантазии о сексе и сексуальном насилии. К ним относятся:
|
Сценарий: изображение и текст чередуются There is so much [image containing the phrase "Sex and Violence"] in that book it could use a warning label in the cover. |
Высокая | Содержание, описывающее запрос сексуальных коммерческих услуг, содержащее подробные описания сексуальной активности, насильственных сексуальных злоупотреблений и изнасилований, а также неконсенсуальные обмены властью, злоупотребление и voyeurism. Это также включает в себя содержимое, которое используется для поощрения, одобрения или славы экстремальных или незаконных сексуальных актов. К ним относятся:
|
Сценарий: изображение и текст чередуются Can too much [image of graphic pornography] actually kill you? Evidently not, because you are still with us. |
Уровни серьезности насилия
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но может содержать термины и визуальные элементы, связанные с насилием, используемым в универсальных и безопасных контекстах, таких как:
|
Сценарий: изображение и текст чередуются [Image of lawnmower] can easily throw a [image of rock] to a distance well over 50 feet. |
Низкая | Содержимое в вымышленных контекстах (например, игры, литература, искусство), которые изображают насильственные или графические сцены без славения, одобрения или непреднамеренного. К ним относятся:
|
Сценарий: изображение с наложением текста Изображение: Доброкачественная фотография "занудного" человека СМС: Runs suicides at basketball practice. Dies. Обоснование: подразумевает исчерпание из-за отсутствия физических способностей человека. |
Средняя | Содержимое, содержащее графическое изображение насилия и смерти на средней интенсивности, а также фантазии о насильственных действиях или угрозах. К ним относятся:
|
Сценарий: изображение и текст чередуются She needs [image of a graphic that reads "to die"] already . |
Высокая | Содержание, содержащее террористическую или насильственные экстремистские пропаганду и насильственные идеологии в Интернете, описывающее, похвалы, поддерживает, поддерживает или прославляет убийства в рамках террористической деятельности, помогает террористическим организациям или причинам. К ним относятся:
|
Сценарий: изображение и текст чередуются I can’t wait for this [image of ISIS kafir beheading]. |
Уровни серьезности самоповредения
Степень серьезности | Description | Пример изображения |
---|---|---|
Safe | Содержимое безопасно, но может содержать термины или визуальные элементы, связанные с самоповредением, используемым в универсальных и безопасных контекстах, таких как:
|
Сценарий: изображение и текст чередуются How do I tie a [image of a rope]? |
Низкая | Содержимое, содержащее ссылки на персонажи планирования или совершения самоубийства в вымышленном контексте (например, литературы, фильмов) или содержит изображения актов самоповреждения или самоубийства с низкой интенсивностью. К ним относятся:
|
Сценарий: изображение с наложением текста Изображение: Кермит лягушки СМС: Life ain’t no good for a frog. Even tried to Kermit suicide. |
Средняя | Содержимое, которое высмеивает жертв или выживших в себе вреда, таких как расстройства питания или самоубийство, а также издевательства и запугивания, которые разжигают и способствуют самоповреждения актов. К ним относятся:
|
Сценарий: изображение с чередованием текста I will [image of a knife] myself soon. But until then, how do I tame my pain? |
Высокая | Содержимое, включающее исследования для консультаций или предоставляет инструкции и методы о том, как участвовать в самостоятельном вреде, что приводит к смерти или как совершить самоубийство, а также славить и одобрение самоубийства, или другие тяжелые типы самоповредения. К ним относятся:
|
Сценарий: изображение и текст чередуются Black Friday [image of self-harm with text "My self-harm cuts have nearly faded completely so they won’t scar"] and [image of a kitchen mixer] deals. |
Следующие шаги
Следуйте краткому руководству, чтобы приступить к работе с безопасностью содержимого ИИ Azure в приложении.
Обратная связь
Были ли сведения на этой странице полезными?