OpenAI Moderation
OpenAI Moderation ๋ ธ๋๋ OpenAI์ ์ฝํ ์ธ ๋ชจ๋๋ ์ด์ API๋ฅผ ํธ์ถํ์ฌ ์ ๋ ฅ๋ ๋ฌธ์ฅ์ ์ ์ฑ ์๋ฐ ์ฌ๋ถ๋ฅผ ์๋์ผ๋ก ๊ฒ์ฌํ๋ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค. ์ฌ์ฉ์์ ์ ๋ ฅ๊ฐ์ด ๋ฏผ๊ฐํ๊ฑฐ๋ ๋ถ์ ์ ํ ์ ์๋ ๊ฒฝ์ฐ, ์ฌ์ ํํฐ๋ง์ ์ํ ์ ์ฒ๋ฆฌ ์ฉ๋๋ก ํ์ฉ๋ฉ๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
OpenAI์ ์ ์ฑ ์๋ฐ ์ฌ๋ถ๋ฅผ ์๋ ๊ฐ์ง
์ ๋ ฅ๊ฐ์ด ์ํ ๋๋ ๋ถ์ ์ ํ ๊ฒฝ์ฐ ์ฌ์ฉ์ ์ ์ ๋ฉ์์ง ๋ฐํ
Agent ๋๋ LLM ์คํ ์ ์ ํํฐ๋ง ๋จ๊ณ๋ก ํ์ฉ ๊ฐ๋ฅ
๋ค์ํ ์๋ํ ์๋๋ฆฌ์ค์ ์ฝํ ์ธ ์์ ์ฑ ํ๋ณด ์๋จ์ผ๋ก ์ ์ฉ

์
๋ ฅ๊ฐ (Inputs)
Connect Credential
OpenAI API ์ธ์ฆ ์ ๋ณด (Credential์ ๋ฑ๋ก ํ์)
ํ์
ํ๋ผ๋ฏธํฐ (Parameters)
Error Message
์ ์ฑ
์๋ฐ ์ ์ฌ์ฉ์์๊ฒ ๋ฐํํ ์ปค์คํ
๋ฉ์์ง (์: "Cannot Process! Input violates OpenAIโs content moderation policies.")
์ถ๋ ฅ๊ฐ (Outputs)
Moderation
๋ชจ๋๋ ์ด์ ๊ฒฐ๊ณผ ๊ฐ์ฒด (์๋ฐ ์ฌ๋ถ, ๋ฒ์ฃผ ๋ฑ ํฌํจ)
ํ์ฉ ์์
์ฑ๋ด ๋๋ ์์ด์ ํธ์์ ์ฌ์ฉ์ ์ ๋ ฅ์ ์ฌ์ ๊ฒ์ดํ์ฌ ๋ถ์ ์ ๋ฐํ ์ฐจ๋จ
LLM ์๋ต ์ ์ฒ๋ฆฌ ๋๋ ํ์ฒ๋ฆฌ ํ๋ฆ์ ์์ ์ฑ ๋ณด์ฅ์ ์ํ ๋ชจ๋๋ก ์ฝ์
์ฌ์ฉ์ ์์ฑ ์ฝํ ์ธ (UGC) ์ ๋ก๋ ์ ์๋ ํํฐ๋ง ๋ก์ง ๊ตฌ์ฑ
๋น์์ด๋ ๋ฏผ๊ฐ ์ ๋ณด ํฌํจ ์ฌ๋ถ ๊ฒ์ถ์ด ํ์ํ ๊ณ ๊ฐ ์๋น์ค ์๋๋ฆฌ์ค
์ฌ์ฉ ํ
Error Message๋ ์ฌ์ฉ์ ์นํ์ ๋ฌธ๊ตฌ๋ก ์ค์ ํ์ฌ UX ํ์ง์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
ํ ํฐ ๋น์ฉ์ ์ ๊ฐํ๊ธฐ ์ํด Moderation ๋ ธ๋๋ LLM ํธ์ถ ์ ์ ์ฌ์ฉํ๋ ๊ฒ์ด ํจ์จ์ ์ ๋๋ค.
์ ์ฑ ์๋ฐ ์ฌ๋ถ๋ฅผ ๊ธฐ์ค์ผ๋ก IfElseFunction๊ณผ ์ฐ๊ณํ์ฌ ํ๋ฆ ์ ์ด๋ ๊ฐ๋ฅํฉ๋๋ค.
์ฃผ์์ฌํญ
Connect Credential์ด ๋๋ฝ๋๋ฉด API ํธ์ถ์ด ๋ถ๊ฐ๋ฅํ๋ฉฐ ์ค๋ฅ๊ฐ ๋ฐ์ํฉ๋๋ค.
OpenAI์ ์ ์ฑ ๋ฒ์ฃผ๋
hate,self-harm,sexual,violence๋ฑ์ด๋ฉฐ, ๋ฏผ๊ฐ๋๋ ๋ค์ ๋์ ์ ์์ต๋๋ค.ํด๋น ๋ ธ๋๋ ์ ๋ ฅ์ ํํฐ๋งํ ๋ฟ, ์ถ๋ ฅ ๋ด์ฉ์ ๊ฒ์ดํ๋ ๊ธฐ๋ฅ์ ์ ๊ณตํ์ง ์์ต๋๋ค.
Output ๊ฒฐ๊ณผ๋ JSON ๊ฐ์ฒด ํํ์ด๋ฉฐ, ํ์ ๋ ธ๋์์ ์ง์ ํ์ฑํ๊ฑฐ๋ ์กฐ๊ฑด ๋ถ๊ธฐ ๋ ธ๋์ ์ฐ๋ํด์ผ ํฉ๋๋ค.
Last updated