ChatHuggingFace
ChatHuggingFace ๋ ธ๋๋ Hugging Face Inference API๋ฅผ ํตํด ๋ค์ํ ์คํ์์ค ๋ํํ ๋ชจ๋ธ(GPT, LLaMA ๋ฑ)์ ํธ์ถํ๋ Chat Model ๋ ธ๋์ ๋๋ค. API ํค๋ง์ผ๋ก ์ ์ํ๊ฒ ์ธ๋ถ ๋ชจ๋ธ์ ์ฐ๊ฒฐํ ์ ์์ด, ์ ์ฐํ ํ ์คํธ์ ๋น์ฉ ํจ์จ์ ์ธ ์๋น์ค ์ค๊ณ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
Hugging Face์ ํธ์คํ ๋ชจ๋ธ(gpt ๋ฑ)์ ํธ์ถํ์ฌ ์๋ต ์์ฑ
Endpoint์ API Key ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋จํ๊ฒ ๋ชจ๋ธ ์ฐ๊ฒฐ ๊ฐ๋ฅ
Temperature, Top-K, Stop Sequence ๋ฑ ๋ค์ํ ์์ฑ ์ ์ด ์ต์ ์ ๊ณต
์ฌ์ฉ์ ์ ์ Stop Sequence๋ก ์๋ต ์ข ๋ฃ ์กฐ๊ฑด ์ค์ ๊ฐ๋ฅ
์ ๋น์ฉ ํ ์คํธ์ฉ ๋๋ ์คํ์ ์คํ๋ชจ๋ธ ์ ์ฉ์ ์ ํฉ


์
๋ ฅ๊ฐ (Inputs)
Connect Credential
Hugging Face API Key (Credential์ ๋ฑ๋ก๋ ๊ฐ)
ํ์
Model
์ฌ์ฉํ ๋ชจ๋ธ๋ช (์: gpt2, mistralai/Mixtral-8x7B ๋ฑ)
ํ์
Endpoint
Inference Endpoint URL (์๋ ์์ฑ๋จ, ๋ณ๋ ์ ๋ ฅ ๋ถํ์)
์ ํ
ํ๋ผ๋ฏธํฐ (Parameters)
Temperature
์๋ต ์ฐฝ์์ฑ ์กฐ์ ๊ฐ (0.0 ~ 1.0)
Max Tokens
์์ฑํ ์ต๋ ํ ํฐ ์
Top Probability
Top-P ์ํ๋ง ํ๋ฅ ๊ฐ
Top K
Top-K ์ํ๋ง ํ๋ณด ์
Frequency Penalty
์ค๋ณต ์ดํ ๊ฐ์ ๊ณ์
Stop Sequence
์๋ต ์ข ๋ฃ ๊ธฐ์ค ๋ฌธ์์ด ๋๋ ํจํด (์: โAI:โ, โ\nUser:โ)
์ถ๋ ฅ๊ฐ (Outputs)
ChatHuggingFace
Hugging Face ๋ชจ๋ธ์ ์๋ต ๋๋ ํ ์คํธ ๊ฒฐ๊ณผ
ํ์ฉ ์์
gpt2 ๋๋ Mistral ๊ณ์ด ๋ชจ๋ธ์ ํ ์คํธ ํ๊ฒฝ์์ ๋น ๋ฅด๊ฒ ํธ์ถํ์ฌ ์๋ต ํ์ง ๊ฒ์ฆ
Hugging Face์์๋ง ์ ๊ณต๋๋ ํนํ ๋ชจ๋ธ ํ์ฉ (์: ์๋ฃ, ๋ฒ๋ฅ ๋ฑ ๋๋ฉ์ธ ๋ชจ๋ธ)
์๋ต ์ ์ด ํ๋ผ๋ฏธํฐ๋ฅผ ์ธ๋ฐํ๊ฒ ์กฐ์ ํ์ฌ ์ฝํ ์ธ ์์ฑ์ฉ ์ด์์คํดํธ ํ๋กํ ํ์ ๊ตฌํ
๊ฐ๊ฒฉ ๋ถ๋ด ์๋ ์คํ์ ์ฑ๋ด ๊ธฐ๋ฅ์ MVP ์๋น์ค์ ํ์ฌ
์ฌ์ฉ ํ
Stop Sequence๋ฅผ ํ์ฉํ๋ฉด ๋ชจ๋ธ์ด ๋ถํ์ํ ์๋ต์ ์ด์ด๊ฐ์ง ์๋๋ก ์ ์ดํ ์ ์์
Top-K์ Top-P๋ฅผ ๋์์ ์ค์ ํ๋ฉด ์๋ต ๋ค์์ฑ๊ณผ ์์ ์ฑ์ ๊ท ํ ์๊ฒ ์ ์ง ๊ฐ๋ฅ
Hugging Face์ ๋ฑ๋ก๋ ์ต์ ๋ชจ๋ธ๋ช ์ ์ง์ ์ ๋ ฅํ์ฌ ์ปค์คํ ์คํ ๊ฐ๋ฅ
์ฃผ์์ฌํญ
Hugging Face API Key๋ ์ ๋ฃ ์๊ธ์ ์ ๋ฐ๋ผ ํธ์ถ๋ ์ ํ์ด ์กด์ฌํ๋ฉฐ, ํ ํฐ๋น ๊ณผ๊ธ์ ์ฃผ์ํด์ผ ํจ
๊ณต๊ฐ๋ ๋ชจ๋ธ ์ค ์ผ๋ถ๋ ์๋ต ์ง์ฐ์ด ๋ฐ์ํ๊ฑฐ๋ ํ์ง์ด ๋ถ์์ ํ ์ ์์
Endpoint๋ ์๋ ์์ฑ๋๋ฉฐ ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ์์ ์ด ๋ถํ์ํ๋, Private Model ํธ์ถ ์ ๋ณ๋ ์ค์ ํ์
Stop Sequence๋ฅผ ์ค์ ํ์ง ์์ผ๋ฉด ์๋ต์ด ๊ณผ๋ํ๊ฒ ๊ธธ์ด์ง ์ ์์
Last updated