ChatCerebras
ChatCerebras ๋ ธ๋๋ Cerebras Systems์์ ์ ๊ณตํ๋ Llama ๊ณ์ด ๋ชจ๋ธ์ ํธ์ถํ๋ Chat Model ๋ ธ๋์ ๋๋ค. ๋๊ท๋ชจ ์ฐ์ฐ ์ต์ ํ์ ๊ณ ์ ์๋ต์ ๊ฐ์ ์ผ๋ก ํ๋ฉฐ, ํด๋ผ์ฐ๋ ๊ธฐ๋ฐ์ ๊ฒฝ๋ยท๊ณ ์ ์ถ๋ก ์ฉ LLM ์๋น์ค๋ฅผ ๋น ๋ฅด๊ฒ ์ฐ๊ฒฐํ ์ ์์ต๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
Cerebras์ Llama ๊ธฐ๋ฐ ๋ชจ๋ธ(llama3.1-8b ๋ฑ) ํธ์ถ ๊ฐ๋ฅ
Top-P, Penalty ๋ฑ ๋ค์ํ ํ๋ผ๋ฏธํฐ๋ฅผ ํตํ ์๋ต ์ ์ด ์ง์
Streaming ์๋ต ์์ ๊ฐ๋ฅ
BasePath, Timeout ๋ฑ ๊ณ ๊ธ ์ค์ ์ผ๋ก ์ธ๋ฐํ API ์ ์ด ๊ฐ๋ฅ
๋น์ฉ ํจ์จ์ฑ๊ณผ ์๋ต ์๋์ ์ต์ ํ๋ ํด๋ผ์ฐ๋ LLM ํธ์ถ ๊ตฌ์กฐ


์
๋ ฅ๊ฐ (Inputs)
Connect Credential
Cerebras API Key๋ฅผ ํฌํจํ Credential์ ๋ฑ๋ก๋ ์ธ์ฆ ์ ๋ณด
ํ์
Model Name
์ฌ์ฉํ ๋ชจ๋ธ ์ด๋ฆ (์: llama3.1-8b)
ํ์
Temperature
์ฐฝ์์ฑ ์กฐ์ ๊ฐ (0.0 ~ 1.0, ๊ธฐ๋ณธ๊ฐ: 0.9)
์ ํ
ํ๋ผ๋ฏธํฐ (Parameters)
Streaming
์๋ต์ ์คํธ๋ฆฌ๋ฐ์ผ๋ก ๋ฐ์์ง ์ฌ๋ถ (๊ธฐ๋ณธ๊ฐ: true)
Max Tokens
์ถ๋ ฅ ์ต๋ ํ ํฐ ์ ์ ํ
Top Probability
Top-P ํ๋ฅ ์ํ๋ง ๊ฐ
Frequency Penalty
๋์ผ ๋จ์ด ๋ฐ๋ณต ์ต์ ๊ณ์ (-2.0 ~ 2.0)
Presence Penalty
์๋ก์ด ์ฃผ์ ์ ๋ ๊ณ์ (-2.0 ~ 2.0)
Timeout
์์ฒญ ์ ํ ์๊ฐ(ms)
BasePath
API ํธ์ถ ๊ฒฝ๋ก (๊ธฐ๋ณธ๊ฐ: https://api.cerebras.ai/v1)
BaseOptions
์ถ๊ฐ API ์ต์ (JSON ํํ)
์ถ๋ ฅ๊ฐ (Outputs)
ChatCerebras
Cerebras ๋ชจ๋ธ์ ์๋ต ๋๋ ์คํธ๋ฆฌ๋ฐ ๊ฐ์ฒด
ํ์ฉ ์์
๋น ๋ฅธ ์ถ๋ก ์๋๊ฐ ํ์ํ ์๋น์คํ API ๊ธฐ๋ฐ ์๋ต ์์คํ ๊ตฌ์ถ (์: ์ค์๊ฐ ์์ฝ, ๋ต๋ณ ์์ฑ ๋ฑ)
Llama ๊ณ์ด ๋ชจ๋ธ์ ํ์ฉํ ๋น์ฉ ํจ์จํ ์ฑ๋ด ์์คํ ๊ตฌ์ถ (OpenAI ๋๋น ์ ๋น์ฉ ์ด์ ๊ฐ๋ฅ)
์๋ต ์ ์ด ์ค์ ์ด ์ค์ํ ์ฌ์ฉ์ ๋ง์ถคํ ์ธํฐ๋์ ์์คํ ์ ์ ์ฉ (์: ์๋ด, ์ฝํ ์ธ ์ถ์ฒ)
์ฌ๋ด ๋ณด์๋ง ์ธ๋ถ์์ API ์ฐ๋ ๊ธฐ๋ฐ์ผ๋ก LLM ์ฑ๋ฅ ํ ์คํธ๋ฅผ ์งํํ๊ณ ์ถ์ ๊ฒฝ์ฐ
์ฌ์ฉ ํ
Llama ๋ชจ๋ธ ๊ธฐ๋ฐ์ด๋ฏ๋ก ๋๊ท๋ชจ ๋ชจ๋ธ(gpt-4 ๋ฑ)์ ๋นํด ์๋๊ฐ ๋น ๋ฅด๊ณ ๋น์ฉ์ด ๋ฎ์
Streaming ํ์ฑํ ์ ์๋ต ์ฒด๊ฐ ์๋ ํฅ์ ๊ฐ๋ฅ
Top-P, Frequency Penalty ๋ฑ์ ํจ๊ป ์กฐ์ ํ๋ฉด ๋ฐ๋ณต ๋๋ ๊ณผ๋ํ ์๋ต์ ๋ฐฉ์งํ ์ ์์
์ฃผ์์ฌํญ
Cerebras API ์ฌ์ฉ์ ์ํด ๋ณ๋ ํค ๋ฐ๊ธ ๋ฐ ์ฌ์ฉ ๊ถํ์ด ํ์ํฉ๋๋ค
๋ชจ๋ธ ์ด๋ฆ์ ์ ๊ณต๋ ํ์(์: llama3.1-8b)์ ๊ทธ๋๋ก ์ ๋ ฅํด์ผ ํ๋ฉฐ ๋ณ๊ฒฝ ๋ถ๊ฐ
API Timeout, BasePath ๋ฑ ์ค์ ์ด ์๋ชป๋ ๊ฒฝ์ฐ ํธ์ถ ์คํจ ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฏ๋ก ๋ฐ๋์ ๊ฒํ ํ ๊ฒ
๊ณ ๋น๋ ํธ์ถ ์ ์๊ธ ์ ์ฑ ๊ณผ ์ ํ ์กฐ๊ฑด์ ์ฌ์ ํ์ธํด์ผ ํจ
Last updated