ChatCerebras

ChatCerebras ๋…ธ๋“œ๋Š” Cerebras Systems์—์„œ ์ œ๊ณตํ•˜๋Š” Llama ๊ณ„์—ด ๋ชจ๋ธ์„ ํ˜ธ์ถœํ•˜๋Š” Chat Model ๋…ธ๋“œ์ž…๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ์—ฐ์‚ฐ ์ตœ์ ํ™”์™€ ๊ณ ์† ์‘๋‹ต์„ ๊ฐ•์ ์œผ๋กœ ํ•˜๋ฉฐ, ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜์˜ ๊ฒฝ๋Ÿ‰ยท๊ณ ์† ์ถ”๋ก ์šฉ LLM ์„œ๋น„์Šค๋ฅผ ๋น ๋ฅด๊ฒŒ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


์ฃผ์š” ๊ธฐ๋Šฅ

  • Cerebras์˜ Llama ๊ธฐ๋ฐ˜ ๋ชจ๋ธ(llama3.1-8b ๋“ฑ) ํ˜ธ์ถœ ๊ฐ€๋Šฅ

  • Top-P, Penalty ๋“ฑ ๋‹ค์–‘ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ†ตํ•œ ์‘๋‹ต ์ œ์–ด ์ง€์›

  • Streaming ์‘๋‹ต ์ˆ˜์‹  ๊ฐ€๋Šฅ

  • BasePath, Timeout ๋“ฑ ๊ณ ๊ธ‰ ์„ค์ •์œผ๋กœ ์„ธ๋ฐ€ํ•œ API ์ œ์–ด ๊ฐ€๋Šฅ

  • ๋น„์šฉ ํšจ์œจ์„ฑ๊ณผ ์‘๋‹ต ์†๋„์— ์ตœ์ ํ™”๋œ ํด๋ผ์šฐ๋“œ LLM ํ˜ธ์ถœ ๊ตฌ์กฐ

WindyFlo ChatCerebras
WindyFlo ChatCerebras Parameters

์ž…๋ ฅ๊ฐ’ (Inputs)

ํ•ญ๋ชฉ
์„ค๋ช…
ํ•„์ˆ˜ ์—ฌ๋ถ€

Connect Credential

Cerebras API Key๋ฅผ ํฌํ•จํ•œ Credential์— ๋“ฑ๋ก๋œ ์ธ์ฆ ์ •๋ณด

ํ•„์ˆ˜

Model Name

์‚ฌ์šฉํ•  ๋ชจ๋ธ ์ด๋ฆ„ (์˜ˆ: llama3.1-8b)

ํ•„์ˆ˜

Temperature

์ฐฝ์˜์„ฑ ์กฐ์ ˆ ๊ฐ’ (0.0 ~ 1.0, ๊ธฐ๋ณธ๊ฐ’: 0.9)

์„ ํƒ


ํŒŒ๋ผ๋ฏธํ„ฐ (Parameters)

ํ•ญ๋ชฉ
์„ค๋ช…

Streaming

์‘๋‹ต์„ ์ŠคํŠธ๋ฆฌ๋ฐ์œผ๋กœ ๋ฐ›์„์ง€ ์—ฌ๋ถ€ (๊ธฐ๋ณธ๊ฐ’: true)

Max Tokens

์ถœ๋ ฅ ์ตœ๋Œ€ ํ† ํฐ ์ˆ˜ ์ œํ•œ

Top Probability

Top-P ํ™•๋ฅ  ์ƒ˜ํ”Œ๋ง ๊ฐ’

Frequency Penalty

๋™์ผ ๋‹จ์–ด ๋ฐ˜๋ณต ์–ต์ œ ๊ณ„์ˆ˜ (-2.0 ~ 2.0)

Presence Penalty

์ƒˆ๋กœ์šด ์ฃผ์ œ ์œ ๋„ ๊ณ„์ˆ˜ (-2.0 ~ 2.0)

Timeout

์š”์ฒญ ์ œํ•œ ์‹œ๊ฐ„(ms)

BasePath

API ํ˜ธ์ถœ ๊ฒฝ๋กœ (๊ธฐ๋ณธ๊ฐ’: https://api.cerebras.ai/v1)

BaseOptions

์ถ”๊ฐ€ API ์˜ต์…˜ (JSON ํ˜•ํƒœ)


์ถœ๋ ฅ๊ฐ’ (Outputs)

์ถœ๋ ฅ ํ•ญ๋ชฉ
์„ค๋ช…

ChatCerebras

Cerebras ๋ชจ๋ธ์˜ ์‘๋‹ต ๋˜๋Š” ์ŠคํŠธ๋ฆฌ๋ฐ ๊ฐ์ฒด


ํ™œ์šฉ ์˜ˆ์‹œ

  • ๋น ๋ฅธ ์ถ”๋ก  ์†๋„๊ฐ€ ํ•„์š”ํ•œ ์„œ๋น„์Šคํ˜• API ๊ธฐ๋ฐ˜ ์‘๋‹ต ์‹œ์Šคํ…œ ๊ตฌ์ถ• (์˜ˆ: ์‹ค์‹œ๊ฐ„ ์š”์•ฝ, ๋‹ต๋ณ€ ์ƒ์„ฑ ๋“ฑ)

  • Llama ๊ณ„์—ด ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ๋น„์šฉ ํšจ์œจํ˜• ์ฑ—๋ด‡ ์‹œ์Šคํ…œ ๊ตฌ์ถ• (OpenAI ๋Œ€๋น„ ์ €๋น„์šฉ ์šด์˜ ๊ฐ€๋Šฅ)

  • ์‘๋‹ต ์ œ์–ด ์„ค์ •์ด ์ค‘์š”ํ•œ ์‚ฌ์šฉ์ž ๋งž์ถคํ˜• ์ธํ„ฐ๋ž™์…˜ ์‹œ์Šคํ…œ์— ์ ์šฉ (์˜ˆ: ์ƒ๋‹ด, ์ฝ˜ํ…์ธ  ์ถ”์ฒœ)

  • ์‚ฌ๋‚ด ๋ณด์•ˆ๋ง ์™ธ๋ถ€์—์„œ API ์—ฐ๋™ ๊ธฐ๋ฐ˜์œผ๋กœ LLM ์„ฑ๋Šฅ ํ…Œ์ŠคํŠธ๋ฅผ ์ง„ํ–‰ํ•˜๊ณ  ์‹ถ์€ ๊ฒฝ์šฐ


์‚ฌ์šฉ ํŒ

  • Llama ๋ชจ๋ธ ๊ธฐ๋ฐ˜์ด๋ฏ€๋กœ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ(gpt-4 ๋“ฑ)์— ๋น„ํ•ด ์†๋„๊ฐ€ ๋น ๋ฅด๊ณ  ๋น„์šฉ์ด ๋‚ฎ์Œ

  • Streaming ํ™œ์„ฑํ™” ์‹œ ์‘๋‹ต ์ฒด๊ฐ ์†๋„ ํ–ฅ์ƒ ๊ฐ€๋Šฅ

  • Top-P, Frequency Penalty ๋“ฑ์„ ํ•จ๊ป˜ ์กฐ์ ˆํ•˜๋ฉด ๋ฐ˜๋ณต ๋˜๋Š” ๊ณผ๋„ํ•œ ์‘๋‹ต์„ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ์Œ


์ฃผ์˜์‚ฌํ•ญ

  • Cerebras API ์‚ฌ์šฉ์„ ์œ„ํ•ด ๋ณ„๋„ ํ‚ค ๋ฐœ๊ธ‰ ๋ฐ ์‚ฌ์šฉ ๊ถŒํ•œ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค

  • ๋ชจ๋ธ ์ด๋ฆ„์€ ์ œ๊ณต๋œ ํ˜•์‹(์˜ˆ: llama3.1-8b)์„ ๊ทธ๋Œ€๋กœ ์ž…๋ ฅํ•ด์•ผ ํ•˜๋ฉฐ ๋ณ€๊ฒฝ ๋ถˆ๊ฐ€

  • API Timeout, BasePath ๋“ฑ ์„ค์ •์ด ์ž˜๋ชป๋  ๊ฒฝ์šฐ ํ˜ธ์ถœ ์‹คํŒจ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์œผ๋ฏ€๋กœ ๋ฐ˜๋“œ์‹œ ๊ฒ€ํ† ํ•  ๊ฒƒ

  • ๊ณ ๋นˆ๋„ ํ˜ธ์ถœ ์‹œ ์š”๊ธˆ ์ •์ฑ…๊ณผ ์ œํ•œ ์กฐ๊ฑด์„ ์‚ฌ์ „ ํ™•์ธํ•ด์•ผ ํ•จ

Last updated