ChatLocalAI

ChatLocalAI ๋…ธ๋“œ๋Š” ๋กœ์ปฌ ์„œ๋ฒ„์— ๋ฐฐํฌ๋œ LLM ๋ชจ๋ธ์„ ์ง์ ‘ ํ˜ธ์ถœํ•˜๋Š” Chat Model ๋…ธ๋“œ์ž…๋‹ˆ๋‹ค. OpenLLM, GPT4All, LLaMA ๋“ฑ ๋‹ค์–‘ํ•œ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์„ ๋‚ด๋ถ€ ๋„คํŠธ์›Œํฌ์—์„œ ์‹คํ–‰ํ•˜๊ณ ์ž ํ•  ๋•Œ ์œ ์šฉํ•˜๋ฉฐ, ๋น„์šฉ ๋ถ€๋‹ด ์—†์ด ๋…๋ฆฝ์  ํ™˜๊ฒฝ์—์„œ ์ž์œ ๋กญ๊ฒŒ ์‹คํ—˜์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.


์ฃผ์š” ๊ธฐ๋Šฅ

  • ๋กœ์ปฌ ํ™˜๊ฒฝ(Localhost)์—์„œ ๊ตฌ๋™ ์ค‘์ธ LLM ๋ชจ๋ธ ํ˜ธ์ถœ

  • Base Path ๋ฐ ๋ชจ๋ธ ํŒŒ์ผ๋ช…์„ ์ง์ ‘ ์ง€์ •ํ•˜์—ฌ ์œ ์—ฐํ•œ ์„ค์ • ๊ฐ€๋Šฅ

  • Temperature, Top-P ๋“ฑ ์‘๋‹ต ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ง€์›

  • Streaming ์‘๋‹ต ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ

  • ์™ธ๋ถ€ API ๋น„์šฉ ์—†์ด ๋…๋ฆฝํ˜• LLM ํ™˜๊ฒฝ ์šด์˜ ๊ฐ€๋Šฅ

WindyFlo ChatLocalAI
WindyFlo ChatLocalAI Parameters

์ž…๋ ฅ๊ฐ’ (Inputs)

ํ•ญ๋ชฉ
์„ค๋ช…
ํ•„์ˆ˜ ์—ฌ๋ถ€

Connect Credential

API Key ๋˜๋Š” ๋กœ์ปฌ ์„œ๋ฒ„ ์ธ์ฆ ์ •๋ณด (Credential์— ๋“ฑ๋ก๋œ ๊ฐ’)

์„ ํƒ

Base Path

LLM API๊ฐ€ ์‹คํ–‰ ์ค‘์ธ ๋กœ์ปฌ ์„œ๋ฒ„ ์ฃผ์†Œ (์˜ˆ: http://localhost:8080/v1arrow-up-right)

ํ•„์ˆ˜

Model Name

์‹คํ–‰ ์ค‘์ธ ๋กœ์ปฌ ๋ชจ๋ธ ํŒŒ์ผ๋ช… (์˜ˆ: gpt4all-lora-quantized.bin)

ํ•„์ˆ˜

Temperature

์‘๋‹ต์˜ ์ฐฝ์˜์„ฑ ์กฐ์ ˆ ๊ฐ’ (0.0 ~ 1.0, ๊ธฐ๋ณธ๊ฐ’: 0.9)

์„ ํƒ


ํŒŒ๋ผ๋ฏธํ„ฐ (Parameters)

ํ•ญ๋ชฉ
์„ค๋ช…

Streaming

์‹ค์‹œ๊ฐ„ ์‘๋‹ต ์ŠคํŠธ๋ฆฌ๋ฐ ์—ฌ๋ถ€ (๊ธฐ๋ณธ๊ฐ’: true)

Max Tokens

์‘๋‹ต ์ตœ๋Œ€ ํ† ํฐ ์ˆ˜ ์ œํ•œ

Top Probability

Top-P ํ™•๋ฅ  ๊ธฐ๋ฐ˜ ์ƒ˜ํ”Œ๋ง ๊ฐ’

Timeout

API ์‘๋‹ต ์ œํ•œ ์‹œ๊ฐ„(ms)


์ถœ๋ ฅ๊ฐ’ (Outputs)

์ถœ๋ ฅ ํ•ญ๋ชฉ
์„ค๋ช…

ChatLocalAI

๋กœ์ปฌ ์„œ๋ฒ„ LLM์˜ ์‘๋‹ต ํ…์ŠคํŠธ ๋˜๋Š” ์ŠคํŠธ๋ฆฌ๋ฐ ๊ฐ์ฒด


ํ™œ์šฉ ์˜ˆ์‹œ

  • ๋ณด์•ˆ ํ™˜๊ฒฝ์—์„œ ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด ์‚ฌ๋‚ด ๋ฌธ์„œ ๊ธฐ๋ฐ˜ ์‘๋‹ต ์‹œ์Šคํ…œ ๊ตฌ์ถ• (์˜ˆ: ๋‚ด๋ถ€ ์ƒ๋‹ด ์ฑ—๋ด‡)

  • LLM ์‹คํ—˜์šฉ ๋กœ์ปฌ ์„œ๋ฒ„๋ฅผ ๊ตฌ์ถ•ํ•˜์—ฌ ๋ชจ๋ธ ์„ฑ๋Šฅ ๋น„๊ต ๋ฐ Prompt ์ตœ์ ํ™” ํ…Œ์ŠคํŠธ

  • ๋น„์šฉ ์—†์ด ์šด์˜ ๊ฐ€๋Šฅํ•œ ๊ฐœ์ธ ํ”„๋กœ์ ํŠธ ๋˜๋Š” ์‚ฌ๋‚ด MVP ์ฑ—๋ด‡ ๊ฐœ๋ฐœ

  • GPU ๋˜๋Š” CPU ํ™˜๊ฒฝ์—์„œ ๋กœ์ปฌ LLM ์‹คํ–‰ ํ›„ WindyFlo๋ฅผ ํ†ตํ•ด ์›Œํฌํ”Œ๋กœ์šฐ์— ์—ฐ๋™


์‚ฌ์šฉ ํŒ

  • Base Path๋Š” ์‹ค์ œ API๊ฐ€ ์—ด๋ ค ์žˆ๋Š” ํฌํŠธ ๋ฐ ๊ฒฝ๋กœ์™€ ์ •ํ™•ํžˆ ์ผ์น˜ํ•ด์•ผ ํ•จ (์˜ˆ: /v1/chat/completions)

  • Model Name์€ gpt4all, llama.cpp ๋“ฑ์—์„œ ์‹ค์ œ ๋กœ๋”ฉ๋œ ๋ชจ๋ธ ํŒŒ์ผ๋ช…์„ ์ •ํ™•ํžˆ ์ž…๋ ฅํ•ด์•ผ ํ•จ

  • Top Probability ๊ฐ’์„ 0.9 ์ดํ•˜๋กœ ์„ค์ •ํ•˜๋ฉด ์‘๋‹ต์˜ ์ง‘์ค‘๋„๋ฅผ ๋†’์ผ ์ˆ˜ ์žˆ์Œ

  • Streaming์„ ํ™œ์šฉํ•˜๋ฉด ์‘๋‹ต ์†๋„ ์ฒด๊ฐ์ด ํ–ฅ์ƒ๋˜๋ฉฐ, ๋Œ€ํ™”ํ˜• ์ธํ„ฐํŽ˜์ด์Šค์— ์ ํ•ฉํ•จ


์ฃผ์˜์‚ฌํ•ญ

  • ํ•ด๋‹น ๋…ธ๋“œ๋Š” ๋กœ์ปฌ ์„œ๋ฒ„๊ฐ€ ์ด๋ฏธ ์‹คํ–‰ ์ค‘์ด์–ด์•ผ ํ•˜๋ฉฐ, API ์ŠคํŽ™(gpt4all, llama.cpp ๋“ฑ)์„ ๋”ฐ๋ผ์•ผ ํ•ฉ๋‹ˆ๋‹ค

  • ๋ชจ๋ธ ์‹คํ–‰ ์ค‘ ๋ฆฌ์†Œ์Šค ๋ถ€์กฑ(GPU, ๋ฉ”๋ชจ๋ฆฌ ๋“ฑ)์œผ๋กœ ์ธํ•œ ์‹œ๊ฐ„ ์ดˆ๊ณผ๋‚˜ ์‘๋‹ต ์‹คํŒจ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ

  • ๋กœ์ปฌ ํ™˜๊ฒฝ์—์„œ๋Š” ์ธ์ฆ ์„ค์ •์ด ํ•„์ˆ˜๊ฐ€ ์•„๋‹ˆ์ง€๋งŒ, ๊ณต์œ  ํ™˜๊ฒฝ์—์„œ๋Š” Credential ์„ค์ •์„ ๊ถŒ์žฅํ•จ

  • Base Path ์„ค์ • ์˜ค๋ฅ˜ ๋˜๋Š” ๋ฐฉํ™”๋ฒฝ ์„ค์ •์œผ๋กœ ์ธํ•ด ์—ฐ๊ฒฐ ์‹คํŒจ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ

Last updated