Ollama Embeddings

Ollama Embeddings ๋…ธ๋“œ๋Š” ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ์ค‘์ธ Ollama ์„œ๋ฒ„๋ฅผ ํ†ตํ•ด ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ํ˜ธ์ถœํ•˜์—ฌ ํ…์ŠคํŠธ๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๋…ธ๋“œ์ž…๋‹ˆ๋‹ค. ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด ๋กœ์ปฌ ํ™˜๊ฒฝ์—์„œ ์ž„๋ฒ ๋”ฉ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅํ•˜๋ฉฐ, GPU ๋ฐ Thread ์„ค์ •์„ ํ†ตํ•ด ์„ฑ๋Šฅ์„ ์œ ์—ฐํ•˜๊ฒŒ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


์ฃผ์š” ๊ธฐ๋Šฅ

  • Ollama ์„œ๋ฒ„๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ(llama2 ๋“ฑ) ํ˜ธ์ถœ ๊ฐ€๋Šฅ

  • ๋กœ์ปฌ ํ™˜๊ฒฝ์—์„œ ๋ฒกํ„ฐ ์ƒ์„ฑ โ†’ ๊ฐœ์ธ์ •๋ณด ์œ ์ถœ ์šฐ๋ ค ์—†๋Š” ํ์‡„๋ง ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ

  • GPU ๊ฐœ์ˆ˜, Thread ์ˆ˜, MMAP ์—ฌ๋ถ€ ๋“ฑ ์„ฑ๋Šฅ ํŠœ๋‹ ํŒŒ๋ผ๋ฏธํ„ฐ ์ œ๊ณต

  • ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ ๊ธฐ๋ฐ˜์œผ๋กœ ๋น ๋ฅด๊ณ  ๋น„์šฉ ์—†๋Š” ์ž„๋ฒ ๋”ฉ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ

WindyFlo Ollama Embeddings
WindyFlo Ollama Embeddings Parameters

์ž…๋ ฅ๊ฐ’ (Inputs)

ํ•ญ๋ชฉ
์„ค๋ช…
ํ•„์ˆ˜ ์—ฌ๋ถ€

Base URL

Ollama ์„œ๋ฒ„์˜ API ์ฃผ์†Œ (์˜ˆ: http://localhost:11434)

ํ•„์ˆ˜

Model Name

์‚ฌ์šฉํ•  ๋กœ์ปฌ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์ด๋ฆ„ (์˜ˆ: llama2, mxbai-embed-large)

ํ•„์ˆ˜


ํŒŒ๋ผ๋ฏธํ„ฐ (Parameters)

ํ•ญ๋ชฉ
์„ค๋ช…

Number of GPU

์‚ฌ์šฉํ•  GPU ์ˆ˜ (์˜ˆ: 1, 0 โ€“ CPU ์ „์šฉ)

Number of Thread

๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ Thread ์ˆ˜ (์‹œ์Šคํ…œ ์‚ฌ์–‘์— ๋งž๊ฒŒ ์กฐ์ •)

Use MMap

๋ชจ๋ธ์„ Memory Map ๋ฐฉ์‹์œผ๋กœ ๋ถˆ๋Ÿฌ์˜ฌ์ง€ ์—ฌ๋ถ€ (๊ธฐ๋ณธ๊ฐ’: ON)


์ถœ๋ ฅ๊ฐ’ (Outputs)

์ถœ๋ ฅ ํ•ญ๋ชฉ
์„ค๋ช…

OllamaEmbeddings

์ž…๋ ฅ ํ…์ŠคํŠธ์— ๋Œ€ํ•œ ์ž„๋ฒ ๋”ฉ ๋ฒกํ„ฐ ๊ฒฐ๊ณผ ๋ฐฐ์—ด


ํ™œ์šฉ ์˜ˆ์‹œ

  • ์™„์ „ํ•œ ์˜คํ”„๋ผ์ธ ํ™˜๊ฒฝ์—์„œ ๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ์„ ์ƒ์„ฑํ•˜์—ฌ ๋‚ด๋ถ€ ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ ๊ตฌ์ถ•

  • Llama2 ๋˜๋Š” Mistral ๊ธฐ๋ฐ˜ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ๋กœ์ปฌ ์„œ๋ฒ„์—์„œ ์šด์˜ํ•˜๋ฉฐ RAG ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์„ฑ

  • GPU์™€ Thread ์„ค์ •์„ ํ†ตํ•ด ๊ฒฝ๋Ÿ‰ํ™”๋œ ๋กœ์ปฌ ์„œ๋ฒ„์—์„œ๋„ ๊ณ ์† ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ

  • ๋ฐ์ดํ„ฐ ์œ ์ถœ ์œ„ํ—˜ ์—†์ด ๋ฏผ๊ฐ ์ •๋ณด ๊ธฐ๋ฐ˜ AI ์‹œ์Šคํ…œ ๊ตฌ์ถ•


์‚ฌ์šฉ ํŒ

  • Base URL์€ Ollama๊ฐ€ ์‹คํ–‰ ์ค‘์ธ ๋จธ์‹ ์˜ API ์ฃผ์†Œ์ด๋ฉฐ, ํฌํŠธ(11434)๋ฅผ ์ •ํ™•ํžˆ ์ž…๋ ฅํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

  • Model Name์€ Ollama์— ์‚ฌ์ „ ๋‹ค์šด๋กœ๋“œ ๋ฐ ๋กœ๋“œ๋œ ๋ชจ๋ธ ์ด๋ฆ„๊ณผ ์ •ํ™•ํžˆ ์ผ์น˜ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

    • ์˜ˆ์‹œ: llama2, mxbai-embed-large, nomic-embed-text ๋“ฑ

  • Use MMap์„ ํ™œ์„ฑํ™”ํ•˜๋ฉด ๋ชจ๋ธ ๋กœ๋”ฉ ์†๋„ ๋ฐ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ ํšจ์œจ์ด ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.

  • Thread ์ˆ˜๋ฅผ ๋†’์ด๋ฉด ์ฒ˜๋ฆฌ ์†๋„๋Š” ๋นจ๋ผ์ง€๋‚˜ ์‹œ์Šคํ…œ ์ž์›์„ ๋งŽ์ด ์†Œ๋ชจํ•˜๋ฏ€๋กœ ํ…Œ์ŠคํŠธ ํ›„ ์ตœ์ ํ™”ํ•˜์„ธ์š”.


์ฃผ์˜์‚ฌํ•ญ

  • Ollama ์„œ๋ฒ„๊ฐ€ ์‹คํ–‰ ์ค‘์ด์ง€ ์•Š๊ฑฐ๋‚˜ Base URL์ด ์˜ฌ๋ฐ”๋ฅด์ง€ ์•Š์œผ๋ฉด ํ˜ธ์ถœ์ด ์‹คํŒจํ•ฉ๋‹ˆ๋‹ค.

  • ๋กœ์ปฌ์— ํ•ด๋‹น ๋ชจ๋ธ์ด ์กด์žฌํ•˜์ง€ ์•Š๊ฑฐ๋‚˜ ๋ฏธ๋ฆฌ ๋กœ๋“œ๋˜์–ด ์žˆ์ง€ ์•Š์œผ๋ฉด ์ž„๋ฒ ๋”ฉ์ด ์ƒ์„ฑ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

  • GPU ์„ค์ •์€ ํ•ด๋‹น ๋จธ์‹ ์˜ ์‚ฌ์–‘๊ณผ ํ˜ธํ™˜๋˜์–ด์•ผ ํ•˜๋ฉฐ, ์—†๋Š” GPU๋ฅผ ์„ค์ •ํ•  ๊ฒฝ์šฐ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค.

  • ๋กœ์ปฌ ์„œ๋ฒ„ ์„ฑ๋Šฅ์— ๋”ฐ๋ผ ์ฒ˜๋ฆฌ ์‹œ๊ฐ„๊ณผ ํ’ˆ์งˆ์ด ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ์ดˆ๊ธฐ ํ…Œ์ŠคํŠธ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

Last updated