Ollama Embeddings
Ollama Embeddings ๋ ธ๋๋ ๋ก์ปฌ์์ ์คํ ์ค์ธ Ollama ์๋ฒ๋ฅผ ํตํด ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ํธ์ถํ์ฌ ํ ์คํธ๋ฅผ ๋ฒกํฐ๋ก ๋ณํํ๋ ๋ ธ๋์ ๋๋ค. ์ธํฐ๋ท ์ฐ๊ฒฐ ์์ด ๋ก์ปฌ ํ๊ฒฝ์์ ์๋ฒ ๋ฉ ์ฒ๋ฆฌ ๊ฐ๋ฅํ๋ฉฐ, GPU ๋ฐ Thread ์ค์ ์ ํตํด ์ฑ๋ฅ์ ์ ์ฐํ๊ฒ ์กฐ์ ํ ์ ์์ต๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
Ollama ์๋ฒ๋ฅผ ํตํด ๋ก์ปฌ ์๋ฒ ๋ฉ ๋ชจ๋ธ(
llama2๋ฑ) ํธ์ถ ๊ฐ๋ฅ๋ก์ปฌ ํ๊ฒฝ์์ ๋ฒกํฐ ์์ฑ โ ๊ฐ์ธ์ ๋ณด ์ ์ถ ์ฐ๋ ค ์๋ ํ์๋ง ์ฒ๋ฆฌ ๊ฐ๋ฅ
GPU ๊ฐ์, Thread ์, MMAP ์ฌ๋ถ ๋ฑ ์ฑ๋ฅ ํ๋ ํ๋ผ๋ฏธํฐ ์ ๊ณต
์คํ์์ค ๋ชจ๋ธ ๊ธฐ๋ฐ์ผ๋ก ๋น ๋ฅด๊ณ ๋น์ฉ ์๋ ์๋ฒ ๋ฉ ์ฒ๋ฆฌ ๊ฐ๋ฅ


์
๋ ฅ๊ฐ (Inputs)
Base URL
Ollama ์๋ฒ์ API ์ฃผ์ (์: http://localhost:11434)
ํ์
Model Name
์ฌ์ฉํ ๋ก์ปฌ ์๋ฒ ๋ฉ ๋ชจ๋ธ ์ด๋ฆ (์: llama2, mxbai-embed-large)
ํ์
ํ๋ผ๋ฏธํฐ (Parameters)
Number of GPU
์ฌ์ฉํ GPU ์ (์: 1, 0 โ CPU ์ ์ฉ)
Number of Thread
๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ์ํ Thread ์ (์์คํ ์ฌ์์ ๋ง๊ฒ ์กฐ์ )
Use MMap
๋ชจ๋ธ์ Memory Map ๋ฐฉ์์ผ๋ก ๋ถ๋ฌ์ฌ์ง ์ฌ๋ถ (๊ธฐ๋ณธ๊ฐ: ON)
์ถ๋ ฅ๊ฐ (Outputs)
OllamaEmbeddings
์ ๋ ฅ ํ ์คํธ์ ๋ํ ์๋ฒ ๋ฉ ๋ฒกํฐ ๊ฒฐ๊ณผ ๋ฐฐ์ด
ํ์ฉ ์์
์์ ํ ์คํ๋ผ์ธ ํ๊ฒฝ์์ ๋ฌธ์ ์๋ฒ ๋ฉ์ ์์ฑํ์ฌ ๋ด๋ถ ๊ฒ์ ์์คํ ๊ตฌ์ถ
Llama2 ๋๋ Mistral ๊ธฐ๋ฐ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๋ก์ปฌ ์๋ฒ์์ ์ด์ํ๋ฉฐ RAG ํ์ดํ๋ผ์ธ ๊ตฌ์ฑ
GPU์ Thread ์ค์ ์ ํตํด ๊ฒฝ๋ํ๋ ๋ก์ปฌ ์๋ฒ์์๋ ๊ณ ์ ์ฒ๋ฆฌ ๊ฐ๋ฅ
๋ฐ์ดํฐ ์ ์ถ ์ํ ์์ด ๋ฏผ๊ฐ ์ ๋ณด ๊ธฐ๋ฐ AI ์์คํ ๊ตฌ์ถ
์ฌ์ฉ ํ
Base URL์ Ollama๊ฐ ์คํ ์ค์ธ ๋จธ์ ์ API ์ฃผ์์ด๋ฉฐ, ํฌํธ(11434)๋ฅผ ์ ํํ ์ ๋ ฅํด์ผ ํฉ๋๋ค.Model Name์ Ollama์ ์ฌ์ ๋ค์ด๋ก๋ ๋ฐ ๋ก๋๋ ๋ชจ๋ธ ์ด๋ฆ๊ณผ ์ ํํ ์ผ์นํด์ผ ํฉ๋๋ค.์์:
llama2,mxbai-embed-large,nomic-embed-text๋ฑ
Use MMap์ ํ์ฑํํ๋ฉด ๋ชจ๋ธ ๋ก๋ฉ ์๋ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ ํจ์จ์ด ํฅ์๋ฉ๋๋ค.Thread ์๋ฅผ ๋์ด๋ฉด ์ฒ๋ฆฌ ์๋๋ ๋นจ๋ผ์ง๋ ์์คํ ์์์ ๋ง์ด ์๋ชจํ๋ฏ๋ก ํ ์คํธ ํ ์ต์ ํํ์ธ์.
์ฃผ์์ฌํญ
Ollama ์๋ฒ๊ฐ ์คํ ์ค์ด์ง ์๊ฑฐ๋
Base URL์ด ์ฌ๋ฐ๋ฅด์ง ์์ผ๋ฉด ํธ์ถ์ด ์คํจํฉ๋๋ค.๋ก์ปฌ์ ํด๋น ๋ชจ๋ธ์ด ์กด์ฌํ์ง ์๊ฑฐ๋ ๋ฏธ๋ฆฌ ๋ก๋๋์ด ์์ง ์์ผ๋ฉด ์๋ฒ ๋ฉ์ด ์์ฑ๋์ง ์์ต๋๋ค.
GPU ์ค์ ์ ํด๋น ๋จธ์ ์ ์ฌ์๊ณผ ํธํ๋์ด์ผ ํ๋ฉฐ, ์๋ GPU๋ฅผ ์ค์ ํ ๊ฒฝ์ฐ ์ค๋ฅ๊ฐ ๋ฐ์ํฉ๋๋ค.
๋ก์ปฌ ์๋ฒ ์ฑ๋ฅ์ ๋ฐ๋ผ ์ฒ๋ฆฌ ์๊ฐ๊ณผ ํ์ง์ด ๋ฌ๋ผ์ง ์ ์์ผ๋ฏ๋ก ์ด๊ธฐ ํ ์คํธ๊ฐ ํ์ํฉ๋๋ค.
Last updated