Ollama

Ollama λ…Έλ“œλŠ” 둜컬 ν™˜κ²½μ— μ„€μΉ˜λœ LLM(Large Language Model)을 APIλ₯Ό 톡해 μ‹€ν–‰ν•  수 μžˆλ„λ‘ μ§€μ›ν•˜λŠ” λ…Έλ“œμž…λ‹ˆλ‹€. llama2, mistral, codellama λ“± λ‹€μ–‘ν•œ μ˜€ν”ˆμ†ŒμŠ€ λͺ¨λΈμ„ Docker 기반으둜 μ‹€ν–‰ν•˜λ©°, WindyFlo와 μ—°λ™ν•˜μ—¬ κ°œμΈν™”λœ ν…μŠ€νŠΈ 생성 ν™˜κ²½μ„ ꡬ좕할 수 μžˆμŠ΅λ‹ˆλ‹€.


μ£Όμš” κΈ°λŠ₯

  • 둜컬 μ„œλ²„μ—μ„œ ꡬ동 쀑인 LLM λͺ¨λΈ 호좜 (κΈ°λ³Έ 포트: 11434)

  • Temperature, Top-k, Top-p λ“± μ„ΈλΆ€ μƒ˜ν”Œλ§ μ „λž΅ μ œμ–΄ κ°€λŠ₯

  • Mirostat, Repeat Penalty, Context Window Size λ“± κ³ κΈ‰ 생성 μ„€μ • 지원

  • GPU/Thread μžμ› 섀정을 톡해 둜컬 μ„±λŠ₯에 μ΅œμ ν™” κ°€λŠ₯

WindyFlo Ollama
WindyFlo Ollama Parameters
WindyFlo Ollama Parameters

μž…λ ₯κ°’ (Inputs)

ν•­λͺ©
μ„€λͺ…
ν•„μˆ˜ μ—¬λΆ€

Cache

동일 μš”μ²­ κ²°κ³Όλ₯Ό μ €μž₯ν• μ§€ μ—¬λΆ€

선택

Base URL

Ollama μ„œλ²„μ˜ 접속 μ£Όμ†Œ (예: http://localhost:11434)

ν•„μˆ˜

Model Name

μ‚¬μš©ν•  λͺ¨λΈ 이름 (llama2, mistral, codellama λ“±)

ν•„μˆ˜

Temperature

생성 λ‹€μ–‘μ„± μ œμ–΄κ°’ (κΈ°λ³Έκ°’: 0.9)

선택


νŒŒλΌλ―Έν„° (Parameters)

ν•­λͺ©
μ„€λͺ…

Top P

Top-p(nucleus sampling) μ„€μ •κ°’

Top K

Top-k μƒ˜ν”Œλ§ μ„€μ •κ°’

Mirostat

Mirostat μƒ˜ν”Œλ§ ν™œμ„±ν™” μ—¬λΆ€ (0 λ˜λŠ” 1)

Mirostat ETA

Mirostat ν•™μŠ΅λ₯  (일반적으둜 0.1 ꢌμž₯)

Mirostat TAU

Mirostat λͺ©ν‘œ surprisal κ°’ (예: 5.0)

Context Window Size

μ»¨ν…μŠ€νŠΈ μœˆλ„μš° μ΅œλŒ€ 길이 μ„€μ •

Number of GQA Groups

GQA κ·Έλ£Ή 수 (λͺ¨λΈ ꡬ쑰에 따라 μ„€μ •)

Number of GPU

ν• λ‹Ήν•  GPU 수

Number of Thread

병렬 μ²˜λ¦¬ν•  μŠ€λ ˆλ“œ 수

Repeat Last N

반볡 μ–΅μ œ λŒ€μƒ 토큰 수

Repeat Penalty

반볡 λ¬Έμž₯ μ–΅μ œ 강도

Stop Sequence

좜λ ₯ μ’…λ£Œλ₯Ό μœ λ„ν•  λ¬Έμž₯ λ˜λŠ” 토큰

Tail Free Sampling

Tail Free Sampling μ„€μ •κ°’ (0.0 ~ 1.0)


좜λ ₯κ°’ (Outputs)

좜λ ₯ ν•­λͺ©
μ„€λͺ…

Ollama

Ollamaμ—μ„œ μƒμ„±λœ ν…μŠ€νŠΈ 응닡 κ²°κ³Ό


ν™œμš© μ˜ˆμ‹œ

  • λΉ„μš© λΆ€λ‹΄ 없이 λ‘œμ»¬μ—μ„œ LLM ν…ŒμŠ€νŠΈ ν™˜κ²½ ꡬ좕 μ‹œ

  • OpenAI와 μœ μ‚¬ν•œ κΈ°λŠ₯의 사섀 ν…μŠ€νŠΈ 생성 νŒŒμ΄ν”„λΌμΈ ꡬ성

  • 프라이빗 데이터λ₯Ό 기반으둜 μ»€μŠ€ν„°λ§ˆμ΄μ§•ν•œ λͺ¨λΈ 운영

  • κ³ μ„±λŠ₯ GPU μ„œλ²„μ—μ„œ Mistral, LLaMA, Phi, Gemma λ“± 비ꡐ 뢄석 λͺ©μ 


μ‚¬μš© 팁

  • Ollamaλ₯Ό 처음 μ„€μΉ˜ν•œ 경우 ollama run llama2 λͺ…λ Ήμ–΄λ‘œ λͺ¨λΈμ„ λ‘œλ“œν•΄λ‘μ–΄μ•Ό API 호좜이 κ°€λŠ₯ν•©λ‹ˆλ‹€.

  • Base URL은 기본적으둜 http://localhost:11434이며, μ™ΈλΆ€ μ ‘κ·Ό μ‹œ λ°©ν™”λ²½ 및 포트 ν¬μ›Œλ”© μ„€μ • ν•„μš”

  • Mirostat(1), Mirostat ETA, Mirostat TAUλŠ” ν•™μŠ΅λœ 생성 뢄포 μœ μ§€μ— μœ μš©ν•˜μ§€λ§Œ, 잘λͺ» μ„€μ •ν•˜λ©΄ ν’ˆμ§ˆ μ €ν•˜ κ°€λŠ₯

  • Repeat Last N, Repeat PenaltyλŠ” μ€‘λ³΅λœ 응닡 λ°©μ§€λ₯Ό μœ„ν•œ 핡심 μ„€μ •μ΄λ―€λ‘œ νŠœλ‹μ΄ μ€‘μš”ν•©λ‹ˆλ‹€.

  • Stop Sequenceλ₯Ό ν™œμš©ν•΄ 챗봇 응닡을 λͺ…ν™•νžˆ μ’…λ£Œμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.


μ£Όμ˜μ‚¬ν•­

  • OllamaλŠ” λͺ¨λΈ λ‹€μš΄λ‘œλ“œ 및 μ‹€ν–‰ μ‹œ 사전 μ„ΈνŒ…μ΄ ν•„μš”ν•˜λ―€λ‘œ 둜컬 ν™˜κ²½ ꡬ성 μ—¬λΆ€λ₯Ό 확인해야 ν•©λ‹ˆλ‹€.

  • GPU 섀정이 κ³Όλ„ν•˜κ±°λ‚˜ μŠ€λ ˆλ“œ μˆ˜κ°€ λΆ€μ‘±ν•  경우 응닡이 λŠλ¦¬κ±°λ‚˜ μ‹€νŒ¨ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  • 일뢀 νŒŒλΌλ―Έν„°(GQA groups, Mirostat)λŠ” μ‚¬μš©ν•˜μ§€ μ•ŠμœΌλ©΄ κΈ°λ³Έκ°’μœΌλ‘œ μ²˜λ¦¬λ˜λ‚˜, λͺ¨λΈ νŠΉμ„±μ— 따라 λͺ…ν™•νžˆ μ§€μ •ν•˜λŠ” 것이 μ’‹μŠ΅λ‹ˆλ‹€.

  • 둜컬 λ©”λͺ¨λ¦¬/λ””μŠ€ν¬ μ‚¬μš©λŸ‰μ΄ λ§ŽμœΌλ―€λ‘œ μ„œλ²„ μžμ› μƒνƒœλ₯Ό μ§€μ†μ μœΌλ‘œ 확인해야 ν•©λ‹ˆλ‹€.

Last updated