Ollama
Ollama λ Έλλ λ‘컬 νκ²½μ μ€μΉλ LLM(Large Language Model)μ APIλ₯Ό ν΅ν΄ μ€νν μ μλλ‘ μ§μνλ λ Έλμ λλ€. llama2, mistral, codellama λ± λ€μν μ€νμμ€ λͺ¨λΈμ Docker κΈ°λ°μΌλ‘ μ€ννλ©°, WindyFloμ μ°λνμ¬ κ°μΈνλ ν μ€νΈ μμ± νκ²½μ ꡬμΆν μ μμ΅λλ€.
μ£Όμ κΈ°λ₯
λ‘컬 μλ²μμ ꡬλ μ€μΈ LLM λͺ¨λΈ νΈμΆ (κΈ°λ³Έ ν¬νΈ:
11434)Temperature,Top-k,Top-pλ± μΈλΆ μνλ§ μ λ΅ μ μ΄ κ°λ₯Mirostat,Repeat Penalty,Context Window Sizeλ± κ³ κΈ μμ± μ€μ μ§μGPU/Thread μμ μ€μ μ ν΅ν΄ λ‘컬 μ±λ₯μ μ΅μ ν κ°λ₯



μ
λ ₯κ° (Inputs)
Cache
λμΌ μμ² κ²°κ³Όλ₯Ό μ μ₯ν μ§ μ¬λΆ
μ ν
Base URL
Ollama μλ²μ μ μ μ£Όμ (μ: http://localhost:11434)
νμ
Model Name
μ¬μ©ν λͺ¨λΈ μ΄λ¦ (llama2, mistral, codellama λ±)
νμ
Temperature
μμ± λ€μμ± μ μ΄κ° (κΈ°λ³Έκ°: 0.9)
μ ν
νλΌλ―Έν° (Parameters)
Top P
Top-p(nucleus sampling) μ€μ κ°
Top K
Top-k μνλ§ μ€μ κ°
Mirostat
Mirostat μνλ§ νμ±ν μ¬λΆ (0 λλ 1)
Mirostat ETA
Mirostat νμ΅λ₯ (μΌλ°μ μΌλ‘ 0.1 κΆμ₯)
Mirostat TAU
Mirostat λͺ©ν surprisal κ° (μ: 5.0)
Context Window Size
컨ν μ€νΈ μλμ° μ΅λ κΈΈμ΄ μ€μ
Number of GQA Groups
GQA κ·Έλ£Ή μ (λͺ¨λΈ ꡬ쑰μ λ°λΌ μ€μ )
Number of GPU
ν λΉν GPU μ
Number of Thread
λ³λ ¬ μ²λ¦¬ν μ€λ λ μ
Repeat Last N
λ°λ³΅ μ΅μ λμ ν ν° μ
Repeat Penalty
λ°λ³΅ λ¬Έμ₯ μ΅μ κ°λ
Stop Sequence
μΆλ ₯ μ’ λ£λ₯Ό μ λν λ¬Έμ₯ λλ ν ν°
Tail Free Sampling
Tail Free Sampling μ€μ κ° (0.0 ~ 1.0)
μΆλ ₯κ° (Outputs)
Ollama
Ollamaμμ μμ±λ ν μ€νΈ μλ΅ κ²°κ³Ό
νμ© μμ
λΉμ© λΆλ΄ μμ΄ λ‘컬μμ LLM ν μ€νΈ νκ²½ κ΅¬μΆ μ
OpenAIμ μ μ¬ν κΈ°λ₯μ μ¬μ€ ν μ€νΈ μμ± νμ΄νλΌμΈ ꡬμ±
νλΌμ΄λΉ λ°μ΄ν°λ₯Ό κΈ°λ°μΌλ‘ 컀μ€ν°λ§μ΄μ§ν λͺ¨λΈ μ΄μ
κ³ μ±λ₯ GPU μλ²μμ
Mistral,LLaMA,Phi,Gemmaλ± λΉκ΅ λΆμ λͺ©μ
μ¬μ© ν
Ollamaλ₯Ό μ²μ μ€μΉν κ²½μ°
ollama run llama2λͺ λ Ήμ΄λ‘ λͺ¨λΈμ λ‘λν΄λμ΄μΌ API νΈμΆμ΄ κ°λ₯ν©λλ€.Base URLμ κΈ°λ³Έμ μΌλ‘http://localhost:11434μ΄λ©°, μΈλΆ μ κ·Ό μ λ°©νλ²½ λ° ν¬νΈ ν¬μλ© μ€μ νμMirostat(1),Mirostat ETA,Mirostat TAUλ νμ΅λ μμ± λΆν¬ μ μ§μ μ μ©νμ§λ§, μλͺ» μ€μ νλ©΄ νμ§ μ ν κ°λ₯Repeat Last N,Repeat Penaltyλ μ€λ³΅λ μλ΅ λ°©μ§λ₯Ό μν ν΅μ¬ μ€μ μ΄λ―λ‘ νλμ΄ μ€μν©λλ€.Stop Sequenceλ₯Ό νμ©ν΄ μ±λ΄ μλ΅μ λͺ νν μ’ λ£μν¬ μ μμ΅λλ€.
μ£Όμμ¬ν
Ollamaλ λͺ¨λΈ λ€μ΄λ‘λ λ° μ€ν μ μ¬μ μΈν μ΄ νμνλ―λ‘ λ‘컬 νκ²½ κ΅¬μ± μ¬λΆλ₯Ό νμΈν΄μΌ ν©λλ€.
GPU μ€μ μ΄ κ³Όλνκ±°λ μ€λ λ μκ° λΆμ‘±ν κ²½μ° μλ΅μ΄ λ리거λ μ€ν¨ν μ μμ΅λλ€.
μΌλΆ νλΌλ―Έν°(
GQA groups,Mirostat)λ μ¬μ©νμ§ μμΌλ©΄ κΈ°λ³Έκ°μΌλ‘ μ²λ¦¬λλ, λͺ¨λΈ νΉμ±μ λ°λΌ λͺ νν μ§μ νλ κ²μ΄ μ’μ΅λλ€.λ‘컬 λ©λͺ¨λ¦¬/λμ€ν¬ μ¬μ©λμ΄ λ§μΌλ―λ‘ μλ² μμ μνλ₯Ό μ§μμ μΌλ‘ νμΈν΄μΌ ν©λλ€.
Last updated