Fireworks
Fireworks ๋ ธ๋๋ Fireworks.ai ํ๋ซํผ์ ํตํด ์ ๊ณต๋๋ ๋ค์ํ ์คํ์์ค LLM(์: LLaMA, Mistral ๋ฑ)์ ํธ์ถํ ์ ์๋ ๋ ธ๋์ ๋๋ค. Hugging Face ํธํ API ๊ธฐ๋ฐ์ผ๋ก ์๋ํ๋ฉฐ, ์ ๋น์ฉ ๊ณ ์ฑ๋ฅ LLM์ API ํํ๋ก ํ์ฉํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
Fireworks.ai ๊ณ์ ์ ํตํด ๋ค์ํ ์คํ์์ค LLM์ API ํธ์ถ ๋ฐฉ์์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅ
Model Name์ ๋ ฅ์ ํตํด LLaMA, Mistral ๋ฑ ๋ค์ํ ๋ชจ๋ธ ์ง์ Cache ๊ธฐ๋ฅ์ผ๋ก ๋์ผ ํ๋กฌํํธ ์์ฒญ ์ ์๋ต ์๊ฐ ๋ฐ ๋น์ฉ ์ต์ ํ
Hugging Face Inference API์ ์ ์ฌํ ๋ฐฉ์์ผ๋ก ๊ฐ๋จํ ํตํฉ ๊ฐ๋ฅ

์
๋ ฅ๊ฐ (Inputs)
Cache
๋์ผ ์์ฒญ ์๋ต ์บ์ ์ฌ๋ถ
์ ํ
Connect Credential
Fireworks API Key (Credential์ ๋ฑ๋ก)
ํ์
Model Name
์ฌ์ฉํ ๋ชจ๋ธ ๊ฒฝ๋ก (์: accounts/fireworks/models/llama-v2-7b)
ํ์
ํ๋ผ๋ฏธํฐ (Parameters)
โป ํด๋น ๋ ธ๋๋ ์ถ๊ฐ ์ค์ ์์ด ๋จ์ API ํธ์ถ ์ค์ฌ์ผ๋ก ๊ตฌ์ฑ๋๋ฉฐ, ๋ณ๋ ๊ณ ๊ธ ํ๋ผ๋ฏธํฐ ์์
์ถ๋ ฅ๊ฐ (Outputs)
Fireworks
LLM ์๋ต ํ ์คํธ ๋๋ JSON ๊ฒฐ๊ณผ
ํ์ฉ ์์
Meta LLaMA ๊ธฐ๋ฐ ๋ชจ๋ธ์ ํ์ฉํ ์ ๋น์ฉ RAG ์์คํ ๊ตฌ์ถ
OpenAI ๋๋น ์ ๋ ดํ ๊ฐ๊ฒฉ์ผ๋ก ์ ์ฌ ์ฑ๋ฅ์ ํ ์คํธ ์์ฑ ์ํฌํ๋ก์ฐ ๊ตฌ์ฑ
ํ๋ผ์ด๋น LLM ์คํ ๋ฐ ํผํฌ๋จผ์ค ํ ์คํธ ํ๊ฒฝ ๊ตฌ์ฑ
Hugging Face Transformers ํ์์ ๋ชจ๋ธ์ Fireworks ์ธํ๋ผ์์ ๋ฐฐํฌยท์คํํ๋ ๊ฒฝ์ฐ
์ฌ์ฉ ํ
Model Name์ Fireworks์์ ์ฌ์ ์ ๋ฐฐํฌ๋ ์ ํํ ๋ชจ๋ธ ๊ฒฝ๋ก๋ฅผ ์ ๋ ฅํด์ผ ํ๋ฉฐ, ๋ณดํต Hugging Face ์คํ์ผ ๊ฒฝ๋ก๋ฅผ ๋ฐ๋ฆ ๋๋ค.์:
accounts/fireworks/models/llama-v2-7b,accounts/fireworks/models/mistral-7b
ํ๋กฌํํธ ๋์์ธ์ ์ผ๋ฐ์ ์ธ OpenAI ํฌ๋งท๊ณผ ์ ์ฌํ๋ฏ๋ก ์ฝ๊ฒ ์ด์ ํ ์ ์์ต๋๋ค.
๋ชจ๋ธ ์ฑ๋ฅ๊ณผ ์๋ต ์๋๋ GPU ์ฌ์ฉ๋๊ณผ ๋ชจ๋ธ ์ฌ์ด์ฆ์ ๋ฐ๋ผ ์ฐจ์ด๊ฐ ๋๋ฏ๋ก ์ฌ์ ํ ์คํธ๊ฐ ์ค์ํฉ๋๋ค.
Fireworks๋ ๋น ๋ฅด๊ฒ ๋ชจ๋ธ์ ๊ต์ฒดํ๊ฑฐ๋ ์ต์ ์คํ๋ชจ๋ธ์ ์คํํ ๋ ํนํ ์ ๋ฆฌํฉ๋๋ค.
์ฃผ์์ฌํญ
Connect Credential์ด ์ ํํ ๋ฑ๋ก๋์ง ์์ผ๋ฉด ์ธ์ฆ ์คํจ๋ก ์ธํด ์๋ต์ ๋ฐ์ ์ ์์ต๋๋ค.Model Name๊ฒฝ๋ก๊ฐ ์๋ชป๋๊ฑฐ๋ ๊ถํ์ด ์๋ ๊ฒฝ์ฐ HTTP ์ค๋ฅ๊ฐ ๋ฐํ๋๋ฏ๋ก Fireworks ๊ณ์ ์์ ์ฌ์ ํ์ธ ํ์Fireworks API๋ ์ฌ์ฉ๋ ๊ธฐ๋ฐ ๊ณผ๊ธ์ด๋ฉฐ, ๋๊ท๋ชจ ์์ฒญ ์ ์๊ธ ์ฃผ์๊ฐ ํ์ํฉ๋๋ค.
ํน์ ๋ชจ๋ธ์ ์ ๋ฃ ์๊ธ์ ์์๋ง ์ฌ์ฉ ๊ฐ๋ฅํ ์ ์์ผ๋ฉฐ, ๋ฆฌ์์ค ์ ์ฝ๋ ์กด์ฌํ ์ ์์ต๋๋ค.
Last updated