HuggingFace Inference

HuggingFace Inference λ…Έλ“œλŠ” Hugging Face Hub에 λ“±λ‘λœ λ‹€μ–‘ν•œ ν…μŠ€νŠΈ 생성 λͺ¨λΈ(GPT2, BLOOM λ“±)을 APIλ₯Ό 톡해 μ‹€ν–‰ν•  수 μžˆλ„λ‘ μ§€μ›ν•˜λŠ” λ…Έλ“œμž…λ‹ˆλ‹€. μ»€μŠ€ν…€ μ—”λ“œν¬μΈνŠΈ 섀정을 톡해 사내 ν˜ΈμŠ€νŒ… λͺ¨λΈμ΄λ‚˜ Hugging Face Inference Endpoints와도 μ—°κ²° κ°€λŠ₯ν•©λ‹ˆλ‹€.


μ£Όμš” κΈ°λŠ₯

  • Hugging Face Hub의 λͺ¨λΈ(gpt2, bloom λ“±)을 직접 ν˜ΈμΆœν•΄ ν…μŠ€νŠΈ 생성

  • Temperature, Top-p, Top-k, Max Tokens λ“± μ„ΈλΆ€ 생성 μ˜΅μ…˜ 제곡

  • μ»€μŠ€ν…€ μ—”λ“œν¬μΈνŠΈ 섀정을 ν†΅ν•œ 프라이빗 λͺ¨λΈ 배포 ν™˜κ²½ 연동 κ°€λŠ₯

  • Cache κΈ°λŠ₯으둜 반볡 호좜 μ‹œ 응닡 속도 및 λΉ„μš© μ΅œμ ν™”

WindyFlo HuggingFace Inference
WindyFlo HuggingFace Inference Parameters

μž…λ ₯κ°’ (Inputs)

ν•­λͺ©
μ„€λͺ…
ν•„μˆ˜ μ—¬λΆ€

Cache

동일 μš”μ²­μ— λŒ€ν•œ κ²°κ³Όλ₯Ό μ €μž₯ν•΄ μž¬μ‚¬μš©ν• μ§€ μ—¬λΆ€

선택

Connect Credential

Hugging Face API 토큰 (Credential에 등둝)

ν•„μˆ˜

Model

μ‚¬μš©ν•  λͺ¨λΈ 이름 (예: gpt2, bigscience/bloom)

ν•„μˆ˜

Endpoint

Hugging Face Inference Endpoint λ˜λŠ” 사섀 API URL

선택


νŒŒλΌλ―Έν„° (Parameters)

ν•­λͺ©
μ„€λͺ…

Temperature

생성 λ‹€μ–‘μ„± μ‘°μ ˆκ°’ (0.0 ~ 1.0)

Max Tokens

생성할 μ΅œλŒ€ 토큰 수

Top Probability

Top-p (nucleus sampling) κ°’ μ„€μ • (예: 0.9)

Top K

Top-k μƒ˜ν”Œλ§ μ„€μ •κ°’

Frequency Penalty

반볡 단어 μ–΅μ œ 수치 (-2.0 ~ 2.0)


좜λ ₯κ°’ (Outputs)

좜λ ₯ ν•­λͺ©
μ„€λͺ…

HuggingFaceInference

λͺ¨λΈλ‘œλΆ€ν„° μƒμ„±λœ ν…μŠ€νŠΈ κ²°κ³Ό λ˜λŠ” JSON 응닡


ν™œμš© μ˜ˆμ‹œ

  • 사내 인프라 λ˜λŠ” Hugging Face의 프라이빗 λͺ¨λΈμ„ ν™œμš©ν•œ λ§žμΆ€ν˜• ν…μŠ€νŠΈ 생성 μ›Œν¬ν”Œλ‘œμš° ꡬ좕

  • μ˜€ν”ˆμ†ŒμŠ€ LLM 기반 RAG μ‹œμŠ€ν…œ μ‹€ν—˜

  • λΉ„μš©μ„ κ³ λ €ν•΄ OpenAI λŒ€μ‹  Hugging Face λͺ¨λΈλ‘œ μ‹€ν—˜ ν™˜κ²½ ꡬ성

  • λ‹€μ–‘ν•œ λͺ¨λΈ 섀정을 ν†΅ν•œ 생성 ν’ˆμ§ˆ 비ꡐ 및 평가


μ‚¬μš© 팁

  • Model 이름은 Hugging Face λͺ¨λΈ νŽ˜μ΄μ§€μ˜ μ •ν™•ν•œ 경둜λ₯Ό μž…λ ₯ν•΄μ•Ό ν•˜λ©°, 예: bigscience/bloom, tiiuae/falcon-7b-instruct

  • EndpointλŠ” Hugging Faceμ—μ„œ μƒμ„±ν•œ Inference Endpoint URL λ˜λŠ” 둜컬 ν”„λ‘μ‹œ μ„œλ²„ μ£Όμ†Œλ₯Ό μž…λ ₯ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  • Top Probability와 Top KλŠ” ν•¨κ»˜ μ‚¬μš©ν•˜λŠ” 경우 κ²°κ³Ό 닀양성이 컀질 수 μžˆμœΌλ‚˜, ν’ˆμ§ˆ μ €ν•˜ κ°€λŠ₯성도 μžˆμŠ΅λ‹ˆλ‹€.

  • Temperature와 Max Tokens 쑰합을 적절히 μ‘°μ •ν•˜λ©΄ 응닡 ν’ˆμ§ˆκ³Ό λΉ„μš©μ„ λ™μ‹œμ— 관리할 수 μžˆμŠ΅λ‹ˆλ‹€.


μ£Όμ˜μ‚¬ν•­

  • ν•΄λ‹Ή λ…Έλ“œλŠ” μž…λ ₯된 λͺ¨λΈ 경둜 λ˜λŠ” Endpointκ°€ 잘λͺ»λ  경우 였λ₯˜λ₯Ό λ°˜ν™˜ν•˜λ―€λ‘œ 사전 확인이 ν•„μˆ˜μž…λ‹ˆλ‹€.

  • Hugging Face의 일뢀 λͺ¨λΈμ€ 인증 토큰이 μ—†μœΌλ©΄ 호좜이 μ œν•œλ  수 μžˆμŠ΅λ‹ˆλ‹€.

  • μƒμ„±λœ 응닡 ν˜•μ‹μ€ λͺ¨λΈλ§ˆλ‹€ λ‹€λ₯΄λ―€λ‘œ ν›„μ²˜λ¦¬ λ‘œμ§μ—μ„œ μ£Όμ˜κ°€ ν•„μš”ν•©λ‹ˆλ‹€.

  • 둜컬 μ„œλ²„μ™€ 연동 μ‹œ API Timeout, 포맷 뢈일치 등에 λŒ€ν•œ μ˜ˆμ™Έμ²˜λ¦¬ ν•„μš”

Last updated