Json Lines File
Json Lines File ๋
ธ๋๋ .jsonl ํ์์ ํ์ผ์ ์
๋ก๋ํ์ฌ ๊ฐ ์ค๋ณ JSON ๊ฐ์ฒด๋ฅผ ๋ฌธ์ ๊ฐ์ฒด(Document)๋ก ๋ณํํฉ๋๋ค. ๋ก๊ทธ, ํฌ๋กค๋ง ๊ฒฐ๊ณผ, ์ฌ์ฉ์ ์ด๋ฒคํธ ๊ธฐ๋ก ๋ฑ ๋์ฉ๋ ์คํธ๋ฆฌ๋ฐ ๋ฐ์ดํฐ๋ฅผ AI ํ์ดํ๋ผ์ธ์์ ํ์ฉํ๊ธฐ ์ ํฉํฉ๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
.jsonlํ์์ ํ์ผ์์ ๊ฐ ์ค์ ๋ ๋ฆฝ์ ์ธ ๋ฌธ์ ๊ฐ์ฒด๋ก ์ถ์ถ์ง์ ํ ํค์ ํด๋นํ๋ ๊ฐ๋ง pageContent๋ก ์ฌ์ฉ ๊ฐ๋ฅ
๊ฐ JSON ๊ฐ์ฒด ๋ด ๊ฐ์ ๋ฉํ๋ฐ์ดํฐ๋ก ์ฝ์ ํ๊ฑฐ๋ ์ ์ธ ์ค์ ๊ฐ๋ฅ
Text Splitter ์ฐ๊ณ๋ฅผ ํตํด ๋์ฉ๋ ๋ฐ์ดํฐ ์๋ ๋ถํ ๊ฐ๋ฅ


์
๋ ฅ๊ฐ (Inputs)
Jsonlines File
์ ๋ก๋ํ JSONL ํ์ผ (.jsonl)
ํ์
Pointer Extraction
pageContent๋ก ์ฌ์ฉํ ํค ๋๋ ๊ฒฝ๋ก (์: content)
ํ์
Text Splitter
์ถ์ถ๋ ํ ์คํธ๋ฅผ ๋ถํ ํ๋ ๋ฐ ์ฌ์ฉํ Text Splitter ๋ ธ๋
์ ํ
ํ๋ผ๋ฏธํฐ (Parameters)
Additional Metadata
๋ฌธ์์ ๋ถ์ฌํ ์ถ๊ฐ ๋ฉํ๋ฐ์ดํฐ (์ ์ JSON ๋๋ ๊ฒฝ๋ก ๋งคํ ๊ฐ๋ฅ)
Omit Metadata Keys
๊ฒฐ๊ณผ ๋ฌธ์์์ ์ ๊ฑฐํ ๋ฉํ๋ฐ์ดํฐ ํค ๋ชฉ๋ก (์: id, time ๋ฑ)
์ถ๋ ฅ๊ฐ (Outputs)
Document
pageContent์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ํฌํจํ ๋ฌธ์ ๊ฐ์ฒด ๋ฆฌ์คํธ
Text
๋ชจ๋ pageContent๋ฅผ ํ๋์ ๋ฌธ์์ด๋ก ๋ณํฉํ ํ ์คํธ
ํ์ฉ ์์
๊ณ ๊ฐ ํ๋ ๋ก๊ทธ(JSONL) ๋ฐ์ดํฐ๋ฅผ AI ์์ฝ ๋ฐ ์ด์ ํ์ง ํ์ดํ๋ผ์ธ์ ์ฐ๊ฒฐ
๋ด์ค ๊ธฐ์ฌ, ๋ฆฌ๋ทฐ ๋ฑ์ ํฌ๋กค๋ง ๊ฒฐ๊ณผ๋ฅผ ๋ถํ ๋ก๋ฉํ์ฌ RAG ์์คํ ๊ตฌ์ถ
API ๋ก๊ทธ ํ์ผ์ ์ฌ๋ด ์ง์๋ฒ ์ด์ค์ ํตํฉํ๊ณ ์์ฐ์ด ์ง์ ์๋ต ๊ตฌํ
์ฌ์ฉ ํ
Pointer Extraction์๋ ์ถ์ถํ ํค ์ด๋ฆ๋ง ์ ๋ ฅ (์:
content)Additional Metadata๋ JSON ๊ฒฝ๋ก ๋งคํ ํ์๋ ๊ฐ๋ฅ (์:
{ "source": "/source" })JSONL์ ์ค ๋จ์๋ก ํ์ฑ๋๋ฏ๋ก, ๋ฐ์ดํฐ๊ฐ ๋ง์์๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋ ์ฆ๊ฐ์ ์ ์
์ฃผ์์ฌํญ
์๋ชป๋ ํฌ๋งท์
.jsonlํ์ผ์ ์ค๋จ ์์ด ์ค๋ฅ ๋ฐ์ ๊ฐ๋ฅํ๋ฏ๋ก ์ฌ์ ์ ํจ์ฑ ๊ฒํ ํ์Pointer Extraction ํญ๋ชฉ์ด ์กด์ฌํ์ง ์๋ ๊ฒฝ์ฐ, ํด๋น ์ค์ ๊ฑด๋๋
JSONL ๊ตฌ์กฐ ์, ์ค์ฒฉ๋ ํ๋๊ฐ ๋ง์ ๊ฒฝ์ฐ ๋ฉํ๋ฐ์ดํฐ ๋งคํ์ ์ฃผ์ ํ์
Last updated