Json File
Json File ๋ ธ๋๋ ์ ๋ก๋๋ JSON ํ์ผ์์ ์ง์ ๋ ํค์ ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ์ฌ ๋ฌธ์ ๊ฐ์ฒด(Document)๋ก ๋ณํํฉ๋๋ค. API ์๋ต ๋ก๊ทธ, ์ฌ์ฉ์ ํ๋ ๋ฐ์ดํฐ, ํฌ๋กค๋ง ๊ฒฐ๊ณผ ๋ฑ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฒกํฐํํ๊ฑฐ๋ ๊ฒ์ ๊ธฐ๋ฐ ์์คํ ์ ํ์ฉํ ์ ์์ต๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
์ ๋ก๋๋ JSON ํ์ผ์์ ํน์ ํค์ ๊ฐ์ ์ถ์ถํ์ฌ ํ ์คํธ๋ก ๋ณํ
๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ์ ํน์ ํ๋๋ง ์ ํ์ ์ผ๋ก ๊ฐ๊ณต
pageContent ์ธ ๋ฉํ๋ฐ์ดํฐ ์ง์ ๊ฐ๋ฅ
Text Splitter์ ์ฐ๊ณํด ํ ์คํธ ์๋ ๋ถํ ์ฒ๋ฆฌ ๊ฐ๋ฅ


์
๋ ฅ๊ฐ (Inputs)
Json File
์ ๋ก๋ํ JSON ํ์ผ (.json)
ํ์
Pointers Extraction
์ถ์ถํ ํค ๋๋ ๊ฒฝ๋ก (์: body, data.text ๋ฑ)
์ ํ
Text Splitter
์ถ์ถ๋ ํ ์คํธ๋ฅผ ๋ถํ ํ๋ ๋ฐ ์ฌ์ฉํ Text Splitter ๋ ธ๋
์ ํ
ํ๋ผ๋ฏธํฐ (Parameters)
Additional Metadata
๋ฌธ์์ ๋ถ์ฌํ ์ถ๊ฐ ๋ฉํ๋ฐ์ดํฐ (JSON ๋๋ ๊ฒฝ๋ก ๋งคํ ํ์ ์ฌ์ฉ ๊ฐ๋ฅ)
Omit Metadata Keys
๊ฒฐ๊ณผ ๋ฌธ์์์ ์ ๊ฑฐํ ๋ฉํ๋ฐ์ดํฐ ํค ๋ชฉ๋ก (์: id, timestamp)
์ถ๋ ฅ๊ฐ (Outputs)
Document
pageContent์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ํฌํจํ ๋ฌธ์ ๊ฐ์ฒด ๋ฆฌ์คํธ
Text
๋ชจ๋ pageContent๋ฅผ ํ๋์ ๋ฌธ์์ด๋ก ๋ณํฉํ ํ ์คํธ
ํ์ฉ ์์
์ฌ์ฉ์ ํผ๋๋ฐฑ JSON ๋ฐ์ดํฐ๋ฅผ ์์ฝํ์ฌ ์ธ์ฌ์ดํธ ์ถ์ถ์ฉ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ
์ธ๋ถ API ์๋ต ๋ก๊ทธ์์ ํน์ ํ๋(body, result ๋ฑ)๋ง ์ถ์ถํ์ฌ RAG์ ํ์ฉ
๋ด์ค, ๋ธ๋ก๊ทธ ๋ฑ ํฌ๋กค๋ง ๋ฐ์ดํฐ๋ฅผ ๋ฒกํฐ DB๋ก ๋ณํํ์ฌ ๊ฒ์ ์๋ต ํ์ง ํฅ์
์ฌ์ฉ ํ
Pointers Extraction์๋ ์ถ์ถํ JSON ๊ฒฝ๋ก๋ฅผ ์ผํ๋ก ๊ตฌ๋ถํด ์ ๋ ฅ ๊ฐ๋ฅ (์: body, data.text)Additional Metadata์ JSON ๊ฒฝ๋ก๋ฅผ ์ง์ ํ๋ฉด ์๋ณธ ๊ฐ์ด ๋ฉํ๋ฐ์ดํฐ๋ก ์๋ ํฌํจ๋จ (์:{ "url": "/url" })JSON ๋ฐฐ์ด ๋ด ๊ฐ์ฒด๊ฐ ๋ง์์๋ก ๋ถํ ๋ฐ ๋ก๋ฉ ์๊ฐ์ด ์ฆ๊ฐํ๋ฏ๋ก ํ์ํ ํ๋๋ง ์ถ์ถํ๋ ๊ฒ์ด ํจ์จ์ ์
์ฃผ์์ฌํญ
๋น์ ํ JSON ๊ตฌ์กฐ ๋๋ ์ค์ฒฉ์ด ๋ง์ ๊ฒฝ์ฐ, ์ ํํ ๊ฒฝ๋ก ์ง์ ์ ํ์ง ์์ผ๋ฉด ๋น ์ถ๋ ฅ ๋ฐ์
ํ์ด์ง ํฌ๊ธฐ ์ ํ์ด ์๋ ๊ฒฝ์ฐ, Text Splitter ๋ ธ๋๋ฅผ ๋ฐ๋์ ์ฐ๊ฒฐํ์ฌ ๋ถํ ์ฒ๋ฆฌ ๊ถ์ฅ
JSON ํ์ผ์ ์ธ์ฝ๋ฉ ์ค๋ฅ ๋๋ ๋ฌธ๋ฒ ์ค๋ฅ๊ฐ ์์ ๊ฒฝ์ฐ ๋ก๋ฉ์ ์คํจํ ์ ์์
Last updated