Csv File
CSV ํ์ผ ๋ฐ์ดํฐ๋ฅผ ์ ๋ก๋ํ๊ณ , ๊ฐ ํ(row)์ ๋ฌธ์(Document) ํ์์ผ๋ก ๋ณํํ๋ ๋ก๋ ๋ ธ๋์ ๋๋ค. ์ ์ฒด ํ์ผ ๋๋ ํน์ ์ปฌ๋ผ๋ง ์ถ์ถํ์ฌ ๋ค์ํ ํ ์คํธ ๊ธฐ๋ฐ ํ์ดํ๋ผ์ธ์ ํ์ฉํ ์ ์์ต๋๋ค.
์ฃผ์ ๊ธฐ๋ฅ
์ ๋ก๋๋ CSV ํ์ผ์ ๊ฐ ํ ๋จ์๋ก Document ๊ฐ์ฒด๋ก ๋ณํ
ํน์ ์ปฌ๋ผ๋ง ์ถ์ถํ์ฌ ํ ์คํธ ์ฝํ ์ธ ๋ก ์ฒ๋ฆฌ ๊ฐ๋ฅ
Text Splitter ์ฐ๊ฒฐ๋ก ๊ธด ํ ์คํธ ์ฒ๋ฆฌ ๊ฐ๋ฅ
์ฌ์ฉ์ ์ ์ ๋ฉํ๋ฐ์ดํฐ ์ถ๊ฐ ๋ฐ ํน์ ํค ์ ์ธ ๊ฐ๋ฅ
ํ์ผ ๊ธฐ๋ฐ FAQ, ๋ณด๊ณ ์, ํผ๋๋ฐฑ, ๋ถ์ ๋ฐ์ดํฐ ์ ๋ ฅ์ ํ์ฉ


์
๋ ฅ๊ฐ (Inputs)
Text Splitter
๊ธด ํ ์คํธ ๋ถํ ์ฒ๋ฆฌ์ฉ ๋ ธ๋ ์ฐ๊ฒฐ
์ ํ
Csv File
์ ๋ก๋ํ CSV ํ์ผ (๋ก์ปฌ ์ ๋ก๋)
ํ์
Single Column Extraction
์ถ์ถํ ํน์ ์ปฌ๋ผ๋ช (์ ๋ ฅ ์ ํด๋น ์ปฌ๋ผ ๊ฐ๋ง ์ฌ์ฉ)
์ ํ
ํ๋ผ๋ฏธํฐ (Parameters)
Additional Metadata
๊ฐ ๋ฌธ์์ ์ถ๊ฐํ ์ฌ์ฉ์ ์ ์ ๋ฉํ๋ฐ์ดํฐ ํญ๋ชฉ
Omit Metadata Keys
์ ์ธํ metadata ํค ๋ชฉ๋ก (์: index, timestamp)
์ถ๋ ฅ๊ฐ (Outputs)
Document
๊ฐ CSV ํ์ pageContent + metadata๋ก ๊ตฌ์ฑํ ๋ฌธ์ ๊ฐ์ฒด ๋ฐฐ์ด
Text
์ ์ฒด ํ์ ๋ด์ฉ์ ํ ์คํธ๋ก ๋ณํฉํ ๋ฌธ์์ด (์ ํ ์ถ๋ ฅ ํ์)
ํ์ฉ ์์
๊ณ ๊ฐ ํผ๋๋ฐฑ CSV๋ฅผ ๋ถ๋ฌ์ ์์ฝ ๋ฐ ๊ฐ์ฑ ๋ถ์์ ํ์ฉ
์ธ์ผ์ฆ ๋ฆฌ๋ ๋ชฉ๋ก์์ ์ด๋ฆ/๋ด์ฉ๋ง ์ถ์ถํด ์ด๋ฉ์ผ ์๋ํ์ ํ์ฉ
์ค๋ฌธ ๋ฐ์ดํฐ ์ค ํน์ ์ง๋ฌธ ๋ต๋ณ๋ง ์ถ์ถํ์ฌ Q&A ์์ฑ
ํ ์คํธ ์ค์ฌ์ ๋ด๋ถ ๋ฐ์ดํฐ์ ์ LLM ํ์ต ์ ๋ ฅ์ผ๋ก ํ์ฉ
์: โcontentโ ์ปฌ๋ผ๋ง ์ถ์ถํด ๋ฆฌ๋ทฐ ๋ถ๋ฅ ๋ชจ๋ธ ์ ๋ ฅ์ ํ์ฉ
์ ์ฒด ํ์ ๊ทธ๋๋ก Document๋ก ์ฒ๋ฆฌํด DB ๊ธฐ๋ฐ ๊ฒ์์ ์ฐ๋ ๊ฐ๋ฅ
์ฑ๋ด ์๋ต ํ๋์ ์ํ ๋ต๋ณ ๋ฐ์ดํฐ ์ ๋ฆฌ์ฉ
์ฌ์ฉ ํ
์ปฌ๋ผ๋ช ์ด ์ ํํ ์ผ์นํด์ผ Single Column Extraction์ด ์ ์ ๋์
Text Splitter๋ฅผ ์ฐ๊ฒฐํ๋ฉด ๊ฐ ํ์ด ์ฅ๋ฌธ์ธ ๊ฒฝ์ฐ๋ ์ ์ ํ ์ฒ๋ฆฌ ๊ฐ๋ฅ
Omit Metadata Keys๋ฅผ ์ค์ ํ๋ฉด ๋ถํ์ํ ์ปฌ๋ผ ์ ๊ฑฐ ๊ฐ๋ฅCSV ํ์ผ ๊ตฌ์กฐ๊ฐ ์ผ์ ํ ์๋ก ๋ฌธ์ ์ฒ๋ฆฌ ํจ์จ์ด ๋์์ง
์ฃผ์์ฌํญ
๋น ์ปฌ๋ผ๋ช ๋๋ ๋น์ ํ ๊ตฌ์กฐ์ CSV๋ ์ฒ๋ฆฌ ์ค๋ฅ ๋ฐ์ ๊ฐ๋ฅ
์ ๋ก๋๋ ํ์ผ์ ๋ ธ๋ ์คํ ์๋ง๋ค ๋ค์ ์ฒ๋ฆฌ๋๋ฏ๋ก ๊ณผ๋ํ ์ฉ๋์ ์ฃผ์
์ปฌ๋ผ๋ช ์ด ํ๊ธ ๋๋ ํน์๋ฌธ์์ผ ๊ฒฝ์ฐ ์ผ๋ถ ๊ธฐ๋ฅ์ ์ ํ ๋ฐ์ ๊ฐ๋ฅ
Single Column Extraction ์ ๋ ฅ ์ ํด๋น ์ปฌ๋ผ์ด ์กด์ฌํ์ง ์์ผ๋ฉด ๋น ๋ฌธ์ ์์ฑ๋จ
Last updated