Json Lines File

Json Lines File ๋…ธ๋“œ๋Š” .jsonl ํ˜•์‹์˜ ํŒŒ์ผ์„ ์—…๋กœ๋“œํ•˜์—ฌ ๊ฐ ์ค„๋ณ„ JSON ๊ฐ์ฒด๋ฅผ ๋ฌธ์„œ ๊ฐ์ฒด(Document)๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ๋กœ๊ทธ, ํฌ๋กค๋ง ๊ฒฐ๊ณผ, ์‚ฌ์šฉ์ž ์ด๋ฒคํŠธ ๊ธฐ๋ก ๋“ฑ ๋Œ€์šฉ๋Ÿ‰ ์ŠคํŠธ๋ฆฌ๋ฐ ๋ฐ์ดํ„ฐ๋ฅผ AI ํŒŒ์ดํ”„๋ผ์ธ์—์„œ ํ™œ์šฉํ•˜๊ธฐ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.


์ฃผ์š” ๊ธฐ๋Šฅ

  • .jsonl ํ˜•์‹์˜ ํŒŒ์ผ์—์„œ ๊ฐ ์ค„์„ ๋…๋ฆฝ์ ์ธ ๋ฌธ์„œ ๊ฐ์ฒด๋กœ ์ถ”์ถœ

  • ์ง€์ •ํ•œ ํ‚ค์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ’๋งŒ pageContent๋กœ ์‚ฌ์šฉ ๊ฐ€๋Šฅ

  • ๊ฐ JSON ๊ฐ์ฒด ๋‚ด ๊ฐ’์„ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋กœ ์‚ฝ์ž…ํ•˜๊ฑฐ๋‚˜ ์ œ์™ธ ์„ค์ • ๊ฐ€๋Šฅ

  • Text Splitter ์—ฐ๊ณ„๋ฅผ ํ†ตํ•ด ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ ์ž๋™ ๋ถ„ํ•  ๊ฐ€๋Šฅ

WindyFlo Json Lines File
WindyFlo Json Lines File Parameters

์ž…๋ ฅ๊ฐ’ (Inputs)

ํ•ญ๋ชฉ
์„ค๋ช…
ํ•„์ˆ˜ ์—ฌ๋ถ€

Jsonlines File

์—…๋กœ๋“œํ•  JSONL ํŒŒ์ผ (.jsonl)

ํ•„์ˆ˜

Pointer Extraction

pageContent๋กœ ์‚ฌ์šฉํ•  ํ‚ค ๋˜๋Š” ๊ฒฝ๋กœ (์˜ˆ: content)

ํ•„์ˆ˜

Text Splitter

์ถ”์ถœ๋œ ํ…์ŠคํŠธ๋ฅผ ๋ถ„ํ• ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•  Text Splitter ๋…ธ๋“œ

์„ ํƒ


ํŒŒ๋ผ๋ฏธํ„ฐ (Parameters)

ํ•ญ๋ชฉ
์„ค๋ช…

Additional Metadata

๋ฌธ์„œ์— ๋ถ€์—ฌํ•  ์ถ”๊ฐ€ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ (์ •์  JSON ๋˜๋Š” ๊ฒฝ๋กœ ๋งคํ•‘ ๊ฐ€๋Šฅ)

Omit Metadata Keys

๊ฒฐ๊ณผ ๋ฌธ์„œ์—์„œ ์ œ๊ฑฐํ•  ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ํ‚ค ๋ชฉ๋ก (์˜ˆ: id, time ๋“ฑ)


์ถœ๋ ฅ๊ฐ’ (Outputs)

์ถœ๋ ฅ ํ•ญ๋ชฉ
์„ค๋ช…

Document

pageContent์™€ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•œ ๋ฌธ์„œ ๊ฐ์ฒด ๋ฆฌ์ŠคํŠธ

Text

๋ชจ๋“  pageContent๋ฅผ ํ•˜๋‚˜์˜ ๋ฌธ์ž์—ด๋กœ ๋ณ‘ํ•ฉํ•œ ํ…์ŠคํŠธ


ํ™œ์šฉ ์˜ˆ์‹œ

  • ๊ณ ๊ฐ ํ–‰๋™ ๋กœ๊ทธ(JSONL) ๋ฐ์ดํ„ฐ๋ฅผ AI ์š”์•ฝ ๋ฐ ์ด์ƒ ํƒ์ง€ ํŒŒ์ดํ”„๋ผ์ธ์— ์—ฐ๊ฒฐ

  • ๋‰ด์Šค ๊ธฐ์‚ฌ, ๋ฆฌ๋ทฐ ๋“ฑ์˜ ํฌ๋กค๋ง ๊ฒฐ๊ณผ๋ฅผ ๋ถ„ํ•  ๋กœ๋”ฉํ•˜์—ฌ RAG ์‹œ์Šคํ…œ ๊ตฌ์ถ•

  • API ๋กœ๊ทธ ํŒŒ์ผ์„ ์‚ฌ๋‚ด ์ง€์‹๋ฒ ์ด์Šค์— ํ†ตํ•ฉํ•˜๊ณ  ์ž์—ฐ์–ด ์งˆ์˜ ์‘๋‹ต ๊ตฌํ˜„


์‚ฌ์šฉ ํŒ

  • Pointer Extraction์—๋Š” ์ถ”์ถœํ•  ํ‚ค ์ด๋ฆ„๋งŒ ์ž…๋ ฅ (์˜ˆ: content)

  • Additional Metadata๋Š” JSON ๊ฒฝ๋กœ ๋งคํ•‘ ํ˜•์‹๋„ ๊ฐ€๋Šฅ (์˜ˆ: { "source": "/source" })

  • JSONL์€ ์ค„ ๋‹จ์œ„๋กœ ํŒŒ์‹ฑ๋˜๋ฏ€๋กœ, ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰ ์ฆ๊ฐ€์— ์œ ์˜


์ฃผ์˜์‚ฌํ•ญ

  • ์ž˜๋ชป๋œ ํฌ๋งท์˜ .jsonl ํŒŒ์ผ์€ ์ค‘๋‹จ ์—†์ด ์˜ค๋ฅ˜ ๋ฐœ์ƒ ๊ฐ€๋Šฅํ•˜๋ฏ€๋กœ ์‚ฌ์ „ ์œ ํšจ์„ฑ ๊ฒ€ํ†  ํ•„์ˆ˜

  • Pointer Extraction ํ•ญ๋ชฉ์ด ์กด์žฌํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ, ํ•ด๋‹น ์ค„์€ ๊ฑด๋„ˆ๋œ€

  • JSONL ๊ตฌ์กฐ ์ƒ, ์ค‘์ฒฉ๋œ ํ•„๋“œ๊ฐ€ ๋งŽ์„ ๊ฒฝ์šฐ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ๋งคํ•‘์— ์ฃผ์˜ ํ•„์š”

Last updated