RAG์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๊ฒ์ ์์คํ ์ ํจ์จ์ฑ๊ณผ ์ฌ์ฉ์ ๋ง์กฑ๋๋ฅผ ์ธก์ ํ๋ ๋ฐ ๋งค์ฐ ์ค์ํฉ๋๋ค. ์ฌ์ฉ์๊ฐ ์ํ๋ ์ ๋ณด๋ฅผ ์ผ๋ง๋ ๋น ๋ฅด๊ณ ์ ํํ๊ฒ ์ฐพ์์ฃผ๋์ง๋ฅผ ์ ๋์ ์ผ๋ก ๋ํ๋ด๋ ์ฌ๋ฌ ์งํ๋ค์ด ์ฌ์ฉ๋๋ฉฐ, ๊ทธ์ค ๋ํ์ ์ธ ๊ฒ์ด mAP (Mean Average Precision), mRR (Mean Reciprocal Rank), nDCG (Normalized Discounted Cumulative Gain) ์ ๋๋ค. ๊ฐ ์งํ๋ ํ๊ฐํ๋ ๊ด์ ๊ณผ ๋ชฉ์ ์ด ๋ค๋ฅด๋ฏ๋ก, ์์คํ ์ ํน์ฑ๊ณผ ํ๊ฐ ๋ชฉํ์ ๋ง์ถฐ ์ ์ ํ ์งํ๋ฅผ ์ ํํ๊ณ ํด์ํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ๐
1. mRR (Mean Reciprocal Rank)
์ ์ (Definition)
mRR (Mean Reciprocal Rank) ์ ์ฌ๋ฌ ์ฟผ๋ฆฌ(Query)์ ๋ํด ๊ฒ์๋ ๊ฒฐ๊ณผ ๋ฆฌ์คํธ์์ ์ฒซ ๋ฒ์งธ ์ ๋ต(๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ)์ด ๋ํ๋ ์์์ ์ญ์(Reciprocal Rank, RR) ๋ฅผ ๊ตฌํ๊ณ , ์ด ๊ฐ๋ค์ ํ๊ท ์ ๋ธ ์งํ์ ๋๋ค. ์ฆ, ์์คํ ์ด ์ฌ์ฉ์๊ฐ ์ฐพ๋ โ๋จ ํ๋์ ์ ๋ตโ์ ์ผ๋ง๋ ๋นจ๋ฆฌ ์ฐพ์์ฃผ๋์ง์ ์ด์ ์ ๋ง์ถฅ๋๋ค.
์ค๋ช (Explanation)
- Reciprocal Rank (RR): ํน์ ์ฟผ๋ฆฌ์ ๋ํ ๊ฒ์ ๊ฒฐ๊ณผ ๋ฆฌ์คํธ์์ ์ฒซ ๋ฒ์งธ ์ ๋ต ํญ๋ชฉ์ ์์(rank)๊ฐ k๋ผ๊ณ ํ ๋, RR์ 1/k ๋ก ๊ณ์ฐ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ฒซ ๋ฒ์งธ ๊ฒฐ๊ณผ๊ฐ ๋ฐ๋ก ์ ๋ต์ด๋ฉด RR์ 1/1 = 1, ์ธ ๋ฒ์งธ ๊ฒฐ๊ณผ๊ฐ ์ฒซ ์ ๋ต์ด๋ฉด RR์ 1/3์ด ๋ฉ๋๋ค. ๋ง์ฝ ๊ฒฐ๊ณผ ๋ฆฌ์คํธ์ ์ ๋ต์ด ์๋ค๋ฉด RR์ 0์ด ๋ฉ๋๋ค.
- Mean (ํ๊ท ): ์ฌ๋ฌ ์ฟผ๋ฆฌ (Q)์ ๋ํ RR ๊ฐ์ ๋ชจ๋ ๊ณ์ฐํ ํ, ์ด ๊ฐ๋ค์ ์ฐ์ ํ๊ท ์ ๊ตฌํ์ฌ ์ต์ข
mRR ๊ฐ์ ์ป์ต๋๋ค. ๊ณต์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
mRR = (1 / |Q|) * ฮฃ(1 / rank_i)
(์ฌ๊ธฐ์rank_i
๋ i๋ฒ์งธ ์ฟผ๋ฆฌ์์ ์ฒซ ๋ฒ์งธ ์ ๋ต์ ์์) - ํน์ง:
- ๐ค ๋จ์์ฑ: ๊ณ์ฐ์ด ๋น๊ต์ ๊ฐ๋จํ๊ณ ์ง๊ด์ ์ ๋๋ค.
- ๐ฅ ์ฒซ ์ ๋ต ์ค์: ์ฌ์ฉ์๊ฐ โํ๋์ ์ ๋ตโ์ ์ฐพ๋ ๊ฒฝ์ฐ (์: ์ง๋ฌธ ๋ต๋ณ ์์คํ , ์๋ ค์ง ํญ๋ชฉ ๊ฒ์)์ ํนํ ์ ์ฉํฉ๋๋ค. ์ฒซ ๋ฒ์งธ ๊ด๋ จ์ฑ ๋์ ๊ฒฐ๊ณผ์ ์์์๋ง ์ง์คํฉ๋๋ค.
- ๐ ํ๊ณ์ : ์ฒซ ๋ฒ์งธ ์ ๋ต ์ดํ์ ๋ค๋ฅธ ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ๋ค์ ์์๋ ๊ฐ์๋ ์ ํ ๊ณ ๋ คํ์ง ์์ต๋๋ค. ์ฆ, ์์ ๊ฒฐ๊ณผ์ ์ฌ๋ฌ ๊ฐ์ ์ ๋ต์ด ์์ด๋ ์ฒซ ๋ฒ์งธ ์ ๋ต์ ์์๋ง ๋ฐ์ํฉ๋๋ค.
์์ (Example)
3๊ฐ์ ์ฟผ๋ฆฌ์ ๋ํ ๊ฒ์ ๊ฒฐ๊ณผ์ ์ฒซ ๋ฒ์งธ ์ ๋ต์ ์์๊ฐ ๋ค์๊ณผ ๊ฐ๋ค๊ณ ๊ฐ์ ํด ๋ด ์๋ค.
- ์ฟผ๋ฆฌ 1:
[๊ฒฐ๊ณผ A (์ ๋ต), ๊ฒฐ๊ณผ B, ๊ฒฐ๊ณผ C]
โ ์ฒซ ์ ๋ต ์์(rank) = 1, RR = 1/1 = 1 - ์ฟผ๋ฆฌ 2:
[๊ฒฐ๊ณผ D, ๊ฒฐ๊ณผ E, ๊ฒฐ๊ณผ F (์ ๋ต)]
โ ์ฒซ ์ ๋ต ์์(rank) = 3, RR = 1/3 - ์ฟผ๋ฆฌ 3:
[๊ฒฐ๊ณผ G, ๊ฒฐ๊ณผ H (์ ๋ต), ๊ฒฐ๊ณผ I]
โ ์ฒซ ์ ๋ต ์์(rank) = 2, RR = 1/2
์ด ๊ฒฝ์ฐ, mRR์ (1 + 1/3 + 1/2) / 3 = (6/6 + 2/6 + 3/6) / 3 = (11/6) / 3 = 11/18 โ 0.611 ์ ๋๋ค. ์ด ์์คํ ์ ํ๊ท ์ ์ผ๋ก ์ฒซ ๋ฒ์งธ ์ ๋ต์ ์ฝ 1~2์ ์ฌ์ด์์ ์ฐพ์์ค๋ค๊ณ ํด์ํ ์ ์์ต๋๋ค.
2. mAP (Mean Average Precision)
์ ์ (Definition)
mAP (Mean Average Precision) ๋ ๊ฐ ์ฟผ๋ฆฌ๋ณ Average Precision (AP) ๊ฐ์ ํ๊ท ์ ๋๋ค. AP๋ ๊ฒ์ ๊ฒฐ๊ณผ ๋ฆฌ์คํธ์์ ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ๋ค์ด ์์์ ์ผ๋ง๋ ์ ๋ญํฌ๋์๋์ง๋ฅผ ์ ๋ฐ๋(Precision) ์ ์ฌํ์จ(Recall) ์ ๋ชจ๋ ๊ณ ๋ คํ์ฌ ํ๊ฐํ๋ ์งํ์ ๋๋ค. ์ฆ, ์ฌ๋ฌ ๊ฐ์ ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ์ ๋ชจ๋ ์ ์ฐพ์๋ด๋ ๋ฅ๋ ฅ์ ์ธก์ ํฉ๋๋ค.
์ค๋ช (Explanation)
- ์ ๋ฐ๋ (Precision): ๊ฒ์๋ ํญ๋ชฉ ์ค ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ์ ๋น์จ (
Precision = TP / (TP + FP)
) - ์ฌํ์จ (Recall): ์ ์ฒด ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ ์ค ๊ฒ์๋ ํญ๋ชฉ์ ๋น์จ (
Recall = TP / (TP + FN)
) - Average Precision (AP): ๋จ์ผ ์ฟผ๋ฆฌ์ ๋ํ ํ๊ฐ ์งํ์
๋๋ค. ๊ฒ์ ๊ฒฐ๊ณผ ๋ฆฌ์คํธ๋ฅผ ์์์๋ถํฐ ์์๋๋ก ํ์ธํ๋ฉด์, ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ์ด ๋์ฌ ๋๋ง๋ค ํด๋น ์์๊น์ง์ ์ ๋ฐ๋(Precision)๋ฅผ ๊ณ์ฐํ๊ณ , ์ด ์ ๋ฐ๋ ๊ฐ๋ค์ ํ๊ท ์ ๊ตฌํฉ๋๋ค. ๊ด๋ จ์ฑ ์๋ ๋ชจ๋ ๋ฌธ์๋ฅผ ๊ฒ์ํ์ ๋๋ง Recall ๊ฐ์ด 1์ด ๋๋ฉฐ, ์ด๋์ Precision ๊ฐ๋ค์ ํ๊ท ์ด AP๊ฐ ๋ฉ๋๋ค. ๊ณต์์ ๋ค์๊ณผ ๊ฐ์ด ํํ๋ ์ ์์ต๋๋ค:
AP = ฮฃ(P(k) * rel(k)) / (Number of relevant documents)
(์ฌ๊ธฐ์P(k)
๋ ์์ k๊ฐ ๊ฒฐ๊ณผ์์์ ์ ๋ฐ๋,rel(k)
๋ k๋ฒ์งธ ๊ฒฐ๊ณผ๊ฐ ๊ด๋ จ์ฑ์ด ์์ผ๋ฉด 1, ์๋๋ฉด 0) - Mean (ํ๊ท ): ์ฌ๋ฌ ์ฟผ๋ฆฌ์ ๋ํ AP ๊ฐ์ ๋ชจ๋ ๊ณ์ฐํ ํ, ์ด ๊ฐ๋ค์ ์ฐ์ ํ๊ท ์ ๊ตฌํ์ฌ ์ต์ข mAP ๊ฐ์ ์ป์ต๋๋ค.
- ํน์ง:
- ๐ ์์ ๋ฐ ๊ฐ์ ๊ณ ๋ ค: ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ์ ์์์ ๊ฐ์๋ฅผ ๋ชจ๋ ๋ฐ์ํฉ๋๋ค. ๊ด๋ จ์ฑ ๋์ ํญ๋ชฉ์ด ๊ฒฐ๊ณผ ๋ฆฌ์คํธ ์์์ ๋ง์ด ๋์ฌ์๋ก AP ๊ฐ์ด ๋์์ง๋๋ค.
- โ๏ธ ์ ๋ฐ๋-์ฌํ์จ ๊ท ํ: ์๋ฌต์ ์ผ๋ก ์ ๋ฐ๋์ ์ฌํ์จ ์ฌ์ด์ ๊ท ํ์ ๊ณ ๋ คํฉ๋๋ค.
- ๐ฏ ์ผ๋ฐ์ ์ฑ๋ฅ ํ๊ฐ: ์ ๋ณด ๊ฒ์ ๋ถ์ผ์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ํ์ค์ ์ธ ํ๊ฐ ์งํ ์ค ํ๋์ ๋๋ค. ํนํ ์ฌ๋ฌ ๊ฐ์ ๊ด๋ จ์ฑ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ฐพ๋ ๊ฒ์ด ์ค์ํ ๊ฒฝ์ฐ (์: ์น ๊ฒ์)์ ์ ํฉํฉ๋๋ค.
- ๐ข ์ด์ง ๊ด๋ จ์ฑ ๊ฐ์ : ๊ธฐ๋ณธ์ ์ผ๋ก ํญ๋ชฉ์ด โ๊ด๋ จ์ฑ ์์โ ๋๋ โ๊ด๋ จ์ฑ ์์โ์ ๋ ๊ฐ์ง๋ก๋ง ๊ตฌ๋ถ๋๋ค๊ณ ๊ฐ์ ํฉ๋๋ค (Binary Relevance).
์์ (Example)
์ด๋ค ์ฟผ๋ฆฌ์ ๋ํด ์ด 5๊ฐ์ ๊ด๋ จ์ฑ ๋์ ๋ฌธ์๊ฐ ์กด์ฌํ๋ค๊ณ ๊ฐ์ ํ๊ณ , ์์คํ
์ด 10๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํ์ผ๋ฉฐ, ๊ทธ ์์์ ๊ด๋ จ์ฑ ์ฌ๋ถ๊ฐ ๋ค์๊ณผ ๊ฐ๋ค๊ณ ํฉ์๋ค:
[R, N, R, R, N, N, R, N, R, N]
(R: Relevant, N: Not Relevant)
- 1๋ฒ์งธ ๊ฒฐ๊ณผ(R): Precision = 1/1 = 1.0 (๊ด๋ จ ๋ฌธ์ 1/5 ์ฐพ์)
- 3๋ฒ์งธ ๊ฒฐ๊ณผ(R): Precision = 2/3 โ 0.67 (๊ด๋ จ ๋ฌธ์ 2/5 ์ฐพ์)
- 4๋ฒ์งธ ๊ฒฐ๊ณผ(R): Precision = 3/4 = 0.75 (๊ด๋ จ ๋ฌธ์ 3/5 ์ฐพ์)
- 7๋ฒ์งธ ๊ฒฐ๊ณผ(R): Precision = 4/7 โ 0.57 (๊ด๋ จ ๋ฌธ์ 4/5 ์ฐพ์)
- 9๋ฒ์งธ ๊ฒฐ๊ณผ(R): Precision = 5/9 โ 0.56 (๊ด๋ จ ๋ฌธ์ 5/5 ์ฐพ์)
์ด ์ฟผ๋ฆฌ์ AP = (1.0 + 0.67 + 0.75 + 0.57 + 0.56) / 5 โ 3.55 / 5 = 0.71 ๋ง์ฝ ์ฌ๋ฌ ์ฟผ๋ฆฌ์ ๋ํด AP ๊ฐ์ ๊ณ์ฐํ์ฌ ํ๊ท ์ ๋ด๋ฉด ๊ทธ๊ฒ์ด mAP๊ฐ ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด 3๊ฐ์ ์ฟผ๋ฆฌ์ ๋ํ AP ๊ฐ์ด ๊ฐ๊ฐ 0.71, 0.5, 0.8 ์ด๋ผ๋ฉด, mAP = (0.71 + 0.5 + 0.8) / 3 โ 0.67 ์ ๋๋ค.
3. nDCG (Normalized Discounted Cumulative Gain)
์ ์ (Definition)
**nDCG (Normalized Discounted Cumulative Gain)**๋ ๊ฒ์ ๊ฒฐ๊ณผ์ ์์ ํ์ง์ ํ๊ฐํ๋ ์งํ๋ก, ํนํ ๊ด๋ จ์ฑ์ ์ ๋๊ฐ ๋ค์ํ(graded relevance) ๊ฒฝ์ฐ์ ์ ์ฉํฉ๋๋ค. ์์ ์์์ ์๋ ๊ฒฐ๊ณผ์ ๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๊ณ (Discounted), ์ด์์ ์ธ(๊ฐ์ฅ ์ข์) ์์๋ก ์ ๋ ฌ๋์์ ๋์ ์ ์๋ก ๋๋์ด(Normalized) 0๊ณผ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก ์ ๊ทํํฉ๋๋ค.
์ค๋ช (Explanation)
- Cumulative Gain (CG): ์์ k๊ฐ ๊ฒฐ๊ณผ์ ๊ด๋ จ์ฑ ์ ์(relevance score)๋ฅผ ๋จ์ํ ํฉ์ฐํ ๊ฐ์
๋๋ค. ๊ฒฐ๊ณผ์ ์์๋ ๊ณ ๋ คํ์ง ์์ต๋๋ค.
CG_k = ฮฃ(rel_i)
(i=1 to k,rel_i
๋ i๋ฒ์งธ ๊ฒฐ๊ณผ์ ๊ด๋ จ์ฑ ์ ์) - Discounted Cumulative Gain (DCG): CG์ ์์ ๊ฐ๋
์ ๋์
ํ ๊ฒ์
๋๋ค. ํ์ ์์ ๊ฒฐ๊ณผ์ ๊ด๋ จ์ฑ ์ ์์๋ **ํ๋ํฐ(discount)**๋ฅผ ๋ถ์ฌํฉ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก i๋ฒ์งธ ์์์ ๊ฒฐ๊ณผ์๋
1 / log2(i+1)
์ ํ ์ธ์จ(discount factor)์ ์ ์ฉํฉ๋๋ค. ์ฆ, ์์๊ฐ ๋ฎ์์๋ก(i๊ฐ ํด์๋ก) ๋ถ๋ชจ๊ฐ ์ปค์ ธ ๊ฐ์ค์น๊ฐ ์ค์ด๋ญ๋๋ค.DCG_k = ฮฃ(rel_i / log2(i+1))
(i=1 to k) (๋ค๋ฅธ ํ ์ธ ํจ์๋ฅผ ์ฌ์ฉํ๊ธฐ๋ ํฉ๋๋ค.) - Normalized DCG (nDCG): DCG ๊ฐ์ ์ฟผ๋ฆฌ๋ ๊ฒฐ๊ณผ์ ๊ฐ์์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์์ผ๋ฏ๋ก, ๋น๊ต๋ฅผ ์ํด ์ ๊ทํํฉ๋๋ค. **Ideal DCG (IDCG)**๋ ํด๋น ์ฟผ๋ฆฌ์ ๋ํด ๊ฐ๋ฅํ ๊ฐ์ฅ ์ด์์ ์ธ ์์ (๊ด๋ จ์ฑ ๋์ ์์๋๋ก ์ ๋ ฌ)๋ก ๊ฒฐ๊ณผ๋ฅผ ๋์ดํ์ ๋์ DCG ๊ฐ์
๋๋ค. nDCG๋ ์ค์ DCG ๊ฐ์ IDCG ๊ฐ์ผ๋ก ๋๋ ๊ฒ์
๋๋ค.
nDCG_k = DCG_k / IDCG_k
์ด ๊ฐ์ ํญ์ 0๊ณผ 1 ์ฌ์ด์ ์์นํ๋ฉฐ, 1์ ๊ฐ๊น์ธ์๋ก ์ด์์ ์ธ ์์์ ๊ฐ๊น๋ค๋ ์๋ฏธ์ ๋๋ค. - ํน์ง:
- ๐ฏ ๋ฑ๊ธ๋ณ ๊ด๋ จ์ฑ ๋ฐ์: ๊ด๋ จ์ฑ์ ๋จ์ ์ด์ง(0 ๋๋ 1)์ด ์๋ ์ฌ๋ฌ ๋ฑ๊ธ(์: 0=๊ด๋ จ ์์, 1=์กฐ๊ธ ๊ด๋ จ ์์, 2=๋งค์ฐ ๊ด๋ จ ์์)์ผ๋ก ํ๊ฐํ ์ ์์ต๋๋ค.
- ๐ ์์ ๊ฐ์ค์น: ์์ ์์ ๊ฒฐ๊ณผ์ ๋ ํฐ ์ค์๋๋ฅผ ๋ถ์ฌํ๋ ์ง๊ด์ ์ธ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค. ๋ฎ์ ์์์ ์ข์ ๊ฒฐ๊ณผ๋ณด๋ค๋ ๋์ ์์์ ์ข์ ๊ฒฐ๊ณผ๊ฐ ๋ ๊ฐ์น ์๋ค๋ ์ ์ ๋ฐ์ํฉ๋๋ค.
- ๐ ํ์คํ๋ ๋น๊ต: ์ ๊ทํ๋ฅผ ํตํด ์๋ก ๋ค๋ฅธ ์ฟผ๋ฆฌ๋ ์์คํ ๊ฐ์ ์ฑ๋ฅ ๋น๊ต๊ฐ ์ฉ์ดํฉ๋๋ค.
์์ (Example)
์ด๋ค ์ฟผ๋ฆฌ์ ๋ํด ์์ 5๊ฐ ๊ฒฐ๊ณผ์ ๊ด๋ จ์ฑ ์ ์(0~3์ )๊ฐ ๋ค์๊ณผ ๊ฐ๋ค๊ณ ๊ฐ์ ํด ๋ด
์๋ค:
[3, 2, 3, 0, 1]
-
DCG ๊ณ์ฐ:
- DCG@1 = 3 / log2(1+1) = 3 / 1 = 3
- DCG@2 = 3 + 2 / log2(2+1) โ 3 + 2 / 1.585 = 4.26
- DCG@3 = 4.26 + 3 / log2(3+1) = 4.26 + 3 / 2 = 5.76
- DCG@4 = 5.76 + 0 / log2(4+1) = 5.76
- DCG@5 = 5.76 + 1 / log2(5+1) โ 5.76 + 1 / 2.585 = 6.15 (DCG@5 โ 6.15)
-
IDCG ๊ณ์ฐ: ์ด์์ ์ธ ์์๋ ๊ด๋ จ์ฑ ์ ์๊ฐ ๋์ ์์์ธ
[3, 3, 2, 1, 0]
์ ๋๋ค.- IDCG@1 = 3 / log2(1+1) = 3
- IDCG@2 = 3 + 3 / log2(2+1) โ 3 + 3 / 1.585 = 4.89
- IDCG@3 = 4.89 + 2 / log2(3+1) = 4.89 + 2 / 2 = 5.89
- IDCG@4 = 5.89 + 1 / log2(4+1) โ 5.89 + 1 / 2.322 = 6.32
- IDCG@5 = 6.32 + 0 / log2(5+1) = 6.32 (IDCG@5 โ 6.32)
-
nDCG ๊ณ์ฐ:
- nDCG@5 = DCG@5 / IDCG@5 โ 6.15 / 6.32 โ 0.973
์ด ์์คํ ์ ์์ 5๊ฐ ๊ฒฐ๊ณผ์ ๋ํด ๊ฑฐ์ ์ด์์ ์ธ ์์์ ๊ฐ๊น๊ฒ ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๋ค๊ณ ํ๊ฐํ ์ ์์ต๋๋ค (nDCG@5 โ 0.973).
4. ์ด๋ค ์งํ๋ฅผ ์ธ์ ์ฌ์ฉํด์ผ ํ ๊น? ๐ค
- mRR: ์ฌ์ฉ์๊ฐ ํ๋์ ๋ช ํํ ์ ๋ต์ ์ฐพ๊ณ ์์ผ๋ฉฐ, ๊ทธ ์ ๋ต์ด ์ผ๋ง๋ ๋นจ๋ฆฌ ๋ํ๋๋์ง๊ฐ ์ค์ํ ๋ (์: โํ๋์ค ์๋๋?โ, ํน์ ๋ ผ๋ฌธ ์ฐพ๊ธฐ).
- mAP: ์ฌ์ฉ์๊ฐ ์ฌ๋ฌ ๊ฐ์ ๊ด๋ จ์ฑ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ฐพ๊ณ ์์ผ๋ฉฐ, ๊ฒฐ๊ณผ์ ์์์ ๊ด๋ จ์ฑ ์ฌ๋ถ๊ฐ ์ค์ํ ๋ (์: โ๋จธ์ ๋ฌ๋ ํํ ๋ฆฌ์ผโ, โ์ฌํ ์ถ์ฒโ). ์ด์ง ๊ด๋ จ์ฑ์ผ๋ก ์ถฉ๋ถํ ๋ ์ฃผ๋ก ์ฌ์ฉ๋ฉ๋๋ค.
- nDCG: ๊ด๋ จ์ฑ์ ์ ๋๊ฐ ๋ค์ํ๊ณ , ์์ ์์์ ํ์ง์ด ๋งค์ฐ ์ค์ํ ๋ (์: ์น ๊ฒ์ ๊ฒฐ๊ณผ, ์ํ/์์ ์ถ์ฒ). mAP๋ณด๋ค ๋ ์ธ๋ฐํ ํ๊ฐ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๊ฐ ์งํ๋ ์ ๋ณด ๊ฒ์ ์์คํ ์ ํน์ ์ธก๋ฉด์ ๊ฐ์กฐํ๋ฏ๋ก, ์์คํ ์ ๋ชฉํ์ ์ฌ์ฉ์์ ์๊ตฌ์ ๊ฐ์ฅ ์ ํฉํ ์งํ๋ฅผ ์ ํํ๊ฑฐ๋ ์ฌ๋ฌ ์งํ๋ฅผ ํจ๊ป ์ฌ์ฉํ์ฌ ๋ค๊ฐ์ ์ผ๋ก ์ฑ๋ฅ์ ํ๊ฐํ๋ ๊ฒ์ด ๋ฐ๋์งํฉ๋๋ค. ๐
์ฐธ๊ณ :
- ์ ๋ณด ๊ฒ์(Information Retrieval) ํ๊ฐ ๋ฐฉ๋ฒ: MAP, MRR, DCG, NDCG
- ์ ๋ณด ๊ฒ์(Information Retrieval) ํ๊ฐ๋ ์ด๋ป๊ฒ ํ๋ ๊ฒ์ด ์ข์๊น?(2/2)
๊ด๋ จ ๋ ธํธ: ์ ๋ณด ๊ฒ์ ์์คํ ์ ๊ธฐ๋ณธ ์๋ฆฌ ์ ๋ฐ๋(Precision)์ ์ฌํ์จ(Recall)์ ์ดํด ํ๊ฐ ์งํ ์ ํ ๊ฐ์ด๋: ๋ถ๋ฅ ๋ฌธ์ vs. ๊ฒ์ ๋ฌธ์ ์ถ์ฒ ์์คํ ์ฑ๋ฅ ํ๊ฐ ์งํ: RMSE, MAE, Precision@k, Recall@k ์ง์ ์๋ต(Question Answering) ์์คํ ํ๊ฐ ๋ฐฉ๋ฒ ๋ญํน ์๊ณ ๋ฆฌ์ฆ ๊ฐ์: PageRank๋ถํฐ Learning to Rank๊น์ง ์ด์ง ๊ด๋ จ์ฑ(Binary Relevance) vs ๋ฑ๊ธ๋ณ ๊ด๋ จ์ฑ(Graded Relevance) B ํ ์คํธ๋ฅผ ํตํ ๊ฒ์ ์๊ณ ๋ฆฌ์ฆ ์ฑ๋ฅ ๋น๊ต ์คํ๋ผ์ธ ํ๊ฐ ์งํ์ ์จ๋ผ์ธ ์ฌ์ฉ์ ๋ง์กฑ๋์ ๊ด๊ณ ์ฌ์ฉ์ ๋ก๊ทธ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ๊ฒ์ ํ์ง ๊ฐ์
๐ท๏ธ: ์ ๋ณด ๊ฒ์ ํ๊ฐ ์งํ mAP mRR nDCG ์ฑ๋ฅ ์ธก์ ๊ธฐ๊ณ ํ์ต ๋ฐ์ดํฐ ๊ณผํ ๊ฒ์ ์์ง ์ถ์ฒ ์์คํ ๋ญํน