JiwonDev

#6-2 정보검색 μ„±λŠ₯평가 (MAP, Pre@K, R-pre, NDCG)

by JiwonDev

# MAP (Mean Average Precision)

μš©μ–΄κ°€ λ‚˜μ™€μ„œ μ–΄λ €μ›Œ λ³΄μ΄μ§€λ§Œ, 사싀 각 질의문의 평균정확λ₯  (AP, Average Precision)을 더해 평균(Mean)을 λ‚Έ 값이닀.

 AP(Average Precision) : ν•˜λ‚˜μ˜ 질의문(Q)에 얻은 κ²€μƒ‰λ¬Έμ„œμ—μ„œ $ \frac{μ ν•©λ¬Έμ„œκ°€ λ‚˜μ˜¨ 곳의 Precision}{전체 μ ν•©λ¬Έμ„œμ˜ 수}$

 

μ•ž κΈ€ PRCμ—μ„œ λ§Œλ“  ν‘œμ—μ„œ (μ ν•©λ¬Έμ„œκ°€ λ‚˜μ˜¨ μ •ν™•λ₯ )만 λ½‘μ•„λ‚΄μ„œ (전체 μ ν•©λ¬Έμ„œμ˜ 수)둜 λ‚˜λˆˆλ‹€κ³  μƒκ°ν•˜λ©΄ λœλ‹€. 

2021.06.01 - [λΆ„λ₯˜ 전체보기] - #6-1 정보검색 μ„±λŠ₯ 평가 (P, R, F1, PRC)

 

μ•„λž˜ ν‘œμ—μ„œ μ ν•©λ¬Έμ„œμ˜ μœ„μΉ˜λŠ” Rank 1, 3, 6 μ΄λ―€λ‘œ 각각의 μ •ν™•λ₯  (1.0, 0.67. 0.5) λ₯Ό λ”ν•΄μ„œ λ‚˜λˆ„λ©΄ λœλ‹€.

μ΄λ•Œ λ‚˜λˆ„λŠ” λΆ„λͺ¨λŠ” 전체 λ¬Έμ„œκ°€ μ•„λ‹ˆλΌ '전체 μ ν•©λ¬Έμ„œ 수'μž„μ„ μœ μ˜ν•˜μž.

AP = (1.0 + 0.67 + 0.5 ) / 5

였λ₯Έμͺ½ μˆ˜μ‹μ΄ μ–΄λ €μ›Œ 보인닀면 λ¬΄μ‹œν•΄λ„ λœλ‹€. μ„€λͺ…ν•œ λ‚΄μš©μ„ λ‹¨μˆœνžˆ μˆ˜μ‹μœΌλ‘œ λ°”κΎΌ 것 뿐이닀.

 

보톡 λͺ¨λΈμ„ 평가할 λ•ŒλŠ” ν…ŒμŠ€νŠΈμš© 질의문 50개 이상을 μ‚¬μš©ν•˜λ‹ˆ, 각각의 μ§ˆμ˜λ¬Έμ— λŒ€ν•΄ APλ₯Ό ꡬ해 평균을 λ‚΄λ©΄ λœλ‹€.

그게 λ°”λ‘œ MAP(Mean Average Precision)이닀.

μœ„ μ˜ˆμ œμ—μ„œλŠ” 질의문이 1κ°œλΏμ΄λ―€λ‘œ κ·Έλƒ₯ APλ₯Ό κ΅¬ν•˜λ©΄ 그게 MAP이닀.


# 예제

μ•ž κΈ€μ—μ„œ ν‘Ό λ§ˆμ§€λ§‰ 문제λ₯Ό MAP둜 ν’€λ©΄

Rank2 μ •ν™•λ₯ (P) = 1/2(0.5)

Rank6 μ •ν™•λ₯ (P) = 2/6(0.333) μ΄λ―€λ‘œ

AP = 0.5 + 0.333 / 4 (전체 적합 λ¬Έμ„œμ˜ 수) 이닀.

질의문이 1개 밖에 μ—†μœΌλ―€λ‘œ MAP의 값은 APκ°’κ³Ό κ°™λ‹€. 

3. λ‹€μŒ ν‘œλŠ” 질의 Q에 λŒ€ν•œ κ²€μƒ‰λ¬Έμ„œ 집합 전체λ₯Ό 보인 것이닀. 질의 Q의 μ ν•©λ¬Έμ„œμ§‘ν•© R = { 800:1, 690:3, 700:3 ,500:2 } 라고 ν•  λ•Œ μ•„λž˜ μ§ˆλ¬Έμ— λ‹΅ν•˜μ‹œμ˜€. ( μ°Έκ³ . 900:1 μ˜λ―ΈλŠ” D900 λ¬Έμ„œμ˜ 적합도가 1μ΄λΌλŠ” μ˜λ―Έμ΄λ‹€. )
Rank Document No. 적합도
1 381 0
2 800 1
3 456 0
4 451 0
5 761 0
6 690 3
7 295 0

# μƒμœ„λ¬Έμ„œ μ •ν™•λ₯  Pre@ (Precision at K)

κ·Έλƒ₯ μ•žμ—μ„œ κ΅¬ν•œ ν‘œμ—μ„œ νŠΉμ • Rank의 μ •ν™•λ₯ μ„ μ‚¬μš©ν•˜λŠ” 방법이닀. μ§„μ§œ 말 κ·ΈλŒ€λ‘œ

Pre@3 = Rank3의 μ •ν™•λ₯  = 0.67 

Pre@6 = Rank6의 μ •ν™•λ₯  = 0.5

정말 κ°„λ‹¨ν•œ 방법이닀. λ‹€λ₯Έ 방법과 λ‹€λ₯΄κ²Œ 총 μ ν•©λ¬Έμ„œμ˜ 개수λ₯Ό μ•Œ ν•„μš”λ„ μ—†λ‹€.

λ‹€λ§Œ μƒμœ„ Rank만 νŒλ‹¨ν•˜λ‹€λ³΄λ‹ˆ μ•žλΆ€λΆ„μ— λ‚˜μ˜¨ μ ν•©λ¬Έμ„œμ˜ κ°œμˆ˜κ°€ μ μˆ˜μ— 큰 영ν–₯을 λ―ΈμΉ˜λ―€λ‘œ μ‹€μ œ 점수λ₯Ό κ΅¬ν•˜λŠ” 쒋은 방법이라고 λ³Ό μˆ˜λŠ” μ—†λ‹€. (=평가 μ„±λŠ₯이 λΆˆμ•ˆμ •ν•˜λ‹€.)

 

이 방법은 μ›Ή 검색 λͺ¨λΈμ„ 평가할 λ•Œ 자주 μ‚¬μš©ν•˜λŠ”λ° κ·Έ μ΄μœ λŠ” μš°λ¦¬κ°€ μ›Ήμ—μ„œ 검색할 λ•ŒλŠ” 전체 검색 λ¬Έμ„œλ₯Ό 보지 μ•Šκ³  μƒμœ„ 10κ°œμ •λ„λ§Œ μ½μœΌλ―€λ‘œ (μ‚¬λžŒμ΄λ‹ˆκΉŒ) 전체 κ²€μƒ‰λ¬Έμ„œμ˜ ν‰κ· μ μˆ˜λ³΄λ‹€ μƒμœ„λ¬Έμ„œ μ •ν™•λ₯ μ΄ 더 μ€‘μš”ν•˜κΈ° λ•Œλ¬Έμ΄λ‹€. λ˜ν•œ μ›Ή 검색 결과의 경우 'μ ν•©λ¬Έμ„œμ˜ 개수'λ₯Ό νŒλ³„ν•˜λŠ”κ²Œ μ–΄λ €μ›Œμ„œ λ‹€λ₯Έ 평가 방법을 쓰기도 κΉŒλ‹€λ‘­κΈ°λ„ ν•˜λ‹€.

μ—¬λ‹΄μœΌλ‘œ, 보톡 μ›Ή 검색 μ ν•©λ¬Έμ„œ μ—¬λΆ€ νŒλ³„μ€ μ‚¬λžŒμ΄ μ§μ ‘ν•œλ‹€.


# R-precision

νŠΉμ • 질의문(Q)에 λŒ€ν•œ (총 μ ν•©λ¬Έμ„œ 수 ==  λ¬Έμ„œμ§‘ν•© 개수)인 μ •ν™•λ₯ μ„ κ΅¬ν•œλ‹€.

이것도 κ°„λ‹¨ν•˜λ‹€. μ•„λž˜ ν‘œμ—μ„œ [총 μ ν•©λ¬Έμ„œμ˜ 수]λŠ” 5μ΄λ―€λ‘œ [λ¬Έμ„œ μ§‘ν•©μ˜ 개수]κ°€ 5κ°œκ°€ λ˜λŠ” Rank5μ—μ„œμ˜ μ •ν™•λ₯ (0.4)λ₯Ό μ‚¬μš©ν•œλ‹€. 즉 μ ν•©λ¬Έμ„œ μˆ˜μ— ν•΄λ‹Ήν•˜λŠ” Rankλ₯Ό μ°Έμ‘°ν•˜κ² λ‹€λŠ” 말.

 

μ§ˆμ˜λ§ˆλ‹€ ν•΄λ‹Ή μ§ˆμ˜μ— 'μ ν•©ν•œ λ¬Έμ„œμ˜ 개수' λŠ”  λ‹€λ₯΄λ‹€.

μ§ˆμ˜λ§ˆλ‹€ [μ ν•©λ¬Έμ„œμ˜ 개수 ==  Rank] μ§€μ μ˜ μ •ν™•λ₯ μ„ ꡬ해 λ‹€ λ”ν•΄μ„œ 평균을 λ‚΄λ©΄ λœλ‹€.

이름이 R- 인 μ΄μœ λŠ” μ ν•©λ¬Έμ„œ 집합을 보톡 (R, Relevant)라고 λΆ€λ₯΄κΈ° λ•Œλ¬Έ.


# NDCG (Normalized Discounted Cumulative Gain)

μœ„μ—μ„œ μ‚¬μš©ν•œ PRC, MAP, Pre@, R-Precision 의 κ²½μš°λŠ” 이진 적합도(μ ν•©ν•˜λ‹€, μ•„λ‹ˆλ‹€)λ₯Ό κΈ°μ€€μœΌλ‘œ λΆ„λ₯˜ν–ˆλ‹€.

그런데 μ‹€μ œ 검색 λͺ¨λΈμ—μ„œλŠ” 닀쀑 적합도(μ™„μ „νžˆ 닀름, 쑰금 λΉ„μŠ·ν•¨, 많이 λΉ„μŠ·ν•¨, 적합함)λ₯Ό μ‚¬μš©ν•˜λŠ”λ°, 이λ₯Ό κ΅¬ν˜„ν•œ μ„±λŠ₯ 평가 방법이 NDCG 이닀.

 

NDCG의 μˆ˜μ‹μ€ μ’€ λ³΅μž‘ν•œλ°, μ•„λž˜ 글을 읽으며 μ–΄λ–»κ²Œ 이런 μˆ˜μ‹μ΄ λ‚˜μ˜€κ²Œ λ˜μ—ˆλŠ”μ§€ μ΄ν•΄ν•˜λ©΄ 어렡지 μ•Šλ‹€.

 

NDCGλŠ” CGμ—μ„œλΆ€ν„° μΆœλ°œν•˜μ˜€λ‹€.

 

# CG (λˆ„μ μ΄λ“, λˆ„μ μ‚¬μš©μžλ§Œμ‘±λ„, Cumulative Gain)

μƒμœ„ K개의 κ²€μƒ‰λ¬Έμ„œμ— λŒ€ν•΄μ„œ λ‹¨μˆœν•˜κ²Œ μ‚¬μš©μžμ˜ λ§Œμ‘±λ„ 값을 μ „λΆ€ λ”ν•œ 값이닀.

λ§Œμ‘±λ„ 값은 말 κ·ΈλŒ€λ‘œ 'μ‚¬μš©μžκ°€ ν‰κ°€ν•œ κ°’' 이기 λ•Œλ¬Έμ—, λ‹¨μˆœνžˆ λ”ν•΄μ£ΌκΈ°λ§Œ ν•˜λ©΄ ꡬ할 수 μžˆλ‹€.

(ex 3: 완벽함  2: 거의 λΉ„μŠ·ν•¨  1: μ•½κ°„ λΉ„μŠ·ν•¨  0: μ™„μ „ 닀름) 

λ‹Ήμ—°νžˆ 이런 μ‹μœΌλ‘œ κ΅¬ν•œ CG(λˆ„μ  λ§Œμ‘±λ„) ν‰κ°€μ—μ„œλŠ” 각 λ¬Έμ„œμ˜ μˆœμœ„λ₯Ό μ „ν˜€ λ°˜μ˜ν•˜μ§€ λͺ»ν•œλ‹€. κ·Έλƒ₯ λ”ν–ˆμœΌλ‹ˆκΉŒ 

(제일 μ ν•©ν•œ λ¬Έμ„œκ°€ 1μˆœμœ„λ“  6μˆœμœ„λ“  μ–΄λ””λ“  검색 결과에 있기만 ν–ˆμœΌλ©΄ CG값은 λ™μΌν•˜λ‹€.)

 

# DCG (차감 CG, Discount Cumulative Gain)

Discount CG, λ§Œμ‘±λ„ 값을 λ‹¨μˆœνžˆ λ”ν•˜μ§€ μ•Šκ³ , μˆœμœ„μ— 따라 κΉŽμ•„μ„œ(Discount) λ”ν•˜λŠ” 방법이닀.

CGμ—μ„œ 일반적인 λ§Œμ‘±λ„λ₯Ό μ‚¬μš©ν–ˆλ‹€λ©΄ DCGμ—μ„œλŠ” μˆœμœ„μ— 따라 점수λ₯Ό κΉŽλŠ” 식

λ‹¨μˆœν•œ 예λ₯Ό λ“€μ–΄ $\frac{λ§Œμ‘±λ„}{λ¬Έμ„œκ°œμˆ˜}$ 의 값을 DCG μˆ˜μ‹μœΌλ‘œ μ΄μš©ν•œλ‹€κ³  μƒκ°ν•΄λ³΄μž..

Rank1 = 점수/1 = 3/1

Rank2 = 점수/2 = 2/2

...Rank6 = 점수/6 = 2/6 이런 μ‹μœΌλ‘œ 점수λ₯Ό κ²€μƒ‰λœ λ¬Έμ„œ 수(==Rank κ°’)으둜 λ‚˜λˆ μ£Όλ©΄ λœλ‹€. 

 

λ‹€λ§Œ μ‹€μ œ 검색 λͺ¨λΈμ—μ„œ νŒ¨λ„ν‹° κ°’(Discount)은 μ΄λ ‡κ²Œ λ‹¨μˆœν•˜κ²Œ κ³„μ‚°ν•˜μ§€λŠ” μ•ŠκΈ°μ— μˆ˜μ‹μ΄ μ’€ λ³΅μž‘ν•΄μ§„λ‹€.

ν•΄λ‹Ή DCG μˆ˜μ‹μ„ 직접 μ†μœΌλ‘œ κ³„μ‚°ν•˜λŠ” 일은 μ—†μœΌλ‹ˆ μ•ˆμ‹¬ν•˜μž.

 

λ‹€λ§Œ DCGλ₯Ό μ‚¬μš©ν•˜μ—¬ μˆœμœ„μ— λ”°λ₯Έ 점수λ₯Ό 뢀여해도 '질의 λ§ˆλ‹€ κ²€μƒ‰λœ 개수' 와 '적합 λ¬Έμ„œμ˜ 개수' λ₯Ό λ°˜μ˜ν•˜μ§€ λͺ»ν•œλ‹€.

μ‰½κ²Œ 말해 100개 μ°Ύμ•„μ„œ 99κ°œκ°€ 정닡인 경우(99%), 3개 μ°Ύμ•„μ„œ 3κ°œλ‹€ 정닡인 경우(100%)μ—μ„œ λ‹Ήμ—°νžˆ μ „μžκ°€ 더 쒋은 μ‹œμŠ€ν…œμΈλ°, DCGλ₯Ό μ‚¬μš©ν•˜λ©΄ 3개 λ‹€ μ •λ‹΅ 인게 더 μ μˆ˜κ°€ λ†’κ²Œ λ‚˜μ˜¨λ‹€.

 

이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 점수λ₯Ό μ •κ·œν™”(Normalized)ν•œ NDCGλ₯Ό μ‚¬μš©ν•œλ‹€.

 

#λ‹€μ‹œ λŒμ•„μ˜¨ NDCG (Normalized DCG)

정말 κ°„λ‹¨ν•˜κ²Œ μ„€λͺ…ν•˜λ©΄, μ•žμ—μ„œ κ΅¬ν•œ DCG 값을 IDCG둜 λ‚˜λˆ„μ–΄μ„œ μ •κ·œν™” μ‹œν‚¨ 값이닀.

IDCG(Ideal DCG)λŠ” 이상적인, κ²€μƒ‰ν•˜λ©΄ μ ν•©λ¬Έμ„œλ§Œ λ‚˜μ˜€λŠ” 100% μ •ν™•λ₯ μ„ 가진 μ‹œμŠ€ν…œμ—μ„œ λ‚˜μ˜€λŠ” DCG값을 μ˜λ―Έν•œλ‹€.

k λŠ” 점수λ₯Ό ꡬ할 μƒμœ„λ¬Έμ„œμ˜ 개수λ₯Ό μ˜λ―Έν•œλ‹€.

 

# κ°„λ‹¨ν•œ NDCG 예제

λ§Œμ‘±λ„ λŠ” μ‚¬λžŒμ΄ 직접 ν‰κ°€ν•œ 값이며 ( 3: 완벽함  2: 거의 λΉ„μŠ·ν•¨  1: μ•½κ°„ λΉ„μŠ·ν•¨  0: μ™„μ „ 닀름) λ₯Ό μ‚¬μš©ν•œλ‹€.

$CG_k$ λŠ” μƒμœ„ K개의 λ¬Έμ„œμ—μ„œ λ§Œμ‘±λ„μ˜ 합을 μ˜λ―Έν•˜λ©° λ§Œμ‘±λ„λŠ” μ‚¬λžŒμ΄ 직접 ν‰κ°€ν•œ 값이닀.

$DCG_k$ λŠ” $\frac{CG}{λ¬Έμ„œκ°œμˆ˜}$ μˆ˜μ‹μ„ μ΄μš©ν•˜κ² λ‹€. CG와 λ§ˆμ°¬κ°€μ§€λ‘œ 값을 λ‹€ λ”ν•΄μ„œ ꡬ할 수 μžˆλ‹€.

$IDCG_k$ λŠ” λ§Œμ‘±λ„κ°€ 높은 순으둜 μ •λ ¬λ˜μ–΄ κ²€μƒ‰λ˜λŠ” μ™„λ²½ν•œ μ‹œμŠ€ν…œμ—μ„œ DCG 값이닀.

μ•„λž˜ ν‘œμ—μ„œλŠ” Optimal Discount Gain (μ΅œμ ν™”λœ DCG)라고 ν‘œκΈ°ν•˜μ˜€λ‹€. 

그럼 계산방법은 κ°„λ‹¨ν•˜λ‹€.

$DCG_6$ = λͺ¨λ“  DCG의 ν•©, 13.85

$IDCG_6$ = 이상적인 μ‹œμŠ€ν…œμ—μ„œ λͺ¨λ“  DCGμ˜ν•©, 14.60

$NDCG_6$ =  $\frac{13.85}{14.60}$

 

λ‹€λ§Œ μœ„μ—μ„œ λ§ν–ˆμ§€λ§Œ, μ‹€μ œ DCG μˆ˜μ‹μ€ μ΄λ ‡κ²Œ λ‹¨μˆœν•˜μ§€ μ•ŠκΈ°μ— μ‹€μ œ NDCGλŠ” μ•„λž˜μ˜ μˆ˜μ‹μ„ μ‚¬μš©ν•œλ‹€.

ν•΄λ‹Ή DCG μˆ˜μ‹μ„ μœ„μ—μ„œ λ°©λ²•λŒ€λ‘œ κ³„μ‚°ν•˜λ©΄ 이런 λͺ¨μ–‘μ˜ NDCGκ°€ λ‚˜μ˜¨λ‹€.

λ¬Όλ‘  이λ₯Ό μ‚¬λžŒμ΄ 직접 계산할 일은 μ—†μœΌλ―€λ‘œ, μš°λ¦¬λŠ” $NDCG(Q,k)$ = $\frac{DCG_k}{IDCG_k}$ 만 κΈ°μ–΅ν•˜λ©΄ λœλ‹€.



#ν€΄μ¦ˆ

3. λ‹€μŒ ν‘œλŠ” 질의 Q에 λŒ€ν•œ κ²€μƒ‰λ¬Έμ„œ 집합 전체λ₯Ό 보인 것이닀. 질의 Q의 μ ν•©λ¬Έμ„œμ§‘ν•© R={ 800:1, 690:3, 700:3 ,500:2 } 라고 ν•  λ•Œ μ•„λž˜ μ§ˆλ¬Έμ— λ‹΅ν•˜μ‹œμ˜€. ( μ°Έκ³ . 800:1 μ˜λ―ΈλŠ” D800 λ¬Έμ„œμ˜ 적합도가 1μ΄λΌλŠ” μ˜λ―Έμ΄λ‹€. )
Rank Document No. 적합도
1 381 0
2 800 1
3 456 0
4 451 0
5 761 0
6 690 3
7 295 0

 

3-1 MAP, Pre@5, R-precision을 κ΅¬ν•˜μ‹œμ˜€

풀이

더보기

Pre@5λŠ” Rank5μ—μ„œμ˜ μ •ν™•λ₯ μ΄λ―€λ‘œ

P = 1/5 이 정닡이닀.

 

R-precision 은 전체 μ ν•©λ¬Έμ„œμ˜ 개수λ₯Ό Rank μœ„μΉ˜λ‘œ μƒκ°ν•œ μ •ν™•λ₯ μ„ κ΅¬ν•˜λ―€λ‘œ

μ „μ²΄μ ν•©λ¬Έμ„œμ˜ 개수 = 4개

Rank4의 μ •ν™•λ₯  P = 1/4 이 정닡이닀.

 

MAP 은 λͺ¨λ“  질의문의 AP(평균정확λ₯ )을 ꡬ해 평균을 λ‚Έ 값이닀.

APλŠ” [μ ν•©λ¬Έμ„œκ°€ λ‚˜μ˜¨ Rank의 μ •ν™•λ₯ ]의 합을 [전체 μ ν•©λ¬Έμ„œκ°œμˆ˜] 둜 λ‚˜λˆ„λ©΄ λœλ‹€.

질의 Q에 λŒ€ν•œ 전체 μ ν•©λ¬Έμ„œ R={ D800, D690, D700, D500 } 라고 ν–ˆμœΌλ―€λ‘œ

 

Rank 2 => μ •ν™•λ₯  1/2

Rank 6 => μ •ν™•λ₯  2/6

 

질의 Q에 λŒ€ν•œ 전체 μ ν•©λ¬Έμ„œλŠ” 3개라고 ν–ˆμœΌλ‹ˆκΉŒ

AP = (1/2) + (2/6) / 3

MAP(APλ“€μ˜ 평균)은 질의문이 1κ°œλ°–μ— μ—†μœΌλ‹ˆ AP의 κ°’κ³Ό λ™μΌν•˜λ‹€.

 

 

3-2 CG_7, DCG_7, NDCG_7을 κ΅¬ν•˜μ‹œμ˜€. (단 Discount Gain은 Gain값을 μˆœμœ„λ‘œ λ‚˜λˆˆ 값을 μ‚¬μš©ν•  것)

풀이

더보기

CGλŠ” λ‹¨μˆœνžˆ κ²€μƒ‰λœ λ¬Έμ„œμ—μ„œ λͺ¨λ“  λ§Œμ‘±λ„λ₯Ό λ”ν•œ 값이닀.

CGλŠ” 1+3 = 4

 

DCG의 값은 Gain κ°’(λ§Œμ‘±λ„)λ₯Ό μˆœμœ„λ‘œ λ‚˜λˆˆ 값을 μ‚¬μš© ν•˜λΌκ³  λ¬Έμ œμ— μ ν˜€μžˆλ‹€.

즉 DCG = $\frac{λ§Œμ‘±λ„}{rank}$

DCGλŠ” (1/2) + (3/6) = 1

 

IDCGλŠ” λͺ¨λ“  μ ν•©λ¬Έμ„œκ°€ 적합도가 높은 μˆœμ„œλŒ€λ‘œ λ‚˜μ˜€λŠ” μ™„λ²½ν•œ κ²€μƒ‰μ‹œμŠ€ν…œμ—μ„œμ˜ DCGμ΄λ―€λ‘œ

μ ν•©λ¬Έμ„œ R = { 800:1, 690:3, 700:3 ,500:2 }

IDCG = (3/1) + (3/2) + (2/3) + (1/4)

참고둜 $ IDCG_7 $ λ©΄ μ΄λŸ°μ‹μœΌλ‘œ 7번 λ”ν•˜λ©΄ λœλ‹€. λ‹€λ§Œ λ’€μ˜ 값듀은 0μ΄λΌμ„œ μƒλž΅ν–ˆμ„ 뿐이닀.

 

NDCG λŠ” $\frac{DCG_k}{IDCG_k}$ μ΄λ―€λ‘œ

NDCG = 1 / (3/1) + (3/2) + (2/3) + (1/4)

 

쉽닀. IDCGλ₯Ό ꡬ할 λ•Œ ν‘œμ—λ§Œ μžˆλŠ” μ ν•©λ¬Έμ„œκ°€ μ•„λ‹Œ 'λͺ¨λ“  μ ν•©λ¬Έμ„œ'λ₯Ό DCG 값을 κ΅¬ν•˜λŠ” κ²ƒλ§Œ μœ μ˜ν•˜μž.

 

Precision, Recall, F1, PRC, MAP, Pre@K, R-precison, NDCG에 λŒ€ν•΄μ„œ λ°°μ›Œλ³΄μ•˜λ‹€. 총 8가지!

λΈ”λ‘œκ·Έμ˜ 정보

JiwonDev

JiwonDev

ν™œλ™ν•˜κΈ°