์ ๋ณด๊ฒ์ #4 ๊ฒ์๋ชจ๋ธ (Retrieval Models)
by JiwonDev์์์ ๋ฌธ์์ ์์ธ๊ณผ ๋๋ต์ ์ธ ์ ๋ณด๊ฒ์ ๋ฐฉ๋ฒ์ ์์๋ดค๋ค๋ฉด,
์ด๋ฒ์๋ ์ค์ ์ ๋ณด๊ฒ์์์๋ ์ด๋ ํ ๋ฐฉ๋ฒ(๊ฒ์๋ชจ๋ธ)์ผ๋ก ์ง์์ ๋ฌธ์์ ์ ์ฌ๋๋ฅผ ๊ตฌํ๋์ง ์์๋ณด์.
๋ํ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก๋ 4๊ฐ์ง๊ฐ ์๋ค.
1. ๋ถ๋ฆฐ ๋ชจ๋ธ(Boolean model)
์งํฉ์ ๊ธฐ๋ฐํ์ฌ ๋ ผ๋ฆฌ์ ์ผ๋ก ์๋ค(True) ์๋ค(False)๋ฅผ ์ง์๋ฌธ์ผ๋ก ๊ฒ์ํ๋ค.
๋ชจ๋ ์์ธ์ด๋ค์ 0๊ณผ 1์ ํ ๋นํ๊ณ ๊ฐ Term๋ค์ ๋ ผ๋ฆฌ ์ฐ์ฐ(and, or, not)์ผ๋ก ์ฐ๊ฒฐํ๋ค.
2. ๋ฒกํฐ ๊ณต๊ฐ ๋ชจ๋ธ(Vector space model)
์์ ๋ถ๋ฆฐ๋ชจ๋ธ์ผ๋ก๋ ์กด์ฌ ์ฌ๋ถ(0 ๋๋ 1)๋ง ์ ์ ์๊ณ ๊ฐ์ค์น๋ฅผ ๊ณ์ฐํ์ฌ ์์(Ranking)๋ฅผ ๋งค๊ธธ ์ ์๋ค.
๊ทธ๋์ ๊ฐ์ค์น๋ฅผ 0~1 ์ฌ์ด์ ๊ฐ์ผ๋ก ์ธก์ ํ๋ ๊ฒ์ด ๋ฒกํฐ ๊ณต๊ฐ ๋ชจ๋ธ.
๊ฐ๊ฐ์ n๊ฐ ์ฉ์ด๋ค์ n-์ฐจ์์ ๊ทธ๋ํ ์ถ(๋ฒกํฐ๊ณต๊ฐ)์ผ๋ก ํํํ๊ณ ์ง์๋ฌธ์ ๋ฒกํฐ ๊ทธ๋ํ์ ๋ฌธ์์ ๋ฒกํฐ๊ทธ๋ํ์ ์ ์ฌ๋๋ฅผ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ.
2-1 ์ฝ์ฌ์ธ ์ ์ฌ๋
์ฝ์ฌ์ธ์ ์ด์ฉํด์ ์ง์ ๊ทธ๋ํ์ ๋ฌธ์ ๊ทธ๋ํ์ ์ฌ์๊ฐ์ ๊ตฌํด 0~1 ์ฌ์ด ์ ์๋ฅผ ๋ถ์ฌํ๋ ๋ฐฉ๋ฒ.
์ฝ๊ฒ๋งํด ๋ ๋ฒกํฐ ๊ทธ๋ํ๊ฐ ์๋ฒฝํ๊ฒ ์ผ์นํ๋ฉด 1์ด, ์ง๊ฐ์ผ๋ก ๊ต์ฐจํ๋ฉด 0์ด ๋์ค๊ฒ ๋ง๋ค๋ฉด ๋ฉ๋๋ค.
Cos(0') = 1
Cos(90') = 0 ์ด๋ฏ๋ก ์ฝ์ฌ์ธ์ผ๋ก ์ ์ฌ๋๋ฅผ ๊ตฌํ๋ฉด ์ฝ๊ฒ ์ ์๋ฅผ ๋งค๊ธธ ์ ์์ต๋๋ค.
(๊ฐ๋๋ฅผ 0~1 ์ ์๋ก ๋ฐ๊พธ๋ ๊ณผ์ ์ ์ ๊ทํ, L2 Normalization ๋ผ ๋ถ๋ฆ ๋๋ค)
์ฐ๋ฆฌ๋ ์ฌ๊ธฐ์ Q์ D์ ์ขํ๊ฐ์ ์๊ณ ์๊ณ , ๊ทธ ์ฌ์๊ฐ์ ๊ตฌํด Cos(์ฌ์๊ฐ)์ ๊ฐ์ ๊ตฌํ๊ณ ์ ํฉ๋๋ค.
์ฌ๊ธฐ์ ์คํ๊ต ์ํ์ ๋์ค๋ ๋ด์ ๊ฐ์ ๊ตฌํ๋ ๊ณต์์ ์ด์ฉํ์ฌ Cos(์ฌ์๊ฐ)์ ์ฝ๊ฒ ๊ตฌํด๋ผ ์ ์์ต๋๋ค.
* [๋๋ณด๊ธฐ] ๋ด์ ์ด ๋ญ์ง ๊ธฐ์ต์ด ์๋๋๋ฐ์?
๋ด์ ๊ฐ์ ๋ ๋ฒกํฐ์ ๋ฐฉํฅ์ ๋ฌด์ํ๊ณ , ์ ๋์ ์ธ ํฌ๊ธฐ๋ฅผ ๊ตฌํ๊ณ ์ถ์ ๋ ์ฌ์ฉํฉ๋๋ค.
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํ์ ๋ฐฉํฅ๊ณผ ์ด๋๋ฐฉํฅ์ด ๊ฐ๋ค๋ฉด, ์ ๋ฌผ์ฒด๋ฅผ ์์ง์ด๋๋ฐ ์ฌ์ฉ๋ ์ผ๋์ [ F * S ]๊ฐ ๋ฉ๋๋ค.
ํ์ง๋ง ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํ์ ๋ฐฉํฅ๊ณผ ์ด๋๋ฐฉํฅ์ด ๋ค๋ฅด๋ค๋ฉด ์ผ๋์ ์ด๋ป๊ฒ ๊ตฌํ ๊น์?
์ด๋ ์ฌ์ฉํ๋๊ฒ [ F * S * Cos(๊ฐ๋) ] ๊ฐ ์ผ๋์ด ๋๊ณ , ์ด๋ฅผ ๋ ๋ฒกํฐ F, S์ ๋ด์ ๊ฐ์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
๋ฒกํฐ์ ๋ด์ ๊ฐ์ ์จ์ ์ ์ด์ฉํ์ฌ ํ์ํฉ๋๋ค. ๋จ, ์ฌ๊ธฐ์ ๋ฒกํฐ์ ๋ฐฉํฅ์ด ๋ฐ๋๋ฐฉํฅ์ธ ๊ฒฝ์ฐ ์์๊ฐ ๋ ์ ์์ผ๋ฏ๋ก ์ ๋๊ฐ์ ์์์ฃผ์ด์ผ ํฉ๋๋ค. (๊ณ์ฐํ ๋์๋ ์ ๊ณฑ์ ํ ํ ๋ฃจํธ๋ฅผ ์์ ์์๋ก ๋ง๋ญ๋๋ค.)
๊ทธ๋ฆฌ๊ณ ๋ด์ ๊ฐ์ ์๋์ ๊ฐ์ ๋ฐฉ๋ฒ์ผ๋ก๋ ๊ตฌํ ์ ์์ต๋๋ค.
F * S * cos(๊ฐ๋)์ ๊ฐ๊ณผ ์์ ๊ณต์์ด ์ ๊ฐ๋๊ตฌ์? ๊ถ๊ธํ๋ฉด ์๋ ๋งํฌ๋ฅผ ํตํด ์ ๋๊ณผ์ ์ ์ดํด๋ด ์๋ค.
์ฝ์ฌ์ธ ์ ์ฌ๋๋ ๋ ๋ฒกํฐ ๊ฐ์ ์ฝ์ฌ์ธ ๊ฐ๋๋ฅผ ์ด์ฉํ์ฌ ๊ตฌํ ์ ์๋ ๋ ๋ฒกํฐ์ ์ ์ฌ๋๋ฅผ ์๋ฏธํฉ๋๋ค. ๋ ๋ฒกํฐ์ ๋ฐฉํฅ์ด ์์ ํ ๋์ผํ ๊ฒฝ์ฐ์๋ 1์ ๊ฐ์ ๊ฐ์ง๋ฉฐ, 90°์ ๊ฐ์ ์ด๋ฃจ๋ฉด 0, 180°๋ก ๋ฐ๋์ ๋ฐฉํฅ์ ๊ฐ์ง๋ฉด -1์ ๊ฐ์ ๊ฐ๊ฒ ๋ฉ๋๋ค. ์ฆ, ๊ฒฐ๊ตญ ์ฝ์ฌ์ธ ์ ์ฌ๋๋ -1 ์ด์ 1 ์ดํ์ ๊ฐ์ ๊ฐ์ง๋ฉฐ ๊ฐ์ด 1์ ๊ฐ๊น์ธ์๋ก ์ ์ฌ๋๊ฐ ๋๋ค๊ณ ํ๋จํ ์ ์์ต๋๋ค. ์ด๋ฅผ ์ง๊ด์ ์ผ๋ก ์ดํดํ๋ฉด ๋ ๋ฒกํฐ๊ฐ ๊ฐ๋ฆฌํค๋ ๋ฐฉํฅ์ด ์ผ๋ง๋ ์ ์ฌํ๊ฐ๋ฅผ ์๋ฏธํฉ๋๋ค.
Q = (x,y,z) D=(a,b,c) ๋ผ๊ณ ๊ฐ์ ํด๋ด ์๋ค.
๋ถ์๋ ๋ฐฑํฐ์ ๋ด์ ๊ณต์์ ์ด์ฉํด์ ๊ฐ์ ์์น์ ์๋ ์ขํ๋ฅผ ๊ณฑํด์ ๋ํ๋ฉด ๋ฉ๋๋ค.
(x,y,z) * (a,b,c) = (x*a + y*b + z*c)
๋ถ๋ชจ |A| ๋ A ๋ฒกํฐ์ ํฌ๊ธฐ๋ฅผ ์๋ฏธํ๋ฉฐ, ๊ฐ ์ฑ๋ถ๋ค์ ์ ๊ณฑํ์ฌ ๋ ํด์ค ํ, ๋ง์ง๋ง์ ๋ฃจํธ(sqrt)๋ฅผ ์์์ฃผ๋ฉด ๋ฉ๋๋ค.
sqrt(x^2 + y^2 + z^2) * sqrt(a^2 + b^2 + c^2)
2-2 ์ด์ง๋ฒกํฐ ํํ
์์ ์ฝ์ฌ์ธ ์ ์ฌ๋ ์์ ์์๋ ๊ณ์ฐ์ ํธ์์ฑ์ ์ํด Q์ D๊ทธ๋ํ๋ฅผ ์ด์ง๋ฒกํฐ๋ก ํํํ์๋ค.
์ฝ๊ฒ ๋งํด ์์ผ๋ฉด 1, ์์ผ๋ฉด 0์ผ๋ก ์ง์์ ๋ฌธ์์ ์ขํ(๋ฒกํฐ ๊ทธ๋ํ)๋ฅผ ์ฐ์๋ค.
2-3 TF-IDF ๋ฒกํฐํํ
์ด๋ฅผ ์์์ ๋ฐฐ์ด TF-IDF๋ก ๋ฒกํฐ๋ฅผ ํํํ์ฌ ๋ ๋์ ์ ์ฌ๋๋ฅผ ์ธก์ ํด๋ณด์.
ํด์ฆ
๋ค์์ ์ ์ฒด ๋ฌธ์์งํฉ C={D1,D2,D3,D4}๋ฅผ ๋ณด์ธ ๊ฒ์ด๋ค. ์๋ ๊ฐ ๋ฌผ์์ ๋ตํ์์ค.
- ๋ฒกํฐ๊ณต๊ฐ๋ชจ๋ธ์ ์ ์์ธ์ฉ์ด๋ค์ ๊ฐ์ผ,๋ง์คํฌ,๋ฐ์ด๋ฌ์ค,๋ถ์กฑ,์์ ,์๋ฐฉ ์์ผ๋ก ๋ฒกํฐ์ฑ๋ถ์ ๋์(๊ฐ์ผ์ด ์ฒซ๋ฒ์งธ ๋ฒกํฐ ์ฑ๋ถ์ ๋์)ํ๋ค๊ณ ๊ฐ์ ํ์์ค.
D1=[๊ฐ์ผ, ๊ฐ์ผ, ์๋ฐฉ, ๋ง์คํฌ], D2=[๋ง์คํฌ, ์์ ], D3=[๋ง์คํฌ, ์ฌ๊ณ , ๋ถ์กฑ], D4=[๋ฐ์ด๋ฌ์ค, ๊ฐ์ผ]
1. ์ ์ ์ฒด๋ฌธ์์งํฉ์ ๋ํด ๋ถ๋ฆฌ์ธ ์ง์ Q="๋ง์คํฌ AND (๊ฐ์ผ OR ๋ถ์กฑ)"์ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ๊ณ์ฐ๊ณผ ์ ๊ณผ ํจ๊ป ํ์ํ์์ค. (๋ถ๋ฆฌ์ธ๊ฒ์๋ชจ๋ธ์ ์ฌ์ฉํ ๊ฒ)
Q = ๋ง์คํฌ and (๊ฐ์ผ or ๋ถ์กฑ)
๋ถ๋ฆฌ์ธ ๋ชจ๋ธ์ ์๋์ง ์๋์ง (0 ๋๋ 1)๋ก๋ง ํ๋จํ์ฌ ๋ ผ๋ฆฌ๊ณ์ฐํ๋ค.
Set(์ง์๋ฌธ) = { ํด๋น๋๋ ๋ฌธ์ }
S(๋ง์คํฌ) = { D1,D2,D3 }
S(๊ฐ์ผ) = { D1,D4 }
S(๋ถ์กฑ) = { D3 }
S(๊ฐ์ผ) or S(๋ถ์กฑ)
= { D1, D4 } or { D3 }
= { D1, D2, D3 }
S(๋ง์คํฌ) and { S(๊ฐ์ผ) or S(๋ถ์กฑ) }
= { D1,D2,D3 } and { D1, D2, D3 }
= { D1, D3 }
2. ์ง์ Q=[๋ง์คํฌ, ๋ง์คํฌ, ๊ฐ์ผ]์ ๋ํด Q์ D1์ ์ด์ง๋ฒกํฐํํ์ ์๋ ํ์ ์ ๊ณ , ์ด ๋ฒกํฐํํ ์ ๊ธฐ๋ฐํ ์ฝ์ฌ์ธ ์ ์ฌ๋ cos(Q,D1)์ ๊ณ์ฐ ์์์ ์ ์ผ์์ค.
๊ฐ์ผ | ๋ง์คํฌ | ๋ฐ์ด๋ฌ์ค | ๋ถ์กฑ | ์์ | ์๋ฐฉ | |
Q | ||||||
D1 |
์ฝ์ฌ์ธ ์ ์ฌ๋ ๊ณ์ฐ๋ฐฉ๋ฒ ( Q = [1,1] D2 = [1,0] ์ธ ๊ฒฝ์ฐ )
Q=[๋ง์คํฌ,๋ง์คํฌ, ๊ฐ์ผ] D1=[๊ฐ์ผ, ๊ฐ์ผ, ์๋ฐฉ, ๋ง์คํฌ] ์ด๋ผ๊ณ ๋ฌธ์ ์์ ๋งํ๋ค.
์ฌ๊ธฐ์ ์ด์ง๋ฒกํฐ ํํ์ ์๋์ง ์๋์ง(1,0)์ผ๋ก ํํํ๋ฉด ๋๋ค.
ํ Q = (1,1,0,0,0,0)
ํ D1 = (1,1,0,0,0,1)
|Q| = sqrt(1+1+0+0+0+0) 1^2์ 1์ด๋ผ์ ์ ๊ณฑ์๋ต.
|D1| = sqrt(3)
cos(Q,D1) = (1*1) + (1*0) / (sqrt(2) * sqrt(3))
= 2 / (sqrt(2) * sqrt(3)), ๋น์ฐํ๊ฑฐ์ง๋ง ๋ฃจํธ๊ฐ์ ๊ณ์ฐํ์ง ์๊ณ ๊ทธ๋ฅ ๋ถ์ ํํ๋ก ์ ์ผ์ ๋ ๋ฉ๋๋ค.
3. ์ง์ Q=[๋ง์คํฌ, ๋ง์คํฌ, ๊ฐ์ผ]์ ๋ํด Q์ D1์ tf๋ฒกํฐํํ์ ์๋ ํ์ ์ ๊ณ , ์ด ๋ฒกํฐํํ์ ๊ธฐ๋ฐํ ์ฝ์ฌ์ธ ์ ์ฌ๋ cos(Q,D1)์ ๊ณ์ฐ ์์์ ์ ์ผ์์ค. tf ๊ฐ์ผ๋ก raw tf๋ฅผ ์ฌ์ฉํ์์ค.
๊ฐ์ผ | ๋ง์คํฌ | ๋ฐ์ด๋ฌ์ค | ๋ถ์กฑ | ์์ | ์๋ฐฉ | |
Q | ||||||
D1 |
Q=[๋ง์คํฌ,๋ง์คํฌ, ๊ฐ์ผ] D1=[๊ฐ์ผ, ๊ฐ์ผ, ์๋ฐฉ, ๋ง์คํฌ] ์ด๋ผ๊ณ ๋ฌธ์ ์์ ๋งํ๋ค.
์ฌ๊ธฐ์ tf(Q,D1) ์ผ๋ก ํํํด๋ผ๊ณ ํ์ผ๋, ๋จ์ด์ ๊ฐฏ์๋ฅผ ์ธ๋ฉด ๋๋ค.
ํ Q = (1,2,0,0,0,0)
ํ D1 = (2,1,0,0,0,1)
|Q| = sqrt(1+4+0+0+0+0)
|D1| = sqrt(4+1+0+0+0+1)
cos(Q,D1) = (1*2)+(2*1)+0+0+0+(0*1) / |Q||D1|
cos(Q,D1) = 4/ sqrt(5) * sqrt(6)
4. ์ง์ Q=[๋ง์คํฌ, ๋ง์คํฌ, ๊ฐ์ผ]์ ๋ํด Q์ D1์ idf๋ฒกํฐํํ์ ์๋ ํ์ ์ ๊ณ , ์ด ๋ฒกํฐํํ ์ ๊ธฐ๋ฐํ ์ฝ์ฌ์ธ ์ ์ฌ๋ cos(Q,D1)์ ๊ณ์ฐ ์์์ ์ ์ผ์์ค. idf๋ ์ฉ์ด t์ ๋ํด log(N/df(t))๋ก ๊ณ์ฐํ์์ค.
๊ฐ์ผ | ๋ง์คํฌ | ๋ฐ์ด๋ฌ์ค | ๋ถ์กฑ | ์์ | ์๋ฐฉ | |
Q | ||||||
D1 |
Q=[๋ง์คํฌ,๋ง์คํฌ, ๊ฐ์ผ]
D1=[๊ฐ์ผ, ๊ฐ์ผ, ์๋ฐฉ, ๋ง์คํฌ], D2=[๋ง์คํฌ, ์์
], D3=[๋ง์คํฌ, ์ฌ๊ณ , ๋ถ์กฑ], D4=[๋ฐ์ด๋ฌ์ค, ๊ฐ์ผ]
์ ์ด์ log(N/df(t))๋ก ๊ณ์ฐํด๋ผ๊ณ ํ์ผ๋ ๊ทธ๋ ๊ฒ ํ๋ฉด ๋๋ค.
์ฐธ๊ณ ๋ก df(๋จ์ด) ๋ ์ ์ฒด๋ฌธ์์์ ํด๋น ๋จ์ด๋ฅผ ํ๋๋ผ๋ ๊ฐ์ง ๋ฌธ์์ ๊ฐฏ์๋ฅผ ์๋ฏธํ๋ค.
ํ Q = ( log(4/2), log(4/3), 0, 0, 0, 0 )
ํ D1 = ( log(4/2), log(4/3), 0, 0, 0, log(4/1) )
์ดํ๋ ์์๋ง ๋ณต์กํ ๋ฟ, ์ถฉ๋ถํ ํ ์ ์์๊ฑฐ๋ผ ์๊ฐ์ด ๋ ๋ค.
5. ์ง์ Q=[๋ง์คํฌ, ๋ง์คํฌ, ๊ฐ์ผ]์ ๋ํด Q์ D1์ tf*idf๋ฒกํฐํํ์ ์๋ ํ์ ์ ๊ณ , ์ด ๋ฒกํฐํ ํ์ ๊ธฐ๋ฐํ ์ฝ์ฌ์ธ ์ ์ฌ๋ cos(Q,D1)์ ๊ณ์ฐ ์์์ ์ ์ผ์์ค. ์ฉ์ด t์ tf ๊ฐ์ 1+log(tf(t))๋ก ๊ณ ์ฐํ๊ณ , idf ๊ฐ์ log(N/df(t))๋ก ๊ณ์ฐํ์์ค.
๊ฐ์ผ | ๋ง์คํฌ | ๋ฐ์ด๋ฌ์ค | ๋ถ์กฑ | ์์ | ์๋ฐฉ | |
Q | ||||||
D1 |
Q=[๋ง์คํฌ,๋ง์คํฌ, ๊ฐ์ผ]
D1=[๊ฐ์ผ, ๊ฐ์ผ, ์๋ฐฉ, ๋ง์คํฌ], D2=[๋ง์คํฌ, ์์
], D3=[๋ง์คํฌ, ์ฌ๊ณ , ๋ถ์กฑ], D4=[๋ฐ์ด๋ฌ์ค, ๊ฐ์ผ]
tf = 1+log(tf(t))
idf = log(N/df(t)) ์ฐ๋๋ค. ใ
ใ
?
Q = TF(Q,D1) * IDF(Q)
Q = ( (1+log(1)) * log(4/2), (1+log(2)) * log(4/3), 0, 0, 0, 0)
D1 =( (1+log(1)) * log(4/2), (1+log(2)) * log(4/3), 0, 0, 0, (1+log(1)) * log(4/1))
๋ค์์ ์ ์ฒด ๋ฌธ์์งํฉ C={D1,D2,D3,D4,D5}๋ฅผ ๋ณด์ธ ๊ฒ์ด๋ค. ๊ฐ ๋ฌธ์๋ ์์ธ์ฉ์ด๋ค์ ๋์ด์ ํํ ํ ๊ฒ์ผ๋ก ๊ฐ์ (์ฆ, a,b,c,d๋ฅผ ์์ธ ์ฉ์ด๋ก ๊ณ ๋ ค)ํ๊ณ ์๋ ๊ฐ ๋ฌผ์์ ๋ตํ์์ค. ๋ฒกํฐ๊ณต๊ฐ๋ชจ๋ธ์์ ์์ธ์ฉ์ด๋ค์ a,b,c,d ์์ผ๋ก ๋ฒกํฐ์ฑ๋ถ์ ๋์(a๊ฐ ์ฒซ๋ฒ์งธ ๋ฒกํฐ์ฑ๋ถ์ ๋์)ํ๋ค๊ณ ๊ฐ์ ํ์์ค.
D1=[a,a,a,b], D2=[c,d], D3=[a,b,c], D4=[a,c], D5=[a,c,c]
6. ์ง์ Q=[a,c]์ ๋ํด Q์ D1์ ์ด์ง๋ฒกํฐํํ์ ์๋ ํ์ ์ ๊ณ , ์ด ๋ฒกํฐํํ์ ๊ธฐ๋ฐํ ์ฝ์ฌ์ธ ์ ์ฌ๋ cos(Q,D1)์ ๊ณ์ฐ ์์์ ์ ์ผ์์ค.
a | b | c | d | |
Q | ||||
D1 |
Q=[a,c]
D1=[a,a,a,b], D2=[c,d], D3=[a,b,c], D4=[a,c], D5=[a,c,c]
์ด์ง๋ฒกํฐ (0 ๋๋ 1)๋ก ํํ.
cos(Q,D1) ์ ๊ตฌํ๋ผ
7. ์ง์ Q=[a,c]์ ๋ํด Q์ D1์ tf๋ฒกํฐํํ์ ์๋ ํ์ ์ ๊ณ , ์ด ๋ฒกํฐํํ์ ๊ธฐ๋ฐํ ์ฝ์ฌ์ธ ์ ์ฌ๋ cos(Q,D1)์ ๊ณ์ฐ ์์์ ์ ์ผ์์ค.
a | b | c | d | |
Q | ||||
D1 |
Q=[a,c]
D1=[a,a,a,b], D2=[c,d], D3=[a,b,c], D4=[a,c], D5=[a,c,c]
tf๋ก ํํ.
cos(Q,D1) ์ ๊ตฌํ๋ผ
'๐ฑโ๐ป์ ๊ณต ๊ณต๋ถ > ์ ๋ณด๊ฒ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
#6-1 ์ ๋ณด๊ฒ์ ์ฑ๋ฅ ํ๊ฐ (P, R, F1, PRC) (0) | 2021.06.01 |
---|---|
#5 ๋ฒกํฐ ๋ชจ๋ธ SMART ํ๊ธฐ๋ฒ (0) | 2021.05.31 |
์ ๋ณด๊ฒ์ #3 ์์ธ(Indexing) (0) | 2021.04.15 |
์ ๋ณด๊ฒ์ #2 TF-IDF ์์ธํ ์์๋ณด๊ธฐ (0) | 2021.04.13 |
์ ๋ณด๊ฒ์ #1 ๊ฐ์ (0) | 2021.03.16 |
๋ธ๋ก๊ทธ์ ์ ๋ณด
JiwonDev
JiwonDev