ํ์ฌ์์ ๋ณด๋ด์ค ECIR 2018 ์ฐธ์ ํ๊ธฐ๋ฅผ ๋ธ๋ก๊ทธ์ ์ ์ต๋๋ค (ํ์ฌ์ ์ ์ถํ๋ ํ๊ธฐ๋ผ์ ์กด๋๋ง๋ก ์ผ์ต๋๋ค)


ECIR (European Conference of Information Retrieval)์ ์ ๋ฝ์ธ๋ค์ด ์ ๋ณด ๊ฒ์ ๋ถ์ผ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๋ ผ์ํ๋ ํฌ๋ผ์ ๋๋ค. ์ฌํด๊ฐ 40๋ฒ์งธ์ธ ์ด ํํ๋ 3์ 26์ผ๋ถํฐ 29์ผ๊น์ง ๋ํ๊ฐ ๋ค์ด๋ฒ๋ฉ์ค์ ๋ฝ์ด ์์นํ ํ๋์ค ๊ทธ๋ฅด๋ ธ๋ธ(Grenoble)์ด๋ ๋์์์ ๊ฐ์ต๋์ต๋๋ค. ๊ทธ๋ฅด๋ ธ๋ธ์ 1968๋ ๋๊ณ ์ฌ๋ฆผํฝ์ด ๊ฐ์ต๋ ๊ณณ์ด๋ผ์ ์ ํฌ๋ผ๋ฆฌ๋ ‘ํ๋์ค์ ํ์ฐฝโ์ด๋ผ๊ณ ๋ถ๋ฅด๊ธฐ๋ ํฉ๋๋ค. ์ด ๋์๋ ์ธ๊ตฌ 16๋ง๋ช ์ค์์ ํ์์ด 5~6๋ง๋ช ์ ๋ฌํ ์ ๋๋ก ํ๋ฌธ๊ณผ ์ฐ๊ตฌ์ ๋์๋ผ๋ค์.
ECIR์ ์ด์ CORE์ A๋ฑ๊ธ ์ปจํผ๋ฐ์ค๊ฐ ๋๋ค๊ณ ํฉ๋๋ค. A ๋ฑ๊ธ์ ์๋ฏธ๋ “excellent conference, and highly respected in a discipline areaโ๋ผ๊ณ ํฉ๋๋ค. ์ด ์์ A*๋ฑ๊ธ์ด ํ๋ ๋ ์์ต๋๋ค. ์์ง S๊ธ ์ปจํผ๋ฐ์ค๊ฐ ๋๊ธฐ๋ ๋ฉ์๊ณ , ์ด์ ๋ง B๊ธ ํํ์์ A๊ธํํ๊ฐ ๋๋ค๊ณ ์ดํดํ๋ฉด ๋ ๊ฒ ๊ฐ์ต๋๋ค. ๊ฐํ์ฌ์์ ๋ฐํ ์ฌํด Full paper์ ํฉ๊ฒฉ๋ฅ ์ 23% (39/173), Short paper์ ํฉ๊ฒฉ๋ฅ ์ 34% (36/106)์ด์์ต๋๋ค. Full paper ๊ธฐ์ค, ์ ์ถ์์ ํฉ๊ฒฉ์๋ฅผ ๊ตญ๊ฐ๋ณ๋ก ๊ตฌ๋ถํ๋๋ ๋ฌ๊ธ์์ด ์ค๊ตญ๊ณผ ์ธ๋๊ฐ 1,2์๋ฅผ ์ฐจ์งํ์ต๋๋ค. ์ค๊ตญ๊ณผ ์ธ๋์ ํ์๋ฅผ ์ ๋ฝ ํํ์์๋ ๋๋ ์๊ฐ ์์ต๋๋ค.
์ด๋ฒ ECIR 2018 ์ด ์ฐธ์์ ์๋ 243๋ช ์ ๋๋ค. ํ๊ตญ์ธ์ ๋ค์ด๋ฒ์์ ๊ฐ 2๋ช (์ ํ์ค, ์ด์น์ฑ) ์ด์ธ์๋ ๋ค์ด๋ฒ์์ ์ฐํ ๊ฒฐ๊ณผ๋ฌผ์ News IR ์ํฌ์ต์ ๋ฐํํ๋ฌ์จ KAIST ์คํ์ ์จ ๋ฐ์ ์์์ต๋๋ค.

์ ๊ฐ ์ด๋ฒ ํํ์์ ๋๋ 3๊ฐ์ง ๊ฒฝํฅ์ ์๋์ฒ๋ผ ์ ๋ฆฌํ์ต๋๋ค.
1. Reproducibility
์ด๋ฒ ํํ์์ ๊ฐ์ฅ ๋์ ๋ ์ ์ reproducible์ ๋ํ ๋ ผ์๊ฐ ๋ง์๋ค๋ ๊ฒ์ ๋๋ค. Reproducible์ด๋ โ์ฌํ๊ฐ๋ฅํโ ์คํ๊ณผ ์์ด๋์ด๋ฅผ ์๋ฏธํฉ๋๋ค. 2015๋ ECIR์ Reproducible IR์ด๋ ์ธ์ ์ด ์์๊ณ , ์๋ ICML์๋ Reproducibility in Machine Learning Research๋ ์ํฌ์ต์ด ์์์ต๋๋ค. ๋ ผ๋ฌธ ์ ์๋ค์ด ์ค์๋ก๋ ์๋์ ์ผ๋ก๋ ์คํ ๊ฒฐ๊ณผ๋ฅผ ์๋ชป ๋ผ ์ ์๋๋ฐ, ๋ค๋ฅธ ์ฌ๋์ ์คํ์ด ์ฌํ๊ฐ๋ฅํ๋ค๋ฉด ์คํ์ ๋ ์ ํํ ์๋ฏธ๋ฅผ ์ ์ ์๋ค๋ ๊ฑฐ์ฃ . ๊ทธ๋์ ์์ฆ์ ๋ ผ๋ฌธ์ ์ฌ์ฉ๋ ์ฝ๋, ๋ฐ์ดํฐ ๋ฑ๋ ํจ๊ป ๊ณต๊ฐํ๋ ๊ฒ ๊ฒฝํฅ์ ๋๋ค.
์ด๋ฒ ์ปจํผ๋ฐ์ค์ ํค๋ ธํธ์ ์ธ๋์คํธ๋ฆฌ ํธ๋์์ ์ด์ ์ ์ธ๊ธํ ๊ฒฝ์ฐ๊ฐ ๋ง์๊ณ , ์ฌํ ๊ฐ๋ฅํ IR์ฐ๊ตฌ๋ฅผ ๋ค๋ฃฌ ๊ตฌ๋ ๋ฐํ๋ ๊ฝค ์์์ต๋๋ค. Best paper๋ ํต๊ณ์ ์คํ ๋จธ 3๊ฐ๋ฅผ ์ฌ๊ตฌํ ๋ฐ ์ฌ์คํํ ๋ ผ๋ฌธ(G. Silvello, et al. โStatistical Stemmers: A Reproducibility Studyโ)์ด ๋ฐ์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์์ ์ ์๋ค์ 2011๋ ์ ๋ ผ๋ฌธ์ผ๋ก ๋ฐํ๋ ์ธ์ด์ ๋ ๋ฆฝ์ ์ธ ์คํ ๋จธ 3๊ฐ๋ฅผ ์ฌ๊ตฌํํ์ฌ ์ผ๋ถ์ ๊ฒฝ์ฐ ์๋ ผ๋ฌธ์์ ๋ณด๊ณ ํ ์ฑ๋ฅ์ด ๋์ค์ง ์์์ ๋ณด์์ต๋๋ค. ์ด ์ธ์๋ ๋ค์๊ณผ ๊ฐ์ Reproducible ์ฐ๊ตฌ ๊ด๋ จํ ๋ ผ๋ฌธ์ด ์์์ต๋๋ค.
- Reproducing a Neural Question Answering Architecture Applied to the SQuAD Benchmark Dataset: Challenges and Lessons Learned
- On the Reproducibility and Generalisation of the Linear Transformation of Word Embeddings
๋ค์ด๋ฒ์์๋ ๋ ผ๋ฌธ์ ์ธ ๋ ์ฌํ ๊ฐ๋ฅ์ฑ์ ์ ๋ ํด๋๋ฉด ์ข๊ฒ ์ง๋ง ์ค์๋น์ค ๋ฐ์ดํฐ๋ฅผ ๋ง์ด ์ฌ์ฉํ๋ ์ฐ๋ฆฌ์ ์ฐ๊ตฌ ์ ๋ฌด ํน์ฑ์ ์ ์๊ถ ๋๋ฌธ์ ๋ฐ์ดํฐ ๊ณต๊ฐ๊ฐ ์ด๋ ต๋ค๋ ์ ์ ๋ฌธ์ ์ ๋๋ค.
2. Deep Learning for IR
์ต๊ทผ์ ์ฌ๋ ํํ์ฒ๋ผ ๊ฒ์์ ๋ฅ๋ฌ๋์ ์จ๋ณด๋ ค๋ ์๋๊ฐ ๋ง์์ต๋๋ค. ์ ์๋ค์ด ๋ ผ๋ฌธ์ ์ ์ถํ๋ฉด์ ๊ฐ์ฅ ๋ง์ด ๋ถ์ธ ํค์๋๊ฐ ‘๋ฅ๋ฌ๋’์ด์์ต๋๋ค (์๋น ์๋ reject ๋นํ์ง๋ง ใ ). ๋ฅ๋ฌ๋ ์ธ์ ์ด ๋ ๊ฐ๋ ์์๊ณ , ๋ฅ๋ฌ๋ ๊ด๋ จ ํํ ๋ฆฌ์ผ๋ ์์์ต๋๋ค.
์๋ WSDM 2017์ ์ฐธ์ํ์์ ๋ ๋ง์ดํฌ๋ก์ํํธ์ B. Mitra์ N. Craswell์ด Neural Text embedding for IR ํํ ๋ฆฌ์ผ์ ํ์์ต๋๋ค. ์ดํ ์์คํ ๋ฅด๋ด ๋ํ ์ฌ๋๋ค๊ณผ Mitra๊ฐ ํจ๊ป ์ด ๋ด์ฉ์ ํฌํจํ NN4IR (๋ด๋ด๋คํธ์ํฌ ํฌ IR)์ด๋ ์ด๋ฆ์ ํํ ๋ฆฌ์ผ๋ก SIGIR 2017, WSDM 2018์์ ์งํํ๋๋, ECIR 2018์์๋ ๊ฐ์ ํํ ๋ฆฌ์ผ์ ์งํํ์์ต๋๋ค. ๋งค๋ฒ ๋ฐํ ๋ด์ฉ์ ๊ฑฐ์ ๋๊ฐ์ ๋ณด์ ๋๋ค. ๋ฅ๋ฌ๋ ์ธ๊ธฐ๊ฐ ๋จ์ด์ง ๋๊น์ง ๋๊ณ ๋๊ณ ํ๋ ค๋๋ด ๋๋ค. ์๋งจํฑ ๋งค์นญ, Learning to rank, ๊ฐ์ฒด๋ช ์ฒ๋ฆฌ, ํด๋ฆญ ์์ธก, ์๋ต์์ฑ, ์ถ์ฒ ์์คํ ๋ฑ๋ฑ, ๊ฐ ๋ถ์ผ์ ๊ด๋ จ ์ฐ๊ตฌ๋ค์ ํ์ต๋๋ค. ์๋ฅผ ๋ค์ด ์๋งจํฑ๋งค์นญ์ ๊ฒฝ์ฐ, ๋ชจ๋ธ๋ค์ ํฌ๊ฒ representation ๊ธฐ๋ฐ ๋ชจ๋ธ, interaction ๊ธฐ๋ฐ ๋ชจ๋ธ, ํ์ด๋ธ๋ฆฌ๋ ๋ชจ๋ธ๋ก ๋๋ ๋๊ณ ๊ด๋ จ ๋ ผ๋ฌธ๋ค์ ์๊ฐํ๋ ์์ ๋๋ค. ๊ฒ์ ๋ฟ ์๋๋ผ Naver Search์์ ์ฐ๊ตฌ ๊ฐ๋ฐํ๋ ์ฌ๋ฌ ๋ถ์ผ์์ DNN์ด ์ด๋ป๊ฒ ์ฌ์ฉ๋๋์ง ์๊ณ ์ถ์ ๊ฒฝ์ฐ ์ฌ๋ผ์ด๋๋ฅผ ํ์ด๋ณด๋ฉด ๋์์ด ๋ ๊ฒ ๊ฐ์ต๋๋ค.
๋ง์ดํฌ๋ก์คํํธ Bing ์กฐ์ง์์๋ ์ ๊ฒฝ๋ง๊ณผ gbdt๊ฐ ๋ชจ๋ ์ธ๊ธฐ ์๋ค๊ณ ํฉ๋๋ค. Q&A ์๊ฐ์ ๋์จ ์ปค๋ฉํธ ์ค, ๋ฅ๋ฌ๋์ ์ ์ฉ ํ ์์คํ ์ ์ง๋ณด์๊ฐ ํจ์ฌ ํ๋ค์ด์ Technical debt๋ก ๋จ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค๋ ๋ ผ๋ฌธ์ด ์๋ ๊ฒ์ฒ๋ผ, ์ค์ ์ ๊ณ์์ ์ฐ๊ธฐ ์ด๋ ค์ธ ๊ฒ ๊ฐ๋ค๋ ์ปค๋ฉํธ๊ฐ ์์์ต๋๋ค. ์ด๋ฐ ๋ถ๋ถ์ ๊ฐ์ํ์ฌ ์ค์์คํ ์ ์ ์ฉํด์ผํ๊ฒ ์ต๋๋ค.
๋ฉ์ธ ์ปจํผ๋ฐ์ค์ ๋ฅ๋ฌ๋ ์ธ์ ๋๊ฐ๋ ํ๋ฆฌํฐ๊ฐ ๋ณ๋ก๋ผ๋ ์๊ฒฌ์ด ๋ง์์ต๋๋ค. ์๋ ๋ฅ๋ฌ๋ ์ ๋ฌธ์ผ๋ก ํ๋ ์ฌ๋๋ค์ด ์ด ๋ ผ๋ฌธ๋ค์ด ์๋๋ฉฐ, ์ฐธ์ ํ ์์ด๋์ด๋ ์์๋ค๋ ๊ฒ์ด ๋ค์ด๋ฒ๋ฉ์ค์ ๋ฝ์ ๋งํฐ์์ค, KAIST์ ์คํ์ ๋, ๊ฐ์ด ๊ฐ ์ด์น์ฑ ๋ฐ์ฌ ๋ฑ์ ์๊ฒฌ์ด์์ต๋๋ค.
๊ทธ๋์ ๋ ์คํ๋์์ ๋ณด๋ ์ ์๊ฐ ‘deep learning’์ ํค์๋๋ก ์ด ๊ฒฝ์ฐ ํฉ๊ฒฉ์จ์ด ๋งค์ฐ ๋ฎ์๋๋ฐ, ํฉ๊ฒฉ๋ ๋ ผ๋ฌธ๋ค์ด ์ด ์์ค์ด๋ผ๋ฉด ์๋ ์ ์ถ๋ ๋ ผ๋ฌธ๋ค์ ๋๋์ฒด ์ด๋ ์๊น์…. @.@

3. ๊ฒ์์ ํฌ๋ช ์ฑ๊ณผ ๊ณต์ ์ฑ์ ๋ํ ๊ณ ๋ฏผ
์ฐ๋ฆฌ ํ์ฌ๊ฐ ์ข์ํ๋ ‘ํฌ๋ช ์ฑ’์ ์๊ธฐํ๋ ๋ฐํ์๋ ๋ช๋ช ์์์ต๋๋ค. ์ปจํผ๋ฐ์ค์์ ๋งํ๋ ํฌ๋ช ์ฑ์ ๊ธฐ๊ณ ํ์ต๋ ๋ชจ๋ธ์ ‘์ค๋ช ๊ฐ๋ฅํจ’์ ํํํ๋ ๋จ์ด๋ก ์ฃผ๋ก ์ฐ์์ต๋๋ค. ์ ๊ณ์์ ‘์ค๋ช ๊ฐ๋ฅํจ’์ด๋ ‘๋๋ฒ๊น ๊ฐ๋ฅํจ’์ด๋ ๋ง์ดํฌ๋ก์ํํธ ์ฐ๊ตฌ์์ ์ฝ๋ฉํธ๋ ์ธ์ ๊น์์ต๋๋ค. ๐
๊ฒ์์ ํฌํจํ ์๊ณ ๋ฆฌ์ฆ์ ํฌ๋ช ์ฑ, ๊ณต์ ์ฑ, ์ฑ ์๊ฐ์ ๋ค๋ฃฌ ์ปจํผ๋ฐ์ค๊ฐ ์ฌํด 2์์ ์์๋ค๊ณ ํฉ๋๋ค. ๋ฐ๋ก FAT 2018 (Conference on Fairness, Accountability, and Transparency) ์ด๋ ์ปจํผ๋ฐ์ค์ธ๋ฐ์, ํ๊ตญ ์ฌํ์์ ๋ค์ด๋ฒ์ ์์น๋ฅผ ๊ณ ๋ คํ์ ๋ ๋ค์ด๋ฒ์์๋ ๊ด์ฌ์ ๊ฐ์ ธ์ผํ ๋งํ ์ฃผ์ ๋ผ๊ณ ์๊ฐํฉ๋๋ค.
Fernando Diaz์ ์ฒซ๋ฒ์งธ ํค๋ ธํธ์์๋ ๋ชจ๋ ์ฌ์ฉ์์ ๋ฐ์ดํฐ๋ฅผ ๋ญ๋ฑ๊ฑฐ๋ ค ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ๋ด์ฃผ๋ ๊ฒฐ๊ณผ๊ฐ ๊ณผ์ฐ ์์ ์ฌ์ฉ์ (์ธ์ข /์ฑ๋ณ/์ฐ๋ น/์ฑ์ ์ทจํฅ ๋ฑ)์๊ฒ ๊ณต์ ํ๋๋์ ๋ํ ํ๋๋ฅผ ๋์ก๋๋ฐ ๋ช ํํ ๋ต์ ์๋ ๊ฒ ๊ฐ์ต๋๋ค. ๋ค๋ง ์ฐ๋ฆฌ๊ฐ ๊ฒ์์์ ๊ฐ์ธํ๋ฅผ ์ฑ์ฉํ๋ค๋ฉด ์ด๋ฐ ๋ด์ฉ์ผ๋ก ๋ฐ๋ฐฅ์ ๊น ์ ์์ง ์์๊น ์ถ์ต๋๋ค.
์ธ๊ฐ์ง ๊ฒฝํฅ ์ด ์ธ์ ์ด์ผ๊ธฐ๋ฅผ ์ ์ด๋ณด์๋ฉด…
๊ฒ์์์ ํ๊ฐ๋ ๋งค์ฐ ์ค์ํฉ๋๋ค. ECIR 2018์ ํค๋ ธํธ ์ค ํ๋๋ โ๊ฒ์ ํ๊ฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถโ๊ด๋ จ๋ ๋ด์ฉ์ด์๊ณ , ์ธ์ ์ค์๋ Evaluation & User Behavior ์ธ์ ์ด ์์์ต๋๋ค.
Gabriella Kazai์ ๊ฒ์ ํ๊ฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ ํค๋ ธํธ์ ๋ฐ๋ฅด๋ฉด ํ๊ฐ์ ์ฃผ์ฒด๋ โ์ ๋ฌธ๊ฐ ์ปค๋ฎค๋ํฐโ (์, TREC ํ๊ฐ์งํฉ) โ โํฌ๋ผ์ฐ๋ ์์ฑโ โ ‘์ค์๋น์ค ์ฌ์ฉ์โ๋ก ๋ณํด๊ฐ๊ณ ์๋ค๊ณ ํฉ๋๋ค.

์ฌ๋์ ์จ์ ๊ฒ์ ํ์ง์ ํ๊ฐํ๋ ๊ฒฝ์ฐ ๊ฒ์ ํ์ง ํ๊ฐ์์๊ฒ ์ ๋์ ํ๊ฐ๋ฅผ ์๊ตฌํ๋ ๊ฒ๋ณด๋จ ๊ฒฐ๊ณผ ๋ ๊ฐ๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์๋์ ์ผ๋ก ํ๊ฐํ๋ ๊ฒ์ด ๋ ์ข๋ค๋ ์๊ธฐ๋ฅผ ํ์ต๋๋ค.
ํฌ๋ผ์ฐ๋ ์์ฑ์ผ๋ก ๊ฒ์ ํ์ง ํ๊ฐ๋ฅผ ํ๋ค๋ณด๋ฉด ํ๊ฐ ์ธ๋ ฅ ๋ณ๊ฒฝ์ด ์ฆ๊ณ ํ๊ฐ ํ๊ฒฝ ์ ์ด๊ฐ ์ด๋ ต๋ค๋ ์ฌ๋ฌ ์ด์๊ฐ ์๋ค๊ณ ํฉ๋๋ค. ์ด๋ฐ ์ด์๋ค์ ์๋ฒ ์ดํ ๋ ผ๋ฌธ(๋ฌด๋ ค ์ฌํด 1์์ ๋์จ ๋ ผ๋ฌธ)์ธ “Quality Control in Crowdsourcing: A Survey of Quality Attributes, Assessment Techniques and Assurance Actions”์ ์๊ฐํ๋๋ฐ, ์ด ์ชฝ ๊ณ ๋ฏผํ์๋ ๋ถ์ ํ ๋ฒ ์ดํด๋ณด๋ ๊ฒ๋ ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
์ด ํค๋ ธํธ๋ ์จ๋ผ์ธ ํ๊ฐ์ ์คํ๋ผ์ธ ํ๊ฐ์ ๊ฐญ์ ์ ๋ฉ๊ฟ์ผ๋๋ค๋ ์๊ธฐ๋ก ๋๋งบ์์ง๋ง ๊ทธ ๋ฐฉ๋ฒ์ ๋ํด์๋ ์ ํํ ๊ธฐ์ ํ์ง ์์์ต๋๋ค.
Evaluation & User Behavior ์ธ์ ์๋ 4๊ฐ์ ๋ ผ๋ฌธ์ด ๋ฐํ๋๋๋ฐ ์ฒซ ๋ ผ๋ฌธ์ธ โModelling Randomness in Relevance Judgements and Evaluation Measuresโ๋ ์ฌ๋๋ค์ด ๋ฌธ์ ํ์ง์ ์ธก์ ํ ๋ ํ๋์ ์ ์๋ก agreeํ๋ ๊ฒ ์ฝ์ง ์์์ ๊ฐ์ํ์ฌ, ์ ๋ต relevance label์ random variable๋ก ๋์๋ ์ฐ๊ตฌ์ ๋๋ค. ๋๋จธ์ง 3๊ฐ ๋ ผ๋ฌธ์ ๊ทธ๋ค์ง ์ธ์์ ์ด์ง ์์์ต๋๋ค. ๊ฒ์ ํ์ง ํ๊ฐ๋ ๊ฒ์ ๋ถ์ผ์ ์์ํ ์์ ์ธ ๋๋์ ๋๋ค.

Leave a comment