박식한
사람들은 "소크라테스는 이렇게 말했다",
"토인비는 이렇게 말했다" 는 식의 인용을 잘 합니다.
더 많은
인용을 할 수 있고, 더 자세하고 정확한 인용을 할 수 있는 사람일수록 더 박식하다는 평가를 받습니다.
지금까지
인류가 남긴 방대한 문헌 데이터들로부터 인용문을 쉽게 찾아내는 방법이 무엇일까 생각해 보았습니다.
그래서
누가 어떤 말을 하면 "당신은 토인비가 <역사의
연구> 35 페이지에 쓴 7 번째 문장과 비슷한 말을
하고 있다" 라는 식의 멘트를 자동으로 생성할 수 있는 기계가 있다면 이 기계야 말로 최고로
박식한 기계가 되지 않을까 꿈꿔왔습니다.
그러던 중 표절이라는 주제를 접하게 되었는데,
표절이란 것은 결국 인용/참조를
제대로 밝히지 않고 가져다 쓰는 것이므로 기술적으로 동일하다는 결론에 다다랐습니다.
현재 표절이
가장 빈번하게 이루어지는 상황은 레포트를 작성할 때와 논문을 작성할 때 입니다.
특히 인터넷에는
방대한 데이터가 있으며 쉽게 찾을 수 있습니다.
책에서
인용하여 글을 쓰는 것에 대해서는 일반화된 인용/참조 가이드가 있어서 이를 잘 따르는 편이지만 인터넷에
오픈된 자료에 대해서는 copy&paste 가 쉽고 인용/참조
가이드도 없어서 인터넷 자료를 사용하여 문서를 작성할 때에는 표절에 대한 의식이 매우 낮습니다.
그래서 "잘 읽어주는 회사 무하유"는 우선 인터넷에서부터 인용/참조 또는 표절되는 문서들을 확인해 볼 수 있는 시스템으로 카피킬러를 개발하여 작년 12월에 내놓게 되었습니다.
카피킬러는 단순히 문서들의 표절 여부를 가리는 것에서 나아가
문헌들 간의 인용/참조 구조를 파악하는 핵심 툴로 발전될 것입니다.