한국어의 검색친화성과 네이버 정책한국어의 검색친화성과 네이버 정책

Posted at 2008. 5. 24. 19:59 | Posted in 불법복제 통신부

제가 공부한 외국어는 공식적으로 네 개입니다. 영어, 중국어, 일본어, 독일어죠. 별로 놀랄 것도 없습니다. 대한민국 문과생이라면 누구나 두 개의 외국어를 공부해야 하니까요. 덤으로 제가 다녔던 고등학교에는 독일어밖에 없었고 저는 그냥 중학교 때 잠깐 집적거린 게 아까워 일본어를 공부했습니다. 그리고 인생 알 수 없는 일이라 전공이 중국어가 되어 버렸습니다. 이 중 제대로 공부한 외국어는 없다고 봐도 되지만 그래도 어느 정도 각개 언어의 구조나 특징 정도는 자연히 비교하게 되더군요. 그리고 문득 한 가지 질문이 생겼습니다. 우선 이 포스트는 어둠의 후배에게서 많은 도움을 받았음을 밝힙니다.

검색 친화성이 높은 언어는 무엇인가? 한국어는 어떤가?

사실 '검색'은 앞으로 단순한 서비스의 문제를 넘어 자원 낭비를 줄여 줄 가장 중요한 요소 중 하나로 떠오르리라 생각합니다. 제도경제학자인 코스와 노스 등은 '거래비용이론'을 발전시켰는데 '거래비용'은 단순한 표면 가격 이외에 수반되는 모든 비용을 의미합니다. 정보통신의 발달은 이 거래비용을 엄청나게 감소시켰지만 소프트웨어의 발달이 하드웨어를 따라가지 못한다면 결국 이 거래비용 감소는 벽에 부딪힐 수밖에 없습니다. 이토록 중요한 검색이지만 저는 '한국어'는 언어 구조상 검색에 그다지 적합하다고 생각하지 않습니다. 반대로 중국어는 거의 극상이라 봅니다. 별로 과학적인 자료는 없는 듯 하지만 제 나름대로 생각하는 근거는 다음과 같습니다.

사용자 삽입 이미지
다들 알겠지만 제 글의 특징은 과학적 근거가 없다는 것입니다

먼저 동음이의어의 문제입니다. 한국어의 표음성은 세계에서 가장 우수한 언어로 정평이 나 있습니다. 때문에 일상 회화에서 상대방이 전달하는 의미를 기타 언어보다 쉽게 포착할 수 있습니다. 비록 표의성이 떨어진다고는 문제로 독해에서 문제가 생긴다고는 하나 한자 등을 배우는 학습 비용을 고려할 때 독해에서 문제가 된다고 생각하지도 않습니다. 실제로 글의 독해력은 맥락을 파악할 수 있는 '스키마'에서 생기지, 개념 하나의 정확한 의미를 포착하는 데서 생기지 않습니다.

하지만 검색의 경우는 다릅니다. 검색에서는 한국어의 동음이의어가 큰 문제로 작용합니다. 한 번 타 언어와 대비해 보도록 하죠. 중국어의 경우 dong를 4성조 중 1성으로 발음하는 것은 외국인을 위한 사전에만 11개나 등록되어 있습니다. 4성조 모두를 생각할 경우 그 수는 엄청나죠. 그러나 이를 검색할 경우 모두 다른 한자이기에 아무런 문제가 생기지 않습니다.  반대로 한국어의 경우에는 dong라는 발음이 13개 등록되어 있어 많다고 볼 수 없으나 검색의 경우 이 모두가 하나로 취급되기 때문에 필연적으로 문제를 일으킬 수밖에 없습니다. 일본어는 고작 50음도로 이루어져 있어 엄청나게 많은 동음이의어가 존재하나 역시 한자 사용이 잦기 때문에 자연히 이 문제에서 멀어집니다. 서구 언어의 경우에도 동음이의어가 그리 많지 않은 편이고요.

이는 '맞춤법'이라는 측면으로도 이어집니다. 한국어의 맞춤법은 어렵기로 소문 나 있습니다. 차라리 문법이 복잡한 것이야 버릇이 되면 괜찮은데 맞춤법은 정말이지, 아리송한 면이 많습니다. 외국에서는 보기 힘든 맞춤법 오타쿠 네티즌들이 한국에 넘치는 것도 이 덕택이죠. 사실 한자를 제대로 쓰기는 상당히 힘듭니다. 심지어 중국, 일본의 지식인들조차 가끔 한자를 틀리거나 쓰지 못하는 경우가 발생하죠. 하지만 이는 키보드로 입력할 때 완전히 사라집니다. 단지 발음을 아는 것만으로도 입력할 수 있음은 물론 여러 한자가 제시된 것 중 하나를 선택함으로 무려 재점검의 기회까지도 가지게 됩니다. 이 반면 한국어는 기자님들이 아닌 한 맞춤법을 준수하기란 쉬운 일이 아닙니다. 서구 언어도 한국어만큼 맞춤법이 까다롭지는 않습니다.

사용자 삽입 이미지
오죽하면 당대 최대의 지식인마저 이런 말을...

또 다른 문제로 어미 변화가 있습니다. 한국어와 일본어의 어미 변화의 다양함은 아마 세계에서 비할 데가 없지 않을까 합니다. 이 중 상당수의 변화가 실제적 의미는 같고 뉘앙스의 차이만 줄 뿐입니다. 더군다나 일본어의 경우는 각종 축약 현상까지 일어나 'tesimau' -> 'tsau' -> 'tsiu' 가 모두 사용 가능합니다. 이러한 현상은 검색에 있어 교란 요인이 될 가능성이 높습니다. 중국어의 경우는 아예 어미변화가 존재하지도 않으며 서구 언어는 비교적 간단한 편입니다. 물론 문어체에서는 비교적 이러한 변화가 적은 편이지만 블로그 등의 매체 보급이 점점 인터넷 언어를 구어체로 변화시킴을 고려할 때 이는 결코 작은 문제라 보기 힘들 것 같습니다.

이를 커버하기 위해서는 검색 엔진의 기술력 발달이 핵심이라 할 수 있습니다. 기존 검색엔진은 기본적으로 서구 언어를 기반으로 만들어진 것입니다. 서구 언어와 한국어와의 차이는 하늘과 땅만큼은 아니라도 이명박과 정상인만큼은 되는지라 한국어에 대한 충분한 이해를 바탕으로 한 검색 기술이 필요합니다. 그럼에도 불구하고 활발하게 새로운 검색 엔진이 등장하는 일본과 달리 (오픈검색님의 글들 참고) 한국에서 이런 움직임은 거의 보이지 않습니다. 이는 선명히 드러나는 것은 아니지만 분명 한국의 국제 경쟁력에 있어 문제가 될 수 밖에 없습니다.

저는 이러한 문제의 근본 원인에 '네이버'가 있다고 생각합니다. 자본주의 시장경제의 기본 원리는 돈이 되는 부분에는 반드시 새로운 경쟁자가 유입되는 것입니다. 그러나 이를 막는 요인이 바로 '독점'이죠. 독점에 대해 일전에 inuit님께서 다루어 주신 적이 있는데 이를 보면 독점을 단순히 선과 악으로 단순히 봐서는 안 되는 것을 알 수 있습니다. 사실 자본주의 하에서 독점이 필연적인 결과라는 것은 이미 두 사람의 위대한 경제학자가 제시한 적 있습니다. 바로 마르크스와 슘페터가 그들입니다. 그러나 이 두 경제학자의 같은 직관은 전혀 다른 결론을 이끌어 냅니다. 마르크스는 결국 독점자본주의로의 흐름이 모순을 가중시킨다고 한 반면 슘페터는 독점이야말로 기술혁신에 효율성을 가져다 준다고 본 것이죠.

사용자 삽입 이미지사용자 삽입 이미지
탈모로 고생한 슘페터는 평생 마르크스의 머리털을 부러워했다고 한다.

이들 두 경제학자 중 누구의 말이 옳은지를 다투는 것은 소모적 논쟁일 것입니다. 분명히 독점은 양 쪽 모두의 성격을 가지고 있으니까요. 그러나 적어도 현재 한국의 웹은 좀 더 마르크스의 말이 일리가 있는 상황이라 생각합니다. 민노사마의 글을 보면 알 수 있듯 현재 네이버는 한국의 상당수 정보를 독점적으로 가지고 공개하고 있지 않으니까요. 사실 저는 이가 좋아 보이지는 않지만 무조건적으로 비판만 하기도 힘들다 생각합니다. 수동검색과 자사 정보 활용은 검색기술이 비교적 딸리는 네이버로서 이익을 올릴 수 있는 최선의 대안이었을 테니까요. 만약 지금 당장 네이버가 자사 정보를 공개한다고 할 때 사람들이 굳이 네이버를 홈페이지로 지정할 이유는 어디에도 없고요. 이러한 상황에서 네이버의 선택은 어찌 보면 당연한 게 아닐까 생각합니다.

하지만 적어도 지금과 같은 한국 웹 시장에서 검색 시장으로 진출할 요인은 사실상 없어 보입니다. 기대가 큰 만큼 실망이 컸는지도 모르겠지만 첫눈의 실패는 이를 확인사살했다고 봅니다. 웹은 시장의 영역이지만 어떠한 부문에서는 공공재적 성격을 상당히 가지고 있다고 볼 수도 있습니다. 비경합성과 배제불가능성이 상당히 높은 영역이니까요. 굳이 따지면 그렇지 않다고 할 수도 있지만 이렇게 파고 들어가면 순수공공재는 거의 없다고 봐도 될 것이고요. 더군다나 그것이 가져다주는 거래비용 감소라는 효용을 생각할 적 단순히 사익에 지배당하게 내버려 두는 것도 곤란하다고 생각합니다. 저는 한 때 플랫폼 변화를 대안으로 생각했는데 inuit님에 따르면 플랫폼 변화는 기존 플랫폼의 독점 구조를 깰 수 없다고 하네요. 하지만 그저 보이지 않는 손을 기다리기에는 이 문제가 작게 보이지 않습니다. 가뜩이나 언어적으로 불리한 상황에서 타 언어 사용 국가들은 빠르게 검색 기술 혁신을 꾀하고만 있는데 말입니다.

  1. 누가 이렇게 글을 잘 썼나 하고 봤더니 이승환님이었군요^^
    본론과는 상관없지만, '맞춤법 오타쿠 네티즌'이라는 말에 뜨끔했습니다.
  2. Astarot
    독일어도 배우셨군요+_+ (고딩 땐 제 2외국어를 일어를 배워놔서... )몇 년전에 뒤늦게 관심이 생겨서 독학해보려고 책까지 사놨는데 제대로 보질 못하고 있습니다--;;
    맞춤법은 참...국문학과인 제가 봐도 한국어 맞춤법은 머리 터집니다-_- 하다못해 띄어쓰기만으로도 사람 박터지게 하는 언어는 한국어가 거의 유일할 듯..
    • 2008.05.26 19:32 신고 [Edit/Del]
      독일어밖에 없었거든요 -_-
      솔직히 학문을 파고 들 게 아니면 별로 볼 가치가 없어 보인다는...

      국문학과였군요... 정말 안 어울리십니다, 이유는 잘 모르겠지만...;
    • Astarot
      2008.05.29 21:20 [Edit/Del]
      그래도 보통은 독어/불어 중에 택일하라고 하지 않나요? 꽤 각박한 환경이었군요-_-; 저희 학교 같은 경우는 독어/일어였는데 2006년 월드컵 때문에 독어 선택했던 몇몇 애들의 압박이 참....독어는 그냥 여가 삼아 공부하려고 하는 거라 어차피..사실 취미 등을 고려하면 불어 공부하는 게 더 나을 거 같기도 해서 나중에 불어도 찌를 생각입니다.(...일단 영어부터 하시지;;)
      .....그리고 국문과랑 안 어울린다고 하신 분은 승환 님이 첨이라능....-.- 그런 말 한번도 들어본 적 없거든요ㅎㅎ;
    • 2008.06.01 18:32 신고 [Edit/Del]
      어차피 취미라면 관계 없지만 언어 수를 늘린다고 별 도움되는 것은 없는 것 같습니다. 저는 일어, 중어, 영어 다 중급인데 우리 나라에 그런 사람 수십만은 될 것 같다는... -_-;
  3. 흥미로운 글 잘 읽었습니다. ^^

    승환님 댓글이 염두에 두고 있던 어젠다가 있었군요.
    제 댓글에 관해서 보충설명이 필요할듯합니다.
    저는 신규 플랫폼이 기존 플랫폼의 독점구조를 깰 수 있는 여지는 개방해 놓았습니다. 다만, 게임의 룰이 동일하게 승자독식구조인 상태에서의 신규 플랫폼은 또 다른 양극화를 이룬다는 점을 지적한 것입니다.
    결국 근원적인 해결책은 같은 지점에서 나옵니다. 시스템의 후생이 증가하는 방향으로 변화가 필요하고, 이 부분은 정책이든 산업의 플랫폼이든 거시적 관점에서 해결해야 합니다. 그래서 쉽지 않기도 하구요.
  4. 님... 저의 지식기반이 약한 것인지..
    아님... 글의 요지에 대한 부분이 어떤 것인지를 제가 핵심을 찾지 못하는 것이지 모르겠습니다.

    제목에서 이야기하는 네이버의 독점에 대한 부분을 보고 방문하였습니다만...
    어떤 방식으로의 독점인지에 대한 부분은 좀 약하군요... 개인적으로 네이버의 검색엔진에 문제가 있다는 님의 주장을 뒷받침할 수 있는 내용적 측면이 부족한 듯 합니다.
    • 지나다
      2008.05.26 11:20 [Edit/Del]
      네이버가 거의 독점이란 걸 모르는 분도 계시는군요. 그리고 불리언 검색조차 안 되고 단어를 자기 맘대로 마구 잘라서 검색해주는 네이버가 문제가 없다니.. 단어 하나씩만 넣고 검색하시나봐요? 연예인 사진 구하는거야 그정도로 충분합니다만 그 이상을 얻기엔 많이 모자라요 많이.
      이건 십년동안 변화가 없으니.. -_-
    • 2008.05.26 19:34 신고 [Edit/Del]
      제가 글을 좀 대충 쓰는데다가 중국 와서는 한국어 능력이 점점 떨어지고 있습니다 -_-
      네이버 검색엔진이 성능은 떨어지는데 너무 독점이 심한 데다가 정보를 가두어 두고 있으니 타 업체가 진입하려는 유인을 얻지 못한다는 이야기입니다.
    • 2008.06.09 01:21 [Edit/Del]
      제가 외국생활이 좀 오래다 보니 "네이버의 독점"에 대한 부분은 잘 몰랐네요... 거대 외국포털에 맞서 뭉쳐도 될까 말까한데... 이런 상황들이 벌어지고 있어서 참 안타깝게 생각을 합니다.
  5. 쇼핑몰 업계에서는 네이버를 "웹의 청와대" 라고 부릅니다.
    그만큼 권력의 쏠림현상이 심하다는 것이죠.
    윗분 생계를 위해 네이버의 헛기침에 나자빠지는 분들의 입장이 되어보지 않는 이상
    말을 하지 마세요. 지식 기반 어쩌고 하시는데..
    지식은 머리에서 나오는게 아니라 피부에서 손발에서 나오는 겁니다.
    • 2008.05.26 19:35 신고 [Edit/Del]
      그거 참 적절한 표현이네요. 네이버에 상위 링크하려고 돈을 얼마 내야 한다는 이야기는 카더라 통신에서 많이 들었는데 말씀을 들으니 직접 뛰어든 사람에게는 정말 피말리는 일인 것 같네요.

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기