다음, 검색엔진 자체 개발

설경진 / 기사승인 : 2007-05-21 00:00:00
  • -
  • +
  • 인쇄
웹문서 적용...카페와 블로그 등 확대 예정

다음은 검색서비스의 경쟁력의 핵심인 검색엔진을 자체 개발했다.

다음 관계자는 "독자적인 검색 기술력을 보유하게 돼 성장 발판을 마련했으며, 테스트베드로서 웹문서 검색 베타사이트를 통해 안정화 시범서비스에 돌입했다"고 설명했다.

또한 "대용량 데이터를 효율적으로 처리할 수 있도록 중점을 둔 검색엔진은 우선 웹문서 영역을 시작으로 카페검색과 블로그검색 등 디렉토리로 점차 확대해 나갈 계획이다.

이를 위해 작년 초 엔지니어와 개발자로 구성된 개발엔진 테스크포스팀(TFT)를 구성다"고 덧붙였다.

이번 웹문서 검색베타 사이트에서 첫 선을 보인 웹 검색로봇인 '다음오에(Daumoa)'는 문서간의 연결 관계에 기반한 우선 순위 선정 방법을 기본으로 정보량이 많은 문서별로 차등적인 가중치 부여 실시간으로 문서 중요도에 대한 랭킹 계산 등을 통해 양질의 문서를 선별한다는 점이 특징이다.

문서 중요도의 기준은 해당 문서와 타 문서들과의 연계성 외에도 사용자들의 웹문서 사용 패턴을 분석해 적용된다.

기존 검색로봇은 웹문서 수집.스팸 필터링.데이터가공.검색엔진 로딩 등 여러 단계를 거쳐 최신 정보 업데이트가 된다.

반면 다음오에이는 수집과정에서 검색엔진으로 바로 로딩할 수 있도록 스팸 필터링과 순위 계산 등이 동시에 이루어져 신속한 검색 결과를 사용자에게 제공할 수 있도록 구현되었다는 점이 경쟁력으로 꼽힌다. 수집한 자료를 검색엔진으로 반영되는 주기를 국내 최단기로 설정해 최신의 검색 결과를 제공한다.

또 각기 다른 브라우저나 언어 환경에서도 사용자가 원하는 정보를 제공할 수 있도록 유니코드 인코딩을 지원했다. 사용자의 편의성 향상과 향후 외국어 및 사전서비스 등에 확장 적용이 가능하도록 구현했다.

다음은 이번 웹검색 서비스의 자체 운영을 시작으로 카페.블로그.동영상 등 대용량 UCC콘텐트에 대한 효율적인 검색이 가능하도록 대용량 문서에 대한 시스템 확장의 용이성 및 자동화를 기반으로 한 리소스 관리의 최소화를 실현 할 계획이다.

손경완 다음 검색본부장은 "이번 검색 엔진 개발은 독자적인 기술력을 보유함으로써 차세대 검색시장을 주도할 수 있는 성장 기반을 다지게 되었다는 것에 의미가 있다"며 "다음이 보유한 30억건에 달하는 방대한 데이터를 중심으로 사용자 니즈에 가장 최적화된 검색 결과를 구현하는 등 차별화된 검색 서비스로 거듭날 것"이라고 말했다.

한편 다음은 오는 6월 중 검색·블로그 등 다음의 집단지성을 활용한 검색 서비스 운영 노하우를 바탕으로 새로운 검색 패러다임을 이끌어 갈 UCC검색 서비스를 전격 오픈할 예정이다.

[저작권자ⓒ 토요경제. 무단전재-재배포 금지]

뉴스댓글 >