readwriteweb에 최근 번역중인 Collective Intelligence in Action 의 저자와 추천엔진(recommendation engine)에 대한 인터뷰가 실렸다. 이 글을 보면 저자가 추천엔진의 정확도 측면보다 이를 애플리케이션에 적용할 때 대용량 데이터와 수많은 사용자의 요구를 빠르게 충족시켜 줄 수 있으냐를 고민하고 있음을 알 수 있었다. 그래서 구글 뉴스의 추천엔진이 가장 인상깊은 추천 시스템이라고 말하고 있고 Netflix 추천 시스템 10% 향상 [...]
Continue reading about Collective Intelligence In Action 저자 Satnam Alag의 인터뷰
Google “We need more Korean developer” …Lois Kim said “We do not concern extending contents with TNC’s, but mainly concern on making better R&D capability with TNC developer.” “It’s not yet decided blogging service will be started with TNC.”…… On Google’s view, TNC was not a blog platform company, but headhunting company with good developer [...]
이전 포스팅에 Edit Distance를 설명하고 Lucene의 Fuzzy Query에 대해서 설명을 했는데, 곰곰히 생각을 해보니 Google에서 Edit Distance를 “이것을 원하셨습니까?”에서 사용하지 않을까 생각을 해봤다. (주의 : 전적으로 나의 생각이고 이렇게 하고 있을수도 아니면 다른방법을 쓸수도 있다.) 우리가 단어를 잘못 입력했다는것은 대부분 1글자내지 2글자의 삭제, 갱신, 삽입의 연산 내에 있다는 가정하에….. 1) Delete, Update, Insert에 대한 cost를 [...]
Continue reading about Google may use ‘Edit Distance’ in ‘Query suggestion’?
오늘 typos님이 주최하신(?) 비공식 BigTable 모임에 참가를 했었다. 이 모임에 맨주먹 불끈쥐고 참가할 수 없어서 잠깐 BigTable논문을 어제 학교 다녀오면서 쬐금 봤었는데 수박 겉핧기로 알고 자리에 참석을 했다. (시간이 없다는 핑계~~~ ㅡㅡ;) XXW0t8lzhe.pdf 한 두어시간 정도 B.T.B 맥주집에서 typos님과 나와, 이름을 밝힐 수 없는 어느분과 http://jaso.co.kr의 운영자이신 김형준님과 함께 자리를 함께 했다. 주로 검색쪽보다는 대용량 [...]
Google’s PageRank and Beyond책의 초안이라고 추정되는 논문 발견 논문은 책과 동일한 저자가 만들었고, 내용도 상당히 비슷하다. 물론 책이 더 상세하지만 말이다. Deeper Inside PageRank Amy N. Langville† and Carl D. Meyer∗