Machine Learning
아래 메일 내용은 주말에 어떤 학생분이 메일을 보내주신 것에 대한 답변 메일이다. 물론 이 메일 공개에 대해 사전에 동의를 얻은 상태다. 사실 이런 메일 내용에 대한 문의는 자주 있어 왔다. 하지만 이 메일이 가장 많은 내용을 포괄적으로 질문한 것이라 다른 궁금증을 가지고 있는 분들도 참고하면 좋을거 같다. ——————————————————————————————– 안녕하세요. 질문 잘 받았습니다. 1. 머신러닝 및 [...]
Comparing Google and Yahoo! Search Result구글과 야후의 검색 결과 링크 순위를 비교하는 페이지인데 사실 많은 분들이 모 그러려니 생각하겠지만 나에겐 이 두 검색 결과가 큰 의미를 가지고 있다. 2007년 구글 인덱스 사이즈2008년 구글 인덱스 사이즈 물론 구글의 인덱스의 크기도 큰 의미를 가지고 있긴 하다. 위 측정 방법이 어느정도 신뢰도가 있을지 모르겠지만 나름 쿼리를 조합해 저런방식으로 [...]
요즘 일도 부분적으로 그렇고 번역도 그렇고 죄다 Machine Learning에 빠져 있다. 게다가 읽는 책도 Data Mining 관련 책이다. 진짜 요즘엔 책읽을 짬을 내기 힘들어서 지하철에서 주로 읽고 점심시간 밥 먹고 와서 읽고 책은 꼭 읽고 잠을 자야 하기에 새벽 2시까지 번역일을 하다가 하루 할 분량을 끝내고 잠자기 1시간 전 정도에 책을 본다. 이렇게 빡시게 보는 이유는… [...]
작년 언젠가 회사 PD분이 위 질문을 했다. 아마도 그때 답변은 미지의 데이터에 대해서 학습된 데이터를 기반 예측을 해서 자동으로 어떠한 처리하기 위해 ML을 사용한다고 한거 같다.쩝~ ML 공부만 하고 실무는 전혀 안해본 샌님이나 할 수 있는 대답이다. 오늘 분류데이터를 분석하면서 왜 ML을 사용해야 하는지 정말 절절하게 깨달았다. 이 느낌은 이전에 스팸관련 논문을 쓰면서 ML실험을하는 과정에서 [...]
이 앙상블 러닝 방법은 이전의 포스팅에서도 소개를 한적이 있었다. 이 앙상블 방법에 대해서 상당히 잘 설명한 발표자료를 소개한다. 역시 이런것은 예제를 어떤걸로 제시하느냐가 이해도를 높이는 가장 중요한 방법중에 하나라는 생각이 든다. 여기서 netflix prize를 풀기위한 방법에 따른 개선정도를 표시한 그래프가 있는데 대부분 존재하는 방법으로는 다 시도를 해본거 같다. 그래서 아마도 이 ppt의 저자는 이 방법들을 [...]