Machine Learning

아래 메일 내용은 주말에 어떤 학생분이 메일을 보내주신 것에 대한 답변 메일이다. 물론 이 메일 공개에 대해 사전에 동의를 얻은 상태다. 사실 이런 메일 내용에 대한 문의는 자주 있어 왔다. 하지만 이 메일이 가장 많은 내용을 포괄적으로 질문한 것이라 다른 궁금증을 가지고 있는 분들도 참고하면 좋을거 같다. ——————————————————————————————– 안녕하세요. 질문 잘 받았습니다. 1. 머신러닝 및 [...]

Continue reading about ML에 입문하고자 하는 어떤 대학생분의 메일과 그 답변

고감자 on 1월 4th, 2009

Comparing Google and Yahoo! Search Result구글과 야후의 검색 결과 링크 순위를 비교하는 페이지인데 사실 많은 분들이 모 그러려니 생각하겠지만 나에겐 이 두 검색 결과가 큰 의미를 가지고 있다. 2007년 구글  인덱스 사이즈2008년 구글 인덱스 사이즈 물론 구글의 인덱스의 크기도 큰 의미를 가지고 있긴 하다. 위 측정 방법이 어느정도 신뢰도가 있을지 모르겠지만 나름 쿼리를 조합해 저런방식으로 [...]

Continue reading about 검색에 대한 몇가지 정보 링크들

고감자 on 12월 12th, 2008

요즘 일도 부분적으로 그렇고 번역도 그렇고 죄다 Machine Learning에 빠져 있다. 게다가 읽는 책도 Data Mining 관련 책이다. 진짜 요즘엔 책읽을 짬을 내기 힘들어서 지하철에서 주로 읽고 점심시간 밥 먹고 와서 읽고 책은 꼭 읽고 잠을 자야 하기에 새벽 2시까지 번역일을 하다가 하루 할 분량을 끝내고 잠자기 1시간 전 정도에 책을 본다. 이렇게 빡시게 보는 이유는… [...]

Continue reading about 최근 보는 책

고감자 on 6월 10th, 2008

작년 언젠가 회사 PD분이 위 질문을 했다. 아마도 그때 답변은 미지의 데이터에 대해서 학습된 데이터를 기반 예측을 해서 자동으로 어떠한 처리하기 위해 ML을 사용한다고 한거 같다.쩝~ ML 공부만 하고 실무는 전혀 안해본 샌님이나 할 수 있는 대답이다. 오늘 분류데이터를 분석하면서 왜 ML을 사용해야 하는지 정말 절절하게 깨달았다. 이 느낌은 이전에 스팸관련 논문을 쓰면서 ML실험을하는 과정에서 [...]

Continue reading about 왜 Machine Learning을 사용하는가?

고감자 on 3월 17th, 2008

이 앙상블 러닝 방법은 이전의 포스팅에서도 소개를 한적이 있었다. 이 앙상블 방법에 대해서 상당히 잘 설명한 발표자료를 소개한다. 역시 이런것은 예제를 어떤걸로 제시하느냐가 이해도를 높이는 가장 중요한 방법중에 하나라는 생각이 든다. 여기서 netflix prize를 풀기위한 방법에 따른 개선정도를 표시한 그래프가 있는데 대부분 존재하는 방법으로는 다 시도를 해본거 같다. 그래서 아마도 이 ppt의 저자는 이 방법들을 [...]

Continue reading about 앙상블 러닝에 대한 좋은 발표자료