하루에 약 30여통의 스팸메일을 받고 그 중 대부분이
자동으로 정크 폴더로 이동합니다
그런데 영어로 된 스팸 메일은 잘 골라내는데 유독 한글로 된
스팸 메일 5~6 통을 스팸메일로 골라내지 못하고 그대로 남더군요.
트레이닝 데이터를 초기화 시키고 해보면 잘 될까요?
썬더버드 스팸 필터의 한계?
-
- Posts: 6
- Joined: 2005 01 13 23:05 47
- Contact:
사실 썬더버드의 스팸 필터는 성능이 떨어집니다
개인적으로 스팸메일을 당분간 지우지 않고 보관합니다.
지금까지 모은 게 3300통 정도 되고요. (한 4개월치 정도..)
이 메일들을 가지고 트레이닝을 시킨 후에 스팸이 필터링되는 걸 보면,
썬더버드의 정확도는 약 75% 정도에 불과했습니다.
hidden preference 확장을 써서 스팸필터 threshold 도 바꿔봤고,
스팸메일/정상메일 모두 트레이닝해보기도 했습니다만,
스팸의 1/4 이상이 받은 편지함에 그대로 남을 뿐만 아니라
정상메일이 스팸편지함에 들어가는 빈도가 너무 높았습니다.
한글 메일의 경우 특히 오동작이 심했고요..
반면 아웃룩 애드온인 Spam bully 의 경우
똑같은 메일들을 가지고 트레이닝을 시켜 보니
스팸을 골라내는 정확도가 95%에 육박합니다.
저의 경우 지난 열흘간의 Spam bully 통계를 보면
총 메일: 392통
정상 메일: 55통
스팸 메일: 311통
스팸으로 잘못 분류한 정상메일: 2통 (!)
정상메일로 잘못 분류한 스팸: 24통
정확도: 93.36%
썬더버드와는 차이가 많이 나죠?
사실 이것 때문에..
썬더버드를 한달 정도 쓰다가 아웃룩 익스프레스로 다시 돌아갔습니다.
썬더버드의 가장 큰 장점이 베이지안 스팸 필터의 내장이니만큼
향후 더 좋은 성능으로 개선되었으면 좋겠습니다..
지금까지 모은 게 3300통 정도 되고요. (한 4개월치 정도..)
이 메일들을 가지고 트레이닝을 시킨 후에 스팸이 필터링되는 걸 보면,
썬더버드의 정확도는 약 75% 정도에 불과했습니다.
hidden preference 확장을 써서 스팸필터 threshold 도 바꿔봤고,
스팸메일/정상메일 모두 트레이닝해보기도 했습니다만,
스팸의 1/4 이상이 받은 편지함에 그대로 남을 뿐만 아니라
정상메일이 스팸편지함에 들어가는 빈도가 너무 높았습니다.
한글 메일의 경우 특히 오동작이 심했고요..
반면 아웃룩 애드온인 Spam bully 의 경우
똑같은 메일들을 가지고 트레이닝을 시켜 보니
스팸을 골라내는 정확도가 95%에 육박합니다.
저의 경우 지난 열흘간의 Spam bully 통계를 보면
총 메일: 392통
정상 메일: 55통
스팸 메일: 311통
스팸으로 잘못 분류한 정상메일: 2통 (!)
정상메일로 잘못 분류한 스팸: 24통
정확도: 93.36%
썬더버드와는 차이가 많이 나죠?
사실 이것 때문에..
썬더버드를 한달 정도 쓰다가 아웃룩 익스프레스로 다시 돌아갔습니다.
썬더버드의 가장 큰 장점이 베이지안 스팸 필터의 내장이니만큼
향후 더 좋은 성능으로 개선되었으면 좋겠습니다..
Last edited by MEIN on 2005 03 25 00:07 17, edited 2 times in total.
Re: 사실 썬더버드의 스팸 필터는 성능이 떨
어떤 것을 쓸 것인가는 사용자의 몫입니다. 그러나 프로그램에 대해서는 종합적인 평가가 필요하겠죠.MEIN wrote:이 메일들을 가지고 트레이닝을 시킨 후에 스팸이 필터링되는 걸 보면,썬더버드의 정확도는 약 75% 정도에 불과했습니다.
스팸의 1/4 이상이 받은 편지함에 그대로 남을 뿐만 아니라 정상메일이 스팸편지함에 들어가는 빈도가 너무 높았습니다. 한글 메일의 경우 특히 오동작이 심했고요..
반면 아웃룩 애드온인 Spam bully 의 경우 똑같은 메일들을 가지고 트레이닝을 시켜 보니 스팸을 골라내는 정확도가 95%에 육박합니다.
썬더버드와는 차이가 많이 나죠?
ㅁ 무료로 사용할 수 있다. 아웃룩익스프레스가 무료일까요? 아니죠. 그것은 OS에 포함된 사실상 유료제품입니다.
ㅁ Spam bully는 유료제품이죠.
일반 사용자가 이런 유틸을 사용할까요? 일반적으로 아웃룩익스프레스 셋팅 그대로를 일반적으로 사용합니다.
이런 경우 일반 사용자에게 어떻게 권하시겠습니까? 불럽복제 카피본(Spam bully)을 주시겠습니까.
ㅁ 스팸만이 문제가 되지않습니다. 바이러스 감염의 주요 통로가 메일프로그램이라는 것은 아실 것입니다. 아웃룩익스프레스는 인터넷익스플로러의 보안설정을 기반으로 운영됩니다. 즉 IE의 취약성은 아웃룩익스프레스의 취약성으로 이어집니다. 또 아웃룩익스프레스의 취약성도 발견되고 있고 별도 보안패치가 발표됩니다.
ㅁ 한글 제목의 필터링시 문제가 있는 것을 저도 경험하였습니다.
그러나 그것은 사소한 문제이겠죠. 도구에 있는 [필터링 메뉴]을 한번 더 클릭해주거나 상단 도구 메뉴에서 스팸메일 아이콘을 클릭하거나 확장기능 중 Delete Junk Context Menu를 이용하면 좀 더 편하게 이용할 수도 있습니다. 아래 링크입니다.
http://www.chuonthis.com/extensions/deletejunk.php
평가는 비슷한 조건을 가지고 평가를 해야하지 않을까 합니다. 아웃룩익스프레스에는 스팸필터링 기능 자체가 없죠. 그만큼 MS가 98년에 IE6를 내놓은 후 보안/버그 패치는 해도 기능개선을 하지 않았다는 것을 알 수 있죠. 다른 제3자의 프로그램을 필요한다는 것!!!!
그래서 저는 아웃룩익스프레스를 사용하지 말 것을 권해드리고 싶내요.
-
- Posts: 6
- Joined: 2005 01 13 23:05 47
- Contact:
맞는 말씀입니다.
맞는 말씀입니다.
Spam bully 는 성능이 뛰어나지만 30불을 주고 구입해야 하는 유료 애드온입니다. 당연히 공개 소프트웨어인 썬더버드와 동일 선상에서 비교해서는 안되겠습니다만, 최소한 썬더버드의 스팸 필터 '성능'을 벤치마크할 수 있는 기준은 될 수 있다고 봅니다.
썬더버드에 대한 기존의 영어권 매거진 리뷰들에서의 격찬 ('주말을 보내고 난 뒤 접속했더니 스팸 메일 300여통이 모조리 정크 폴더로 들어가더라.. 와우!' 등등)과 달리 한국어권에서는 사실 그보다는 덜 감동적이지 않습니까?
Spam bully 외에도 Spambayes 같은 공개 소프트웨어도있습니다. 아웃룩에는 애드온으로 쉽게 붙는 반면, 아웃룩 익스프레스에서는 쓰기가 좀 고달픕니다만, 아무튼.. 동일한 스팸메일/정상메일로 트레이닝했을 때 썬더버드보다 스팸을 훨씬 잘 걸러주고, 종합적으로는 Spam bully에 살짝 미달하는 수준의 정확도를 보여 주었습니다 (대략 90% 이상으로 추정). 한국어 메일이라고 특별히 필터링 성능이 떨어지는 것도 아니고요.
당장 기존 제품보다 성능이 떨어진다는 것은, 그만큼 발전할 수 있는 여지가 크다는 말도 됩니다. Spambayes는 파이썬으로 작성된 소스도 공개되어 있으니, 우선 그만큼만이라도 썬더버드의 스팸필터가 개선되었으면 하는 바램입니다.
Spam bully 는 성능이 뛰어나지만 30불을 주고 구입해야 하는 유료 애드온입니다. 당연히 공개 소프트웨어인 썬더버드와 동일 선상에서 비교해서는 안되겠습니다만, 최소한 썬더버드의 스팸 필터 '성능'을 벤치마크할 수 있는 기준은 될 수 있다고 봅니다.
썬더버드에 대한 기존의 영어권 매거진 리뷰들에서의 격찬 ('주말을 보내고 난 뒤 접속했더니 스팸 메일 300여통이 모조리 정크 폴더로 들어가더라.. 와우!' 등등)과 달리 한국어권에서는 사실 그보다는 덜 감동적이지 않습니까?
Spam bully 외에도 Spambayes 같은 공개 소프트웨어도있습니다. 아웃룩에는 애드온으로 쉽게 붙는 반면, 아웃룩 익스프레스에서는 쓰기가 좀 고달픕니다만, 아무튼.. 동일한 스팸메일/정상메일로 트레이닝했을 때 썬더버드보다 스팸을 훨씬 잘 걸러주고, 종합적으로는 Spam bully에 살짝 미달하는 수준의 정확도를 보여 주었습니다 (대략 90% 이상으로 추정). 한국어 메일이라고 특별히 필터링 성능이 떨어지는 것도 아니고요.
당장 기존 제품보다 성능이 떨어진다는 것은, 그만큼 발전할 수 있는 여지가 크다는 말도 됩니다. Spambayes는 파이썬으로 작성된 소스도 공개되어 있으니, 우선 그만큼만이라도 썬더버드의 스팸필터가 개선되었으면 하는 바램입니다.
Re: 맞는 말씀입니다.
국내에서는 모질라 파이어폭스가 좀 관심을 가질 뿐 썬더버드에 대한 관심은 극히 적지않나 봅니다. 한국어판 썬더버드 사용자가 얼마나 되는 지 모르지만..MEIN wrote:썬더버드에 대한 기존의 영어권 매거진 리뷰들에서의 격찬 ('주말을 보내고 난 뒤 접속했더니 스팸 메일 300여통이 모조리 정크 폴더로 들어가더라.. 와우!' 등등)과 달리 한국어권에서는 사실 그보다는 덜 감동적이지 않습니까?
Spam bully 외에도 Spambayes 같은 공개 소프트웨어도있습니다. 아웃룩에는 애드온으로 쉽게 붙는 반면, 아웃룩 익스프레스에서는 쓰기가 좀 고달픕니다만, 아무튼.. 동일한 스팸메일/정상메일로 트레이닝했을 때 썬더버드보다 스팸을 훨씬 잘 걸러주고, 종합적으로는 Spam bully에 살짝 미달하는 수준의 정확도를 보여 주었습니다 (대략 90% 이상으로 추정). 한국어 메일이라고 특별히 필터링 성능이 떨어지는 것도 아니고요.
당장 기존 제품보다 성능이 떨어진다는 것은, 그만큼 발전할 수 있는 여지가 크다는 말도 됩니다. Spambayes는 파이썬으로 작성된 소스도 공개되어 있으니, 우선 그만큼만이라도 썬더버드의 스팸필터가 개선되었으면 하는 바램입니다.
그렇다하더라도 [와우!]는 분명하다고 봅니다. 그러나 언론은 이에 대해 소개하길 의도적이든 아니면 다른 이유든 소극적입니다.
또 사용자들 역시 새로운 프로그램 설치에 상당히 겁내합니다. 그렇다고 이야기하지는 않죠. 사용방법이 다르지않음에도 그렇습니다.
물론 개선의 여지가 없는 것은 아닙니다. 설치 과정에 서버 설정이 아웃룩익스프레스보다 좀 복잡합니다. pop와 smtp서버가 다른 경우가 특히 그렇습니다. 이는 개선되었으면 하는 바램입니다. 또 좌측 패널에 주소록/채팅프로그램 표시(확장기능 이용하면 가능)등이 사용자 인터페이스가 개선되어야하겠죠.
그러나 감동의 문제는 [썬더버드 문제보다] 국내언론의 관심과 사용자의 두려움이 복합되어 있다는 생각입니다. 감동받을만큼의 제품이라 봅니다. 지금 1.0버전인 데, 익스프레스가 6.0버전이죠.
ㅁ Spambayes
스팸베이즈는 아웃룩제품(아웃룩익스프레스)입니다. 사실 오피스제품에 포함된 아웃룩의 필터링 기능은 썬더버드보다 뛰어나다는 평가를 받습니다. 스팸관련 애드온을 보면, 아웃룩은 있어도 아웃룩익스프레스는 제외되는 경우가 좀 되는 것같더군요.
사실 저는 썬더버드의 스팸메일필터링과 키워드필터링에 대만족입니다. 한국어스팸 아주 잘 걸러줍니다. 얄짜없이 걸러줌.. ^^
그리고 제가 말씀드리고 싶은 것은 [애드온]이라는 전문필터링 제품은 그만큼의 역할을 해야한다는 생각이고 [애드온 전문프로그램]과 [통합된 제품으로써 썬더버드의 필터링]을 같은 시각 - 물론 언급하셨지만 - 에서 평가는 아니라 봅니다.
아웃룩익스프레스 - 썬더버드 - 페가수스 - IncrediMail 간 스팸메일필터링의 평가가 되어야 한다는 생각입니다.
이 이유에는 아웃룩익스프레스는 MS가 기능개선을 해야할 제품이면서 사용자가 교체할 프로그램인 데, 사람들의 인식상에 스팸메일 애드온을 덧붙이면 문제없음으로 생각하게 만든다는 것이죠.
ㅁ 최초 질문하신 분에게
스팸메일과 정상메일 관리에서 [메일필터링:키워드 필터링]에서 스팸메일 조건만 아니라 WhiteList 필터링(친구필터링)을 만들어서 관리하면 필터링되지않는 문제를 좀 더 줄일 수도 있고 업무/작업효율을 높일 수 있겠죠.
스팸메일을 관리하는 게 중요한 것이 아니라, 이 문제는 피할 수 없는 문제이기 때문에, 결국 정상메일을 신속 정확하게 볼 수 있도록 하는 것이겠죠.
그렇다면 필터링 조건과 특별한 메일편지함 폴더(친구편지함/업무편지함)를 이용하셨으면 합니다.
-
- 서포터즈
- Posts: 67
- Joined: 2004 12 08 10:21 47
- Location: 미친 개 쪽발이네 섬에서 약간 서쪽
- Contact:
spambayes
쓰고나서 한참 생각해보니까 이미 오픈소스란 얘기가 있었다는... -_-
(이 글 다시 편집한겁니당)
필요하신 분들은
http://sourceforge.net/projects/spambayes/ 에서 받을 수 있습니당~
아웃룩이 아니면 프락시 형태로 멜 서버와 멜 클라이언트 중간에 놓고 처리하는것으로
기억합니다..
(이 글 다시 편집한겁니당)
필요하신 분들은
http://sourceforge.net/projects/spambayes/ 에서 받을 수 있습니당~
아웃룩이 아니면 프락시 형태로 멜 서버와 멜 클라이언트 중간에 놓고 처리하는것으로
기억합니다..
incredimail 스팸 필터
incredimail 클라이언트에 있는
스팸 필터가 개인적으로 더 나은 것
같습니다.
이 필터의 경우 주소록과 필터 Rule을
적용하여 여기에 없는 경우는
자동으로 unapproved 폴더로 이동되어
반 스팸메일 처리되던데요.
보통 unapproved의 경우 제목만 보고
스팸아닌 것만 골라내는데,
이렇게 되면 매일 매일 오는 스팸의 주소가
달라지거나 메시지가 그림으로 된 경우 모두
걸러낼 수 있던데요.
썬더버드도 이걸 적용하는게 낫지 않을까요.
스팸 필터가 개인적으로 더 나은 것
같습니다.
이 필터의 경우 주소록과 필터 Rule을
적용하여 여기에 없는 경우는
자동으로 unapproved 폴더로 이동되어
반 스팸메일 처리되던데요.
보통 unapproved의 경우 제목만 보고
스팸아닌 것만 골라내는데,
이렇게 되면 매일 매일 오는 스팸의 주소가
달라지거나 메시지가 그림으로 된 경우 모두
걸러낼 수 있던데요.
썬더버드도 이걸 적용하는게 낫지 않을까요.
Who is online
Users browsing this forum: No registered users and 0 guests