이베이와 Paypal(미국에서 유명한 온라인 전자결제 서비스)에서 야후! 의 도메인키를 적용하기로 전격 결정했다는 소식이 현재 미국의 유력 사이트들로 부터 나오고 있다. 우선 아래의 링크들을 참고하기 바란다.

  • REUTERS: Yahoo and eBay take steps to block phishing attacks
  • USA TODAY’S TECHNOLOGY LIVE BLOG: Yahoo Mail beefs up anti-phishing measures
  • SAN JOSE MERCURY NEWS: Yahoo to block 'phishing' e-mail
  • CNET NEWS BLOG: Yahoo Mail to block fake eBay and PayPal e-mail
  • 야후! 의 주요 경쟁사 중 하나인 구글이 지메일에서 "도메인키"를 적용하면서 도메인키의 기술적인 완성도는 이미 증명이 되었다고도 볼 수 있다. 그리고 올해초 "발신자 인증기술"들 중에서 유일하게 국제 표준으로 인증을 받은 것도 그러한 증거로 볼 수 있겠다. 도메인키(DKIM)는 현존하는 "발신자 인증기술" 중 가장 신뢰할 수 있고 가장 안전한 기술이다. 그리고 다시한번 강조하지만 유일한 표준이다.

    국내 유수의 포털들과 신뢰도 높은 보안이 요구되는 수많은 서비스들(은행 및 금융권, 공공기관, 인터넷 쇼핑몰 등)에서도 하루빨리 도메인키를 적용하여 보안과 표준 그리고 무엇보다 고객만족을 실현할 수 있기를 바란다. 또한 이들에게 가장 영향력을 행사할 수 있는 한국정보보호진흥원(KISA) 에서 하루 빨리 이러한 정책을 수립하여 추진해주기를 촉구한다.

    발신자 인증 기술에 관하여 본인이 이전에 올린 포스팅은 다음과 같다.

    1. 이메일 스팸, 피싱, 스캠을 막기 위한 기술들
    2. KISA White Domain List 의 허와 실
    3. 이메일과 스팸메일에 관한 오해 1
    4. 이메일과 스팸메일에 관한 오해 3
    이올린에 북마크하기(0) 이올린에 추천하기(0)

    Posted by 왕구라

    트랙백 주소 :: http://gooranet.tistory.com/trackback/174

    댓글을 달아 주세요

    1. BlogIcon 또자쿨쿨 2007/10/06 00:21  댓글주소  수정/삭제  댓글쓰기

      ㅋ 여기서 뵙게 되네요.
      요즘 루신에 푹 빠져있어서 찾게 된 다음 까페에 낯이 익은 이름이 있어서 혹시나하고 봤더니 맞나봅니다. - 0 -;;;; 일지매 다녀갑니다~

      • BlogIcon 왕구라 2007/10/06 22:51  댓글주소  수정/삭제

        ㅎ 반갑습니다. 근데 누구신지요? ㅋㅋ
        님 블로그에 가보긴 했으나 시간이 여의치 않아 누구신지 확인을 못했네요. ㅋ 일지매라니...

    내가 보내지 않은 메일의 반송메일을 받은 경우

    지난번에 이메일과 스팸메일에 관한 오해 1 을 톨해 "자신이 수신자가 아닌데 수신한 메일" 에 대해서 이야기를 했었다. 이번엔 그와 유사한 경우인 "내가 보내지 않은 메일의 반송메일을 받은 경우"를 이야기하려고 한다. 사실 두가지 경우는 똑같은 경우다. 하지만 해당 메일의 실제 수신자가 나였느냐 발신자가 나였느냐라는 차이가 있을 뿐이다.

    이해를 돕기 위해 본 포스팅을 처음 보는 사람들은 먼저 지난번 포스팅을 보고 다시 오기를 권장한다. (그래야 이해가 쉽다.) 앞서말한 바와같이 이 모든 혼란의 원인은 인터넷 이메일 전송 표준 규약인 SMTP(Simple Mail Transfer Protocol) 의 부실함이라 할 수 있다. 지난번 포스팅에서 Telnet 으로 SMTP Command 를 이용해 어떻게 메일을 주고 받는지 그리고 어떻게 수/발신자를 조작하는 지에 대해서 말했었다. (잘 모르겟다면 얼른 가서 다시 보고 와라. ^^) 스패머들이 혹은 호기심 많은 어느 학생이 자신이 메일을 보낸 것을 숨기기 위해 헤더에 장난을 치게 되면 이런 일이 발생하게 된다.

    즉. 실제로는 자기가 메일을 보내면서 MAIL FROM 명령과 DATA 명령 후에 적는 From 헤더의 발신자 메일주소를 엉터리로 적었는데 그 것이 하필이면 자기 메일주소가 적힌 것이다 이말이지.

    그렇다면 스패머는 왜 이런 짓을 할까?

    우선 스패머는 자기 자신의 정보를 은폐하고 싶어 한다. 당연하지 자기 메일 주소를 솔직하게 적었다가는 다 들통나서 비록 솜방망이 처벌이긴 하나 처벌을 받긴 받을테니 말이야. 그러니 당연히 남의 메일 주소를 적을 수 밖에.. (사실 아무 정보도 적지 않아도 수신자 정보만 있어도 메일은 발송된다. 아무 조건없다. ㅡ.ㅡ)

    두째로, 스패머가 돈을 주고 구매를 했건 웹에서 Crawl 을 했건 간에 아무튼 수집한 이메일 주소는 부정확한 경우도 많다. 그럴때 Mail From 에 적어둔 어떤 주소로 다시 반송이 될 것이므로, 자동으로 남의 메일 서버의 Bounce(반송메일)을 통해 스팸을 한번더 발송하는 효과를 볼 수 있다는 것이다. 손 안대고 코 푸는 격이라고나 할까?

    이러한 Bounce 에 대해서 대비책들도 물론 다 나와있다. 하지만 전세계 이메일 시스템에 동시에 적용한다는 것이 일단 너무나 큰 무리이고 이메일이 그다지 중심 서비스로서 주목을 받지 못한다는 이유로 아직까지 이러한 솔루션들이 제대로 적용이 되지 못하고 있다. 암튼.. 이러한 기술들에 대해서 이 자리에서 다 설명하기엔 (내가 늘 하는 변명) 지면이 부족하므로 아래에 간단히 링크만 남긴다. ㅋㅋㅋ


    그래도 IP 는 남는다.

    여기까지 스패머들이 자신의 흔적을 남기지 않으려고 무단히 애를 썼지만, 그렇다고 해도 완전범죄란 있을 수 없다. 자신이 보내지 않은 메일의 회신을 받았다면, 먼저 해당 메일의 헤더정보를 확인해보기를 권장한다. 대부분의 웹메일 서비스나 아웃룩 등 어플리케이션에서 "전체 헤더보기" 또는 "메일원본보기" 등의 이름으로 헤더보기를 제공하고 있다.

    헤더를 보면 갖가지 영어로된 내용들이 보일텐데 다 무시하고 오직.. 하나!!!! "Recieved From" 이란 헤더 하나만 보면 된다. 물론 메일이 어떤 경로를 거쳐 갔느냐에 따라 이 헤더가 여러개일 수도 있고 단 하나일 수도 있다. 이메일을 전달하는 서버들인 MTA(Mail Transfer Agent) 또는 MDA(Mail Delievery Agen) 들은 메일을 전송할때 절대 컨텐츠는 손대지 않는다. 다만 헤더에 자신이 이 메일을 보내거나 전달했다는 표시를 남길 뿐인데 그 표시가 바로 "Recieved From" 헤더이다.

    이 헤더는 시간순서대로 아래에서 위로 적혀있다. 따라서 가장 먼저 이 메일을 전달한 서버나 당시의 정보를 보고자 한다면 Recieved From 헤더 중 가장 아래의 헤더를 보면 되겟다.

    이 헤더에 남는 정보는 전달시간, 전달한 host 의 ip 와 hostname (쉽게 말해 IP주소와 도메인) 그외에 이 host 가 client 로 부터 smtp 접속을 통해 메일을 전달한 경우 각 서비스별로 자신들만의 형식으로 history 를 남긴다. (대부분 by 어쩌구 하면서 하나의 recieved from 헤더에 client 즉, 아웃룩 등으로 접속을 시도한 사용자의 최종 ip를 남긴다.)

    예를 들어 이런 식이란 거지..

    Received: from domain.com ([1.1.1.1]) by domain.co.kr (ExpressMail 6.12) with ESMTP
    id 20070905.104043.04601584 for <test@domain.co.kr>; Wed, 5 Sep 2007 10:40:47 +0900

    그렇다면 자신이 정상적으로 보낸 메일의 헤더는 어떻게 찍히는 지 어떻게 알 수 있을까? 당연히 그걸 알아야 비교해서 "아~ 내가 보낸메일이 아닌데 내가 반송을 받은 이유가 이거구나~~" 하구 알게 아닌가? ㅋㅋㅋ
    정말 간단하게... 자기가 자기한테 메일을 한번 보내보라.. 그리고 그 메일을 열어서 헤더를 보면 알 수 있겠지?

    암튼 어떠한 경우에도 흔적은 남는다는 것, 절대 완전범죄는 없다는 것... 그러니 왜 난 보내지도 않은 메일이 나에게 왔냐고 투정하거나 자신이 메일 서비스 고객센터에 따지기에 앞서.. 재미삼아 한번 이 내용을 확인해보면 좋겠다.

    이올린에 북마크하기(0) 이올린에 추천하기(0)

    Posted by 왕구라

    트랙백 주소 :: http://gooranet.tistory.com/trackback/154

    댓글을 달아 주세요

    이메일이 우리 생활에서 아주 중요한 커뮤니케이션 수단으로 자리매김한 것도 어언 10여년이 흘렀다. 동시에 이메일 스팸이 우리를 귀찮게 한 역사도 거의 그와 유사할 것이다. 한동안 이메일 안티스팸에 관한 포스팅을 하지 않았는데, 이번엔 이메일 스팸과 그 스팸을 차단하고 걸러내기 위한 안티스팸의 역사와 종류에 대해서 간략히 정리해보고자 한다. (빠진 것도 많다. 왜냐하면 너무 자세히 적을 경우, 스패머들에겐 아주 좋은 정보가 될 수도 있으므로 그러지 못함을 널리 양해를 구하는 바이다.)

    안티스팸 시스템의 변화는 항상 인터넷 사용 환경 및 인터넷 기술의 변화(Spam trend)와 밀접한 관련이 있었다.
    우선 아래 연대표를 통해 살펴보도록 하자.

    - 90년대 후반
    IP 및 static keyword 기반의 white/black list

    - 2000 년대 초반 ~ 현재
    Traffic shape (dictionary attack 을 대비)
    Spam 신고를 통한 reputation
    통계적인 방법(Bayesian)

    - 2000 년대 후반 : 현재 ~
    image detection 등 보다 진화된 기술들


    90년대

    이메일 안티스팸 기술은 당연히 스팸 기술의 발전과 그 궤를 같이 한다. 그리고 스팸기술은 인터넷 환경 및 기술의 발전의 영향을 받아왔다. 가령, 90년대 후반 PC 방이 아니면 인터넷 전용선을 구경하기 힘들던 시절에는 스패머들도 전용선을 사용하는 이른바 "서버" 를 통하지 않고는 스팸을 보내기가 힘들었다. 그도 그럴 것이 isdn 이나 dial-up modem 따위로는 도저히 ROI 가 안나오기 때문이다. 아무리 허술한 시스템이라고 해도 text 몇자로 구성된 메일 한통 보내는데 적어도 수초가 걸렸을테니까 말이다.

    White/Black List 및 Static Keyword 차단
    그래서 이 시절에는 안티스팸이 매우 간단했다. 이 스패머들이 사용하는 IP 와 특정 키워드 몇개만 알면 간단하게 막을 수 있었기 때문이다. 스패머들의 IP 는 black list, 선량한 IP 들은 white list 에만 넣어두고 가끔 산발적으로 수신되는 스팸을 차단하기 위해 "sex" 나 "포커" 이런 식의 static keyword 로 체크를 하거나 bad mailfrom 등의  보조수단을 활용하면 거의 완벽했던 시절이다.


    2000 년 ~ 현재

    2000 년대에는 인터넷 전용선이 대부분의 가정에 보급이 되었고, 2000년대 초반에는 이메일이 커뮤니케이션 수단으로서 아주아주 각광을 받던 시절이다. 그래서 2000년대 초반 이메일 스팸이 굉장히 급증하고 기술도 상당히 다양해지게 된다.

    우선 가장 큰 변화가, 전용선 보급으로인해 스패머들이 상당히 빠르고 변화무쌍한 공격이 가능해졌다는 것이다. 수많은 ip 자원과 isdn 이나 dial-up modem 와는 비교도 되지않을 정도의 속도의 전용선을 통해 동시다발적인 그리고 차단되면 얼마든지 ip 를 바꿔가면서 공격이 가능해진 것이다. 사실 이 방법은 아직까지도 제대로 해결하고 있지 못하다. (KisaRBL, Spamhaus 같은 것이 바로 이러한 놈들을 차단하기 위한 방법이지만 쉽지않다.)

    스팸 신고제 (Reputation)
    이러한 변화를 보다 효과적으로 막기위해 안티스팸 엔지니어들이 고안해낸 방법이 바로 "스팸신고제" 즉 ip 에대한 reputation(평가)를 유저들로부터 직접 받는 것이다. 이 방법의 장점은 요즘 web2.0 에서도 주목받고 있는 개념인 "집단지성"을 활용하는 것이라 하겠다. 그 어떤 인공지능 시스템보다 더 정확한 사람의 생각을 이용한 것이니 신뢰도가 가장 높다할 수 있다.

    물론 단점도 있다. 사람이 잠드는 시간 즉 새벽이나 심야 시간을 이용하면 사람이 평가를 내리기 이전에 다 배달이 되버린다는 것이다. 그리고 무한한 ip 자원을 이용할 수 있는 스패머들에게 메일서버란 것은 한낱 공략하기 쉬운 장난감에 불과하다는 것. 언제어디서든 자유롭게 테스트 할 수 있기때문에 고정된 수치 기준에 의한 평가시스템은 스패머들에게 아주 간단하게 뚫릴 수 있다.

    Traffic Shapping
    Traffic Shapping 이라는 방법이 있다. IP Traffic shape 의 경우, 특정 ip 에서 발생된 traffic 을 모니터링하고 있다가 어떤 임계점(Threshold) 를 넘으면 그 ip 의 traffic 을 일정 수준으로 유지시키는 것이다. 즉, 허용된 수치 이상의 트래픽은 지연처리(Deferr)하거나 반송처리(Reject) 를 하는 것이다. 이 방법은 흔히들 Dictionary Attack 이라고 불리우는 공격에 아주 효과적이다. 어떤 유효한 메일링 리스트를 확보하지 못한 스패머가 마치 금고비밀번호를 풀기위해 1부터 차례차례 번호를 눌러보듯 이메일 주소를 a@xxx.com, b@xxx.com, c@xxx.com 이런식으로 메일을 보내는 경우가 있는데, 이런 공격을 막기에 적합한 것이 바로 Traffic Shape 인 것이다.

    통계적인 방법(Bayesian)
    흔히들 "인공지능"이란  이름으로 통칭하여 부르는 기계학습(Machine learning)을 이용한 방법이 있다. 이 것은 기존에 특정 패턴에 대응하기 위한 방법들은 항상 스패머들이 조금만 방법을 바꿔도 무용지물이 되기 일 수 인데다, Test 가 너무 쉬워서 그 허점을 들키기도 굉장히 쉬웠다는 점을 극복하기 위한 방법 중 하나이며, 그러한 이유외에 안티스팸의 정확도를 높이기 위한 좋은 방법이기도 하다.

    하지만, 아직까지 인공지능이란 분야가 실제 인간의 지능을 따라가기엔 한참 역부족인 것과 마찬가지로 이 방법 또한 그렇게 신뢰도가 높은 방법은 아니다. 어느정도 스팸이 수신이 된 이후에야 그 스팸들을 토대로 차단을 할 수 있기때문에 여러가지 변수가 있을 수 있기 때문이다. 하지만 동시에 상당수 사례에 대해 그 정확성이 어느정도 쓸만한 것도 사실이다.

    간단히 설명을 하자면, 우리가 어떤 상황을 판단할때 몇몇 조건들을 기준으로 판단하게 된다. 이점을 이용해 기계를 가르친다고 생각하면 된다. 스팸으로 판단된 메일들의 샘플을 어떤어떤 기준을 갖고 판단할 지 정한 후에 그 스팸샘플들이 만족시키는 조건이 어떤 것인지를 파악한 후 그 결과를 기반으로 비슷한 유형을 보이는 메일들을 스팸이라고 판단하는 것이다. (초간단 설명이라 오해가 있을 수 있음을 인정함.. 어쨋든 이런 개념이란 것만 생각해주기 바람)

    아무튼 현재까지 등장한 방법 중 가장 합리적이고, 오판의 확률이 낮은 것이 바로 이방법이라 하겠다.


    현재 ~

    최근 스패머들은 SpamBot(Zombie) 과 Botnet 을 이용하여, 2000년대 초반보다도 훨씬더 엄청난 자원을 활용하여 거대한 트래픽을 만들어 내고 있다. 동시에 스팸 메세지를 만들어내는 기술 또한 진보하여 링크나 텍스트를 바탕으로 한 스팸필터를 우회하기 위해 이미지를 이용하는 기발함을 보이기도 한다. 물론 이러한 방법들에 대한 대비책들이 이미 다 강구되어 있다.

    ※ SpamBot 은 인터넷 전용선을 사용하는 일반 가정이나 PC방, 학교, 사무실등의 컴퓨터에 몰래 스팸을 발송하는 로봇 프로그램을 심어놓고 그 것을 이용하여 스팸을 발송하는 데, 그 로봇프로그램을 Spambot 이라하고 그 Sapmbot 이 설치된 컴퓨터를 Zombie(좀비)라 부른다. 또한, Botnet 은 이러한 Spambot 들을 통제하기위해 만들어진 네트워크를 말한다.


    이상으로 간략하게나마 안티스팸 기술들의 개요와 역사를 정리해보았다. 지금 이순간에도 스패머들은 자신들의 기술을 이용해 진화를 거듭하고 있으며, 빈틈을 노리고 있으니 언젠가는 분명히 또다른 신기술이 등장할 것이라 확신한다. 따라서 이 싸움은 이메일이 없어지거나 큰 변화를 거치지 않는 한, 끝이 없는 영원한 싸움이 될 것이다.

    이메일의 프로토콜 자체가 허술하고 빈약함을 이미 다른 포스팅에서 수차례 밝힌 바 있다. 이 때문에, 항상 사후 약방문이 될 수밖에 없다는 것도 이 자리를 통해 알려주고 싶은 바이다. (언젠가 이 부분도 한번 따로 이야길 해보겠다.)
    이올린에 북마크하기(0) 이올린에 추천하기(0)

    Posted by 왕구라

    트랙백 주소 :: http://gooranet.tistory.com/trackback/136

    댓글을 달아 주세요

    누군가가 메일로 알려줘서 알게되었는데 공유한다. (혹시 이미 알고있다면 패스~~ 부탁함 ^^) 실은 메일 받은지 한참 지났는데 어떤 계기로 이제서야 확인하게 됨. ㅋㅋㅋ

    각 메일 서비스마다 다들 이런 Antispam 용 URLdb 가 있을 것이다. 시스템에 따라서 설계야 조금씩 다르겠지만 어떤 식으로든 메일컨텐츠내의 URL 들을 별도로 수집 관리하고는 있을 것이다. 굳이 메일 서비스만 그런 것이 아니라 블로그의 트랙백 스팸이나 카페나 뉴스의 댓글 스팸등 활용할 방법은 얼마든지 있겠지. 다들 이미 잘 알고 있는 바와 같이 IPdb 처럼 말이다.

    이 놈의 용도는 spam, phishing 등에 사용되는 bad url 들을 기록했다가 (물론 경우에 다라서 white 도 쓸 수 있겠고.) 이놈을 이용해서 static 한 스팸필터도 만들 수 있고.. 또는 machine learning 에 활용할 수도 있다.

    오늘 소개할 것은 바로 이러한 URL db 의 정보를 외부에서도 사용할 수 있도록 구글에서 공개한 "Google Safe Browsing API" 이다. 구글이 다소 이중적이긴 하지만 이럴때보면 참 공유하나는 잘 하는 것 같다는 생각이 든다. 그리고 항상 남들이 생각지 못한 구석진 곳까지 놓치지 않는다는 거... "사람많고 돈많으니까 그렇겠지" 라고 생각할 수도 있겠지만, 우리나라에도 그런 회사 있잖아.. 근데 글케 하는 거 봤어? 흉내만 내지 아무도 그렇게 안하자나...

    관심있으신 분은 아래 링크로 가서 참고하시길...

    http://code.google.com/apis/safebrowsing/developers_guide.html

    이올린에 북마크하기(0) 이올린에 추천하기(0)

    Posted by 왕구라

    트랙백 주소 :: http://gooranet.tistory.com/trackback/111

    댓글을 달아 주세요

    Innovative Gmail

    지메일을 옹호하는 사람들의 의견들이 다 잘못된 것은 아니다.
    지메일의 혁신적인 기능이라는 대화?? 였나? 암튼 메일의 reply 들을 마치 게시판의 답변마냥 굴비를 엮어서 보여주는 기능, 거의 무한 용량에다가 플러그인을 통해 웹하드처럼 쓸수도 있고 여러가지 innovative 한 기능들이 있다는데 전적으로 동의한다.

    innovative 하다는데 동의하는 것 뿐이지, 실은 나는 웹하드기능 따위는 원치도 않고 대화 기능은 오히려 불편하기만 하다. 뭐.. 계속 쓰다보면 익숙해질테지만 ...

    암튼.. 그것보다는 늘 내가 강조하는 이메일의 주 기능인 "잘 보내지고, 잘 받아지고, 잘 걸러지느냐" 라는 것이 어떤 메일 서비스의 기능을 논할때 중요한 평가 기준이라고 본다. 아무리 Ajax 의 지원을 받아 화려한 UI 를 갖고 있더라도 죽어라 보내도 메일 안가고, 안받아지는데 스팸메일만 쌓이면 누가 좋아하겠냐는 거지... (지메일이 그렇단 소린 아님)


    Anti-Spam Quality BenchMark

    오늘 한메일과 지메일에 관한 어떤 글을 읽었는데, (우선 그 글을 한번 보고 오는게 좋겠다)

    사용자 입장에서 충분히 생각할 수 있는 내용이라고 본다. 하지만 조금 사족을 달자면, 구글에 스팸이 적게 들어온다는 것은 개인차도 있을 수 있고, 또한 정확한 비교를 위한 공평한 환경이 되지 않기때문에 옳다고 말하기 힘들 것 같다.

    그 이유중 가장 큰 이유는, 국내 메일 서비스와 구글 서비스는 일단 그 계정을 타겟으로 삼는 스패머들이 다르다는 것이다.. gmail 의 국내 시장 점유율은 점유율이라 말할 가치 조차도 없을 정도다. 한글 스팸메일을 쏘는 사람들 즉, 한국스패머 중 어느 누구도 gmail 을 타겟으로 삼고 있지 않다는 것이지.

    보내는 사람이 없으니 안들어오는 건 당연한 거 아니겠어?


    실제로 본인이 안티스팸을 하다보니 국내 메일 서비스들의 안티스팸 퀄리티를 갖가지 방법으로 벤치마크하고 있는데, 지메일은 아예 빼버릴까 생각도 했었다. 누가 보내야 말이지.. ㅋㅋ (어찌보면 MacOS 에 바이러스나 해킹사례가 적은 이유를 MS 진영에서 점유율때문이라고 하는 거랑 비슷하게 들릴 지 모르겠군. 난 그건 아니라고 봐~!! ^^)

    그리고, 국내 이메일 서비스들은 100% 포탈을 지향하는 웹서비스 백화점들의 서비스 중 일부이다. 따라서 그 아이디, 이메일등을 서비스 전면에 내세운 경우가 많고, 자연히 스패머들의 Crawler(이메일을 수집하는 로봇)에 노출빈도가 지메일에 비해 상대적으로 높다하겠다. 제대로 비교하려면 당근 이런 것들도 반영이 되야 맞지..

    반대로 국내 메일 서비스들이 외국에서 보내는 스팸메일들에 얼마나 취약한지를 따져보면 쉽게 알 수 있다. 외국 스패머들은 구글, 야후와 같은 글로벌 서비스들은 공격하지만 국내 1위 다음이나 2위 네이버에는 별 관심이 없다. 외국에서 그토록 성행하는 이미지 스팸이 국내에선 찾아보기 힘든 이유가 바로 그것이다. (더 이야기하면 천기누설 이기때문에 참는다. 으~~ 분하다. ㅋㅋ)

    암튼 이런저런 것 따져보면 국내 메일 서비스들 나름대로 선방하고 있다는 말이다.


    Gmail 의 헛점들..

    반면에 알다시피 구글은 한국에 별도의 지사를 두고있지 않다. R&D Center 가 있지만 야후! 나 MS 처럼 한국지사로서 한국내의 업무를 보기 위한 것이 아니다. 때문에, 한국 시장에서 메일서비스 업체들간의 협의가 원활치 않다. 이건 정말 심각한 문제가 아닐 수 없다. 실제로 네이버나 한메일이나 기타 서비스에서 지메일로 메일이 안 들어가는 일들을 경험한 사람들이 종종 있을 것이다. 물론 그 반대의 경우도 마찬가지고...

    한마디로 잘 안보내지고, 잘 안받아질 가능성이 높다는 거지.


    그리고 구글이 자랑하는 GFS(Google File System) 덕분에 그 느려터진 속도는 가히 타의 추종을 불허한다고 하겠다. 또한 전혀 Korean Friendly 하지 않은 Interface 도 반감에 한몫을 하고 있고....

    내생각엔 구글이라는 브랜드 네임과 몇몇 기능들을 제외하고는 아직까지는 지메일은 한국시장에서 어렵다고 본다. 그렇다고 지메일이 외국에서 일등하고 있는 것도 아니다. 미국, 타이완 등 해외시장에서는 야후! 가 한국으로 치면 한메일, 네이버와 같은 존재다.

    암튼.. 이글을 읽고 있는 사람들 모두 내가 보고 있는 것만이 진실이라는 생각은 버려주기 바란다. 군대도 지가 갔다온데가 젤 힘들다고 그러자나.. ㅋㅋ

    이올린에 북마크하기(0) 이올린에 추천하기(0)

    Posted by 왕구라

    트랙백 주소 :: http://gooranet.tistory.com/trackback/101

    댓글을 달아 주세요

    1. alex 2007/06/15 13:42  댓글주소  수정/삭제  댓글쓰기

      잘 읽고 갑니다~ Gmail은 담당자와 연락할 수 있는 방법이라도 좀 알려줬음 좋겠어요. 답답할 때가 한 두번이 아니라니까요.
      그나저나 날짜 잡아야 할텐데 제가 너무 게으름 피우고 있군요. 조만간 메일 쏘겠습니다~

    2. BlogIcon 왕구라 2007/06/15 14:27  댓글주소  수정/삭제  댓글쓰기

      ^^.. 멜 기다릴께요..

    3. Jerry 2007/06/19 02:53  댓글주소  수정/삭제  댓글쓰기

      트랙백 걸어주셔서 영광입니다. :)
      그리고, 지메일은 스패머들이 스팸을 안보내기 때문에 스팸메일이 적다...라는 주장을 펴시는걸로 이해했는데 맞죠?
      이메일 아이디를 전면에 내세우지 않기 때문에 지메일은 스팸이 오지 않지만, 국내 메일은 전면에 내세우니 타겟이 된다라고 하시는것 같고요.

      어차피, 님도 지메일 내부를 들여다 볼수도 없으면서 짐작으로 쓰신것이라 생각하고요,
      저도 님이 근무하시는 국내 메일 업체에 들어가본적이 없으니, 마찬가지로 개인적인 경험만 쓰도록 하지요.

      님의 논리대로라면, 제일 스팸메일이 많은 메일이 제일 활성화된 메일이라는 얘기가 되는데
      제가 경험한 스펨메일이 가장 많은 곳이 네띠앙이니 네띠앙이 가장 활성화된 메일이겠군요. -_-
      제가 가졌던 네띠앙 메일 계정은 외부에 공개한적 거의 없는데도 하루 수백통씩 스팸이 쌓여서
      당분간 햄 같은건 입에 대고 싶지 않을정도로 스팸을 지겹게 먹어댔었습니다.

      지메일의 Ajax나 대화, 굴비 기능등은 다 개인적인 인터페이스의 선호에 따라 다르니 그렇다 치고요,
      지메일이 1등이 아니니까 스패머들이 타켓으로 삼지 않는다라는 논리라니..
      그럼 네띠앙은 대한민국 대표 메일이라 스패머들이 타겟을 삼았었나요? ^^

      국내 메일 업체에 계시다면, GFS가 느려터져서 지메일 못쓰고, 지메일 시장 점유율이 떨어진다라고 하는
      자기 만족에 휩싸여서 상대를 얕잡아보기 보다는, 조금이라도 배울점은 배워야 하지 않을까요?
      지메일이 어떤 식으로 스팸메일을 거르는지 알아보려고 하신적 있습니까?
      실제로 지메일이 얼마나 시장점유를 가지고 있는지는 알아보신적 있습니까?
      님께서 근무하시는 메일업체의 사용자들의 사용시간/방문횟수는 증가하고 있습니까?

      저야 개인적인 메일 사용자이고, 그저 좋은거 골라서 쓰기만 하면 되는 입장이기 때문에
      지금은 지메일이 좋아도 더 좋은게 나오면 그쪽으로 옮겨가면 그만이지요.
      님이나 님이 속한 메일 서비스 업체는 그저 '보내는 사람이 없으니 안들어오는 건 당연한 거 아니겠어?'라고 넘길만큼
      구글이 만만해보이시나보네요.
      저같은 경우에도 네띠앙 메일은 진작 없애버렸고, 한메일은 이미 스팸처리용으로 쓰게 되었고, 지메일이 메인입니다.
      물론, 한메일은 그간 공개적으로 노출시킨적이 거의 없지만 스팸들이 꾸준히 밀려오고 있고,
      지메일은 공개적으로 게시판에서 노출시킨적이 많아도 스팸 한개 구경하기가 어려울정도죠.

      구글이 마음에 드는 이유중 하나는 '구글은 표준을 잘 지킨다'라는 것이고요,
      액티브엑스로 떡칠을 하는 국내 메일 업체들은 'IE만 쓰는데 왜 파폭을 지원해야해요?'라고 하는 개발자가 숱하니 그렇다 칩니다.
      구글 메일은 Palm PDA의 모바일 브라우저에서도 잘 읽힙니다. 님 회사의 메일은 어떠한가요?
      가장 표준을 잘 지키는 곳이 구글(구글이 100% 지킨다는 뜻이 아니라 국내 포털들에 비하면 훨씬 낫다는 뜻입니다)이기 때문에,
      지메일에 잘 못보내고 지메일로부터 잘 못받는 문제에서도 MIME 같은것도 지 맘대로 쓰는 국내 업체들을 더 의심하게 됩니다.

      지메일이 1등도 아닌데 뭔 신경을 써야 하느냐라니..
      거꾸로 1등도 아닌데 왜 사용자들의 호감이 증가하는지 더 살펴봐야 하는것 아닐까요?
      전혀 딴쪽을 짚고 계신것 같은 생각이 드는군요.

    4. BlogIcon 왕구라 2007/06/19 11:12  댓글주소  수정/삭제  댓글쓰기

      반갑습니다. 같이 트랙백을 남겨주셨더라면 제가 답변을 드리기가 좋앗을 것 같은데 아쉽네요. ^^;

      사용자 입장에서 충분히 생각하실 수 있는 내용이라고 봅니다. 그렇지만 구글 메일이 국내에서 사용하기에 불편한 것은 사실입니다. 지메일이 국내에 오픈이 되었지만, 국내시장에서의 대대적인 정책변화가 없다면 앞으로 수년간 매우 힘든 시장상황을 지켜봐야만 할 것입니다.

      왜냐하면, 기본적으로 이메일은 커뮤니케이션 수단인데 지메일의 가장 큰 문제는 커뮤니케이션이 잘 안된다는 겁니다. 제가 항상 이메일 관련 포스팅을 하면서 중요한 점으로 꼽는 것이 바로 "잘 보내지고, 잘 받아지고, 잘 걸러지느냐" 라는 건데요, 그게 잘 안되고 있다는 것이 가장 큰 문제란 거지요.

      님께서 의심스럽다는 MIME Encoding 문제는 잘못 생각하신 것이 분명합니다. MIME Encoding 이 제대로 되고 안되고는 Presentation Level 의 문제입니다. 제가 지적한 문제는 Network Level 에서 이루어지는 것입니다. 다시말해, connection 이 안된다는 거죠. KISA 에서 시행중인 KISA RBL 이라던가 KISA White Domain 등과 같은 것들이 다 Network Level 에서 이루어지는 것들이구요, 님의 블로그에 언급하신 다음의 "온라인 우표제"도 마찬가지입니다. 메일의 컨텐츠와는 전혀 상관이 없는 문제입니다.

      (그리고 국내 메일 서비스들에서 MIME Encoding 을 잘못하고 있지 않습니다. 오히려 Web UI 에서 매우 관대하게 처릴해서 잘못된 Encoding 도 바로잡아서 보여주긴 하죠. ^^ Frontend 의 css 나 html 등이 표준을 따르지 않는 경우는 있지만 메세지 자체가 표준을 무시하고 만들어지는 일은 없습니다. 적어도 제가 만드는 서비스에서는 그런 일은 없습니다. 이런 점들이 바로 구글을 옹호하시는 분들께서 갖고 계신 편견입니다.)

      안티스팸이란 것은 시소와 같습니다. 한쪽이 안티스팸 Quality 라면 반대쪽은 선의의 피해(False Positive) 입니다. 안티스팸을 강화해서 스팸차단율이 올라가면 선의의 피해라는 side effect 도 같이 증가합니다. 구글은 적어도 국내시장에서 이러한 side effect 에 대한 조치가 전무한 상황입니다. 반면에 안티스팸의 강도는 여느 서비스 못지 않게 높은 편이죠. 그리고 바로 이 점이 치명적인 문제일 수 있다는 겁니다. 하지만 유저가 "그런 메일따윈 못받아도 상관없어" 라고 한다면, 아닐 수도 있겠죠.

      그리고 네띠앙을 예로 드신 것은 메일시장을 잘 모르셔서 그런 예를 드신 것 같습니다. 네띠앙이 90년대 후반 떠오르는 인터넷 서비스였지요. 그러나 2000 년대 이후로는 줄곧 내리막길을 걷다가 결국 없어졌습니다. 지금 다시 어딘가에서 인수는 했지만 정상적인 서비스 운영은 안되고 있지요. 네띠앙이 한창 내리막길을 걷던 2000년 이후 돈도 안되는데 자기들 서비스중에 제일 돈안되고 돈만 많이 드는 메일에 투자를 했을리 없겠죠.

      그런데 이메일의 안티스팸이란 것이 본격적으로 등장한 것이 바로 2000 년을 전후해서 입니다. 당연히 제대로된 시스템이 갖춰져 있을 수 없겠죠? 언제 기회가 된다면 안티스팸의 역사에 대해서도 소개를 드리며 좋겟는데요.. 암튼 정상적인 서비스가 불가능한 네띠앙을 예로 드신 것은 굉장히 부적절하다는 생각이 듭니다.

      팔은 안으로 굽는다고하죠? 제가 메일 업계에 종사하고 있어서 님께서 쓰신 글과 같은 블로그 글을 보게되면 솔직히 중립을 지키기 힘든게 사실입니다. 그치만 제가 그렇다고 완전 억지주장을 하는 것은 아닙니다. 님께서는 사용자 입장에서 불편하기때문에 불편을 말하는 것이 당연합니다. 그리고 저는 서비스를 만들고 운영하는 사람으로서 유저들이 잘 모르고 비난만 한다고 생각이들 수도 있고.. 암튼 억울한 면이 당연히 있을 수 있는 거지요. 님의 블로그를 보니 같은 개발자 이신 것 같은데, 아마 어느 정도는 공감하실 거라 생각합니다.

      끝으로, 제가 제 주장만 펴다보니 오해가 좀 생긴 것 같아서요. ^^ Gmail 이 innovative 한 것은 사실이고 충분히 인정합니다. 그리고 실무자로서 open mind 로 받아들일 것은 받아들이고 있다는 것을 말씀드리고 싶네요. 아울러 제가 님께서 사용하신다는 메일 서비스의 직원이 아니라 직접 만족시켜드리진 못합니다만, 님께서 말씀해주신 내용들을 메일유저 대표로 말씀하셨다고 생각하고 겸허히 수렴하도록 하겠습니다.

      찾아주시고 관심가져주셔서 감사합니다. ^^

    CEAS 2007 -- Fourth Conference on Email and Anti-Spam

    Aug 2 and 3, 2007 (Thursday, Friday)
    Mountain View, California

    http://www.ceas.cc

    이메일 및 안티스팸과 관련하여 좋은 Conference 가 열리기에 정보를 공유한다.

    사실 개인적인 소견으로는 국내 세미나나 컨퍼런스들은 상업적인 것들과 결부되었거나 시류에 편승하여 알맹이 없는 전형적인 전시행정들이기 일수였다. 최근의 Web2.0 류의 갖가지 행사들을 보면 잘 알 수 있지. 뭐 생각은 사람마다 다를 수 있으니 이견이 있을 수 있겠지만... 어쨋거나 확실한건 이메일, 그 중에서도 안티스팸만을 위한 컨퍼런스나 세미나는 솔직히 지금껏 한번도 본적이 없다는 것이다.

    누군가 서점가의 신간 서적들을 분석해보면 현재 기술들의 트랜드를 알 수 있다고 했다. 예컨대 요즘 서점가에서 기술서적들 중 가장 인기를 끄는 내용은 단연 "Web2.0", "Ajax" 이다. 2~3 년전에는 "EJB" 나 "Java" 등이었을테고. 한때 "PHP" 도 꽤나 인기를 끌었던 적이 있었다.. 하지만 이메일관련 서적은 인기를 논할 가치도 없다. 왜냐하면 대한민국에 한글로 인쇄된 이메일 관련 기술서적은 아래의 단 한권뿐이기 때문이다. ^^ (오직 하나뿐인 그대~~ ㅋㅋ)


    사용자 삽입 이미지

    인터넷 이메일 프로그래밍


    - 교보문고 상세정보보기

    상황이 이러하니 이메일 관련 컨퍼런스, 세미나 따위가 대한민국땅에서 개최될 리가 없다하겠다.

    대한민국 시장이 좁고, 그 중에서도 특히 이메일 서비스나 관련 기술이 보편화된 대중적인 기술이 아닌 탓이겠지만, 그래도 이메일로 밥먹고 사는 사람들이 한둘이 아닐텐데, 이런정도의 기술공유나 연구가 없다는 사실이 안타깝다하겠다.

    솔직히 미국등 해외에서 벌어지는 행사들을 참석해 본적이 없어서 한국에서 봐왔던 행사들과 어떤 차이가 있는지 전혀 모른다. 그렇지만, 같은 업계 종사하는 실무자로서 이메일과 안티스팸과 관련해서 이런 정도의 행사가 있다는 사실만으로도 부럽고 흥분이 되는게 사실이다.

    솔직히, 국내 메일시장의 공룡 "한메일"이나 국내 안티스팸의 리더이길 자처하는 "KISA" 에서 이런데에 관심 좀 가져줘야 하는게 아닌가 싶기도 하다. ㅋㅋㅋ

    이올린에 북마크하기(0) 이올린에 추천하기(0)

    Posted by 왕구라

    트랙백 주소 :: http://gooranet.tistory.com/trackback/100

    댓글을 달아 주세요

    1. BlogIcon 너른호수 2007/06/13 11:43  댓글주소  수정/삭제  댓글쓰기

      그나마 저 책 절판......... ;ㅁ;

    2. BlogIcon 왕구라 2007/06/13 13:31  댓글주소  수정/삭제  댓글쓰기

      맞습니다. 하지만 일부 대형 서점과 인터넷에서 구매가 가능합니다. 제가 알기로 작년말까지 코엑스의 반디앤루니스에서 몇권 남아있었던 걸로 기억해요. 글고 인터넷 헌책 쇼핑몰에서도 살 수 있구요. ^^

      여담인데, 옛날 O'Reilly 책중에 명작 반열의 좋은 책들이 몇권있죠.. 물론 절판된 것들이 대부분이구요.. 저는 그런 것들을 주로 헌책 쇼핑몰에서 산답니다.


    - 스팸메일 근본 해결책「SMTP를 버려라」(ZDnet 기사)

    구글링을 하다가 우연히 발견한 ZDnet 번역기사다. 여러가지 생각을 하게끔 만드는 기사인데, 어쨋든 SMTP 의 문제점을 모든 사람들이 확실히 인식을 해야하고 그 개선을 위해서 다같이 발 벗고 나서야 한다는 점에서 본인과 맥락을 같이 한다고 하겠다.

    이 기사에서 제안하고 있는 White List 라는 것이 어찌보면 Kisa White Domain List 와 비슷한 모델이 아닌가 라고 생각을 할 지 모르겠는데, 본인이 보기에는 그보다는 Good Mail 에 가깝지 않나라는 생각이든다. 어쨋거나 인증을 통해 발신자를 확인하자라는 이야기인데, 틀린 말은 아니지만 그리고 인증은 분명히 필요한 작업이지만, 이것 역시 어폐는 있다.

    인증된 서버에서 즉 "화이트리스트의 서버에서 발송될 스팸들은 어떻게 하느냐" 라는 것이 그것인데, 실제로 최근 성행하는 스팸 수법 중 하나가 포털들의 이메일 서비스를 이용해서 스팸을 발송하는 것이다. 그렇게 하려면 여러가지 포털들이 걸어놓은 많은 제약들을 사람의 손을 빌어 일일이 통과를 해야 하지만 (테스트 이미지 판독, 회원가입 등) 해외원정을 통해 값싼 인력을 이용하여 맘껏 활개를 치고 있는 실정이다.

    화이트 리스트에 의한 안티스팸의 한계가 바로 이것이다.
    앞서도 몇번 말했지만 안티스팸은 철학과 정책이 중요하다. 완벽한 논리와 절차로 무장해야 한다. 화이트리스트를 만든다던가 블랙리스트를 만든다던가 하는 식으로 한방에 해결되는 것은 없다고 보는게 맞다. smtp 프로토콜을 정부나 어떤 강력한 규제력을 가진 단체가 나선다면 바꿀 수 있을까? 그리고 그렇게 바꾸고 나면 정말 스팸이 사라질까? 그것은 정말이지 의문이라고 하겠다.
    이올린에 북마크하기(0) 이올린에 추천하기(0)

    Posted by 왕구라

    트랙백 주소 :: http://gooranet.tistory.com/trackback/72

    댓글을 달아 주세요

    - 이글은 http://blog.naver.com/eight23/50016329420 글의 트랙백으로 작성된 글입니다.


    1. "Heuristic" 의 정의


    안티스팸의 여러가지 필터링 기술 중에 "heuristic" 이라는 필터링 기술이 있다. 물론 이메일에서만 사용하는 용어나 기술은 아니고 machine learning 에서 나온 개념으로 인공지능의 한 분야인데, 우선 이메일 스팸이라는 관점에서 한번 생각해 봤다.

    먼저 "heuristic" 의 정의를 사전에서 찾아본 결과, 귀납적인 방법을 사용하는 필터라고 일단 짐작이 된다. 그렇다면 "귀납법" 은 정확히 어떤 것인가? 그리고 그 반대의 개념이라고 알고 있는 "연역법" 과의 차이는 어떤 것일까?


    2. 귀납법과 연역법

    우선 귀납법과 연역법에 대해서 지식인에서 한번 찾아보았다.
    일반적으로 삼단 논법에 의한 연역적 방법은

    1. 일반적, 보편적 사실
    2. 구체적 사실
    3. 일반적 사실을 구체적 사실에 적용
    으로 진행됩니다. 가장 잘 알려진 예를 들면

    1. 사람은 죽는다. (보편적 사실)
    2. 소크라테스는 사람이다.(구체적 사실)
    3. 그러므로 소크라테스는 죽는다.(보편적 사실의 적용)
    두괄식이라는 것은 보편적 사실이 이 글의 중심 역할을 한다는 말입니다. 보편적 사실을 중심으로 구체적인 사실을 추론하는 것입니다. 즉, 연역적 추론은 일반화에서 구체적 사실로 귀납적 추론은 구체적 사실에서 일반화의 단계를 거치죠.
    귀납적 추론의 경우에는 여러가지 구체적 사실로부터 보편적인 진실을 이끌어내므로 중심적인 내용이 결론 부분에 존재하게 됩니다.

    < 출처 : 네이버 지식인 답변 >
    이해가 좀 되는지 모르겠다. 어쨋든 이상의 내용을 토대로 어떤 이메일을 스팸인지 아닌지를 판단하는 방식을 정리해보면,


    3. 안티스팸에 적용하면

    이메일에서 heuristic 필터는 static 필터들을 말한다. 가령 예에서와 같이 어떤 한가지 특징을 기준으로 스팸인지 아닌지를 판단한다면, 이 필터는 heuristic 이다. 물론 여러가지 heuristic rule 이 있을 수 있다. "특정 ip 에서 온 메일", "특정 도메인으로부터 온 메일", "특정 단어를 포함한 메일" 등과 같은 것들이 있을 수 있겠다. 우선 아래 예를 한번 보도록 하자.

    1) 연역적 추론 :
    1. 모든 black list ip 에서 발송된 메일은 스팸이다.
    2. 이 이메일은 black list ip 에서 온 메일이다.
    3. 그러므로 이 이메일은 스팸이다.

    일반적으로 스팸인지 아닌지를 판단하는 과