跳到主要內容區
:::

圖像式垃圾郵件 (Image Spam)

垃圾郵件與正常郵件最大的分野在『行為』不在『內容』,其關鍵是『造假』 。

Spammer 的技術發展,就是針對藉著『愚弄』內容過濾 (Contents Filter) 式的 Antispam 的為方法, 因為其最大的問題是抵擋 Spam 的技術是用『內容』來過濾 。
無論你的 contents filter 加入千百條 rule 都無法抵檔 spammer 的內容扭曲變型!隨著技術的進步,所謂道高一尺,魔高一丈, spammer 也在思考如何避開過濾成功滲透(其實多為閃躲內容過濾), 聰明的 spammer 發現內容過濾的盲點,於是乎用『以子之矛,攻子之盾』的方法,乾脆把所有內容把文字改成圖像吧,看看你怎麼濾? 於是乎圖片式垃圾郵件產生。
因為郵件的廣告內容全部做成圖片,這樣一來就能避開那些使用內容過濾文本內容的防堵軟體的偵測。
於是乎使用內容過濾技術的防堵軟體廠商,紛紛出來為自家的產品解套,為內容過濾找尋一個讓人可以接受的出路-OCR, 廠商宣稱可以將圖片內容使用 OCR (光學辨識技術)將圖片內的文字圖形轉換成文字。
再進一步加以過濾。這個理論並沒有錯,但實質上只是製造話題來誤導了大眾,當垃圾郵件內容改以圖片表示時,相信圖片裡的文字並不會”規規矩 矩”的放在圖片裡,讓 OCR 很精準的辨識出文字,多加幾個簡單的步驟,比如將影影像扭曲、加噪、傾斜、交錯、對比、切割、位移、比例、色彩或是特效,就能讓 OCR 的辨識效果大為下降,這些步驟並不難,影像處理軟體幾個命令就解決了。
所以 OCR (即以內容過濾)都只是治標的方式,要治本的方式還是從根本的 spammer 的行為去分析,那不管它是 image spam 或 pdf spam 都一樣難逃
 
以下列出幾種圖片式文字 (graphical images of text) 的應用
圖像式垃圾郵件 (Image Spam)範例
還有一種方式是,放在郵件本文裡的圖片非一整張,而是加以切割成各小圖片,再用 HTML table 拼起來,當然切割的單位愈小,就愈能避開 OCR 的辨識。
圖像式垃圾郵件範例
瀏覽數: