2007年10月23日 星期二

About CAPTCHA

  由於我們的專題是做有關於閱讀式 CAPTCHA 圖形中字元的切割,所以先來談談關於 CAPTCHA 的一些基本知識。

  CAPTCHA 是 "Completely Automated Public Turing test to tell Computers and Humans Apart" 的縮寫,由卡內基梅隆大學的Luis von Ahn, Manuel Blum, Nicholas J. Hopper以及IBM的John Langford 在2002年最先提出,一種用來讓電腦區分受試者是人類還是電腦的自動化程序,CAPTCHA 已經被卡內基梅隆大學註冊為商標。

  CAPTCHA 有很多種形式,而目前最常見的一種是閱讀式,讓受試者閱讀並輸入圖中的文字來分辨是人類還是電腦。而為了避免被直接使用 OCR 等方式來破解,通常都會加上一些隨機因素來增加破解的難度,例如說增加背景、扭曲、變換字體等方式。

  目前,已經有幾種的閱讀式 CAPTCHA 被破解( 在知名 http://sam.zoy.org/pwntcha/網站),有的是把這當成一種難題來挑戰,有的是想要展示部分閱讀式的 CAPTCHA 是多麼的沒效率。而現今,圖像式垃圾郵件已經演進至運用部分 CAPTCHA 的技術來躲避資安軟體的 OCR 過濾,所以,這也會是破解 CAPTCHA 技術的一種應用。

  〈未完成〉

〈參考:CNET、Wikipedia〉

3 則留言:

KAPPA 提到...
作者已經移除這則留言。
KAPPA 提到...

"一種用來讓電腦區分受試者是人類還是電腦的自動化程序,CAPTCHA 已經被卡內基梅隆大學註冊為商標。"這邊是寫了機制的由來,
不過沒有提到為何會想要發展CAPTCHA
以下為想加進去的

Captcha是為了防止有惡意軟體企圖刻意傳
算大量封包(spammers )癱瘓網路,或是大量的占用網站資源,這些應用在Webmail的地方為YAHOO!Gmail...,在Blog上有無名小站,網路硬碟有badongo,元智大學校內選課系統,Online Polls,這些廣泛的應用顯示Captcha機制可以在網路上的身分認證之下,又多了一套護,而這項防護很顯然的要跟身分認證的機制做有效的分隔。

KAPPA 提到...

"而為了避免被直接使用 OCR 等方式來破解,通常都會加上一些隨機因素來增加破解的難度"
特性的地方我想補充的地方

根據全錄的帕羅奧多研究中心(Xerox Palo Alto Research Center)所提出的Baffle Text 和 Pessimal Print系統,他們提出了包括空間取樣頻率及誤差(spatial sampling rate and error)、仿射空間變形(affine spatial deformations)、劇震(jitter)、斑點(speckle)、模糊化(blurring)、臨界值(thresholding)、以及符號大小(symbol size)等近十種的文字影像剝蝕(degradations)模型。其中有些模型相當具有代表性,之後也經常被用來作為設計新系統的參考。

http://imedia.cce.mcu.edu.tw/wiki/index.php/Captcha