python驗(yàn)證碼識(shí)別的示例代碼

字號(hào):


    寫(xiě)爬蟲(chóng)有一個(gè)繞不過(guò)去的問(wèn)題就是驗(yàn)證碼,現(xiàn)在驗(yàn)證碼分類(lèi)大概有4種:
    圖像類(lèi)
    滑動(dòng)類(lèi)
    點(diǎn)擊類(lèi)
    語(yǔ)音類(lèi)
    今天先來(lái)看看圖像類(lèi),這類(lèi)驗(yàn)證碼大多是數(shù)字、字母的組合,國(guó)內(nèi)也有使用漢字的。在這個(gè)基礎(chǔ)上增加噪點(diǎn)、干擾線、變形、重疊、不同字體顏色等方法來(lái)增加識(shí)別難度。
    相應(yīng)的,驗(yàn)證碼識(shí)別大體可以分為下面幾個(gè)步驟:
    灰度處理
    增加對(duì)比度(可選)
    二值化
    降噪
    傾斜校正分割字符
    建立訓(xùn)練庫(kù)
    識(shí)別
    python驗(yàn)證碼識(shí)別的示例代碼