新華社華盛頓10月26日電(記者林小春)為了核查登錄用戶是否為真人,世界各地的網(wǎng)站廣泛使用復(fù)雜的驗證碼技術(shù)。但一項新研究說,人工智能已可高效破解驗證碼,比如識別出變形的文字等。
美國凡思智能公司研究人員26日在美國《科學(xué)》雜志上發(fā)表論文,提出了一個用于物體識別的計算機(jī)視覺模型——遞歸皮層網(wǎng)絡(luò),其核心是模擬人腦基于形狀對物體進(jìn)行辨別的機(jī)制開發(fā)出一種新型算法,讓計算機(jī)同樣能夠基于形狀來識別物體。
《科學(xué)》雜志的介紹說,這代表人工智能研究取得了“關(guān)鍵性進(jìn)展”。
論文作者之一、凡思智能商業(yè)化總監(jiān)樓興華告訴新華社記者,傳統(tǒng)的深度學(xué)習(xí)算法需要非常龐大的數(shù)據(jù)作支撐,而遞歸皮層網(wǎng)絡(luò)強(qiáng)調(diào)在模型建構(gòu)中引入高效的先驗知識,所以只需要很少量數(shù)據(jù)就可以達(dá)到類似甚至更好的識別效果。
他說:“如果用人腦的工作方式來打比方,深度學(xué)習(xí)的工作邏輯更接近于機(jī)械的記憶和經(jīng)驗,而遞歸皮層網(wǎng)絡(luò)技術(shù)還包括了更智能的推理和演繹?!?/p>
具體而言,在實際應(yīng)用中,只需要提供給遞歸皮層網(wǎng)絡(luò)描述物體形狀的訓(xùn)練圖片,計算機(jī)就能成功將目標(biāo)物體從復(fù)雜背景中分離。實驗顯示,遞歸皮層網(wǎng)絡(luò)可以有效識別真實場景中的文字,并具有較好的通用性,即一個模型有效破解不同變體的驗證碼,比如變形的文字和復(fù)雜背景中的驗證碼。
樓興華說,遞歸皮層網(wǎng)絡(luò)對數(shù)據(jù)的利用效率是一些深度學(xué)習(xí)算法的300倍,超過以往很多優(yōu)秀的驗證碼破解算法,而且通用性強(qiáng),是人工智能領(lǐng)域繼目前流行的深度學(xué)習(xí)算法之后的最新學(xué)術(shù)成果。
“我們在研發(fā)過程中把破解驗證碼問題作為一個具體的應(yīng)用場景。但這不是該算法的主要應(yīng)用,更不是該算法的建構(gòu)初衷,”他說,“該算法對于工業(yè)流水線自動化、智能化有廣泛的應(yīng)用前景。如我們可以通過較少量數(shù)據(jù)模擬適應(yīng)不同的工業(yè)應(yīng)用場景,大大提升工業(yè)機(jī)器人的智能水平和生產(chǎn)效率?!?/p>