编者按:验证码(CAPTCHA)的意思区分人与计算机的全自动公共图灵测试。但除了承担这区分人与机器的这个表面任务以外,验证码还有一个隐秘的作用,那就是利用人类去训练人工智能。直到有一天,机器的表现渐渐超过了人类,这时候你还能用它来分辨对方是否是人类吗?这也是机器取代人类的开始。文章来自编译。
要想跟踪技术的发展动态,办法之一是看看验证码(CAPTCHA)。
CAPTCHA是Completely Automated Public Turing的缩写,意思是区分人与计算机的全自动公众图灵测试。你可能还记得验证码的第一次迭代,你得解码那些歪歪扭扭、难以辨认的单词。
我们都按下过那个有点反乌托邦的按钮:“我不是机器人。”
验证码出自 reCAPTCHA 公司,这是由卡内基梅隆大学研究生研究员路易斯·冯·安 (Luis von Ahn) 于 2007 年创立的, 2009 年,公司被出售给谷歌。很多人没有意识到,你辨认的那些歪歪扭扭的文字正在帮助将旧书数字化。一般来说,早期验证码提供给用户的那些扭曲的单词都是计算机看不懂的旧文本当中的单词。比方说,如果有足够多的人把难以阅读的单词识别为“dog”,那么这个单词就会被(计算机)自信地解读为“dog”,然后验证码就会换一个新的单词来挑战用户。
2007 年,reCAPTCHA 与《纽约时报》合作,帮助将这家报纸 100 年来的档案实现了数字化。在收购了 reCAPTCHA 之后,谷歌为该公司提供了强大的支持,CAPTCHA 很快每年就破译了相当于 200 万本书的内容(!)。最重要的是,在将 reCAPTCHA 出售给谷歌的两年后,路易斯·冯·安又创立了 Duolingo。今天他仍然是Duolingo的首席执行官。
后来验证码不再给我们提供歪歪扭扭的单词了。它的新迭代我们都很熟悉,交通灯、人行横道、车辆的图块。
大家在网上普遍都有过这种体验,以至于辨认验证码成为了无数模因的来源。
下面的问题在 Quora 上引起了激烈的争论——电线杆究竟算不算交通信号灯的一部分?