验证码的魔道之战

alibaba · 发表于 2015-12-28 00:59:36

验证码的魔道之战

2015-12-27 14:14:00　来源: 济南时报(济南)

　　因为神一样的验证码，今年春运，12306又被“喷”惨了。

　　话说12306的验证码4年6版本，堪比一部血泪史。不断遇到网络瘫痪，不断遇到车票秒尽，不断遇到层出不穷的黄牛专用软件，12306屡败屡战，投入3亿多元，终于在今年春运开始之际，烧出了复杂版的图案验证码。该款验证码一出，吐槽者脑洞大开。其中，最多被人提及的槽点之一，就是图案太复杂。

　　除却12306的验证码，估计每个网民都有因看不清验证码而抓狂的经历。据验证码创始人2008年的统计，当时每天全球范围内就有大约2亿次验证码输入，每次浪费10秒钟，意味着全人类为了输入验证码，每天要浪费55万个小时。看到这组数字，我们不禁要问：人类为什么要造出这么“反人类”的存在？为什么验证码非要歪歪扭扭、模模糊糊地令人生厌？12306销魂的验证码，一举打倒了黄牛，不少购票者也被击败了。

　　互联网的荒蛮时代垃圾邮件泛滥成灾

　　前世·洪水肆虐

　　这个世界本来没有验证码。2000年以前，堪称互联网的荒蛮时代，那时候刚刚开天辟地不久，天地一片混沌，根本没有什么安全概念。垃圾邮件和垃圾评论应运而生。

　　1994年，美国亚利桑那州，有一对在互联网世界里臭名昭著的律师夫妇Cantor和Siegel，为了宣传自己的移民顾问服务，写了一段小程序，把“绿卡抽奖”的广告邮件，同时发送给了两人能够穷尽的近6000个Usenet新闻组的用户，这就是垃圾邮件的起源。这一事件因此也被称为“绿卡事件”。当时这对夫妇只花了不到20美元的上网通信费用，就吸引来了25000个客户，赚了10万美元。后来还把这段“成功经验”写了一本书：《网络赚钱术》，宣传这种“前所未有的几乎无需任何成本的营销方式”。

　　“绿卡事件”导致很多服务商的服务处于瘫痪状态。遭受邮件骚扰的用户，纷纷跑到新闻组里声讨，有人甚至留言说：“我恨不能用椰子壳和SPAM午餐肉罐头砸扁他们”。从此美国大名鼎鼎的午餐肉品牌“SPAM”，就变成了互联网垃圾信息的别名，沿用至今。

　　尽管“绿卡事件”的始作俑者被口诛笔伐，但“赚钱的示范效应”历来都是惊人的。一些触觉敏锐的商人觉察到了其中的商机，从此潘多拉的盒子就被打开了。第二年，有人写出了可以大批量发送电子邮件的程序。紧接着，又有人拿出200万个邮件地址出售。到了1997年，垃圾邮件已经泛滥成灾。

　　诞生·大禹治水

　　以验证码定访问者身份

　　是人是妖一眼看穿

　　为反垃圾邮件，一位21岁的学神让计算机先产生一个随机字符串，然后用程序把这个字符串的图像进行随机扭曲，再显示给显示器前的人或者机器，这玩意，就是验证码。

　　有垃圾邮件，就有反垃圾邮件。

　　有人将这段缠斗过程，戏称为“大禹治水”：

　　“首位安全架构师女娲取五彩之石，炼就密码三次错误自动锁定账户之禁制，才将天空补完。”

　　“天”虽补完，“水”患依旧横行，蛮荒野兽肆虐，它们或者采用慢速扫描，或者利用密码轮询账号，以避过“女娲”所留“密码三次错误自动锁定账户”的禁制。“尧帝派鲧治水”，“鲧”定堵水之策——限访问者IP，堵“洪水”源头，“洪水”因此而改道，或经代理，或走“肉鸡”，“鲧”治“水”历时九年，“水”患难除，疲于奔命，卒于“羽山”。

　　“鲧”之子“禹”定疏水之策，立“定海神针”——以验证码确定正常访问者身份，是人是妖一眼看穿，杜绝洪水肆虐，终解大患，此乃验证码之由来。

　　这里面的“大禹”，其实就是雅虎。

　　别看雅虎今天已经变得跟“纸老虎”差不多了，当年它可是互联网第一代创业标杆，也是互联网早期最重要的免费邮箱提供商。而免费邮箱，恰恰是垃圾邮件的最爱。雅虎发现：垃圾邮件，竟然都来自自己的服务器。通过机器程序注册，短时间内就可以自动创建上千个电子邮件地址，然后就可以利用这些地址发送垃圾邮件了。

　　于是雅虎就找到了在卡内基·梅隆大学硕博连读的Luis von Ahn。这家伙当时才21岁，不愧是拿过“麦克阿瑟天才奖”的人物，向世人展示了学神和学霸的差距，就是谁解决问题更简洁、更优雅。

　　如何分辨正在注册的究竟是人还是机器呢？Luis von Ahn想到了一个非常简单而又巧妙的设计。让计算机先产生一个随机的字符串，然后用程序把这个字符串的图像进行随机的污染、扭曲，再显示给显示器前的人或者机器，这玩意，就是验证码（CAPTCHA）。很显然，人类能够辨识这些字符，计算机可就傻眼了——当时计算机的辨识技术还很落后。

　　纸质图书怎样快速数字化

　　靠验证码啊！

　　成长·意外之喜

　　《纽约时报》从1851年到现在的所有报纸，借广大网友之手成功录入了计算机。一个令人生厌的输入验证码，就这么变成了一个对人类知识宝库做贡献的公益之举。

　　虽然验证码拦截住了大部分的恶意注册和垃圾信息，但也带来了用户时间的浪费。

　　有人会说，输入一次不就10秒钟吗？对学渣而言，你给他一年他也敢潇潇洒洒地浪费啊？但“神”可不是这么想的。Luis von Ahn掐指一算，全人类一天就要浪费55万个小时。这些时间怎么能收集起来，让它产生价值？

　　优质男想到了拿这些零碎时间，来帮助纸质图书进行数字化，称之为“reCaptcha”。比如150年前的《纽约时报》，从前我们要数字化，要不就是手动输入，要不就是扫描后靠软件识别，但软件识别的准确率很难保证。尤其不少文章，已经因为年代久远，油墨褪色，变得更难辨识。而Luis von Ahn要做的，就是把扫描件上的单词切割抽取出来，然后与一组自动生成的字符混合，生成验证码。于是《纽约时报》从1851年到现在的所有报纸，总共超过1300万篇文章，就这么借助广大网友之手，成功地录入了计算机。因而Luis von Ahn又被称为著名的众包先驱，《彭博商业周刊》誉其为“人类计算”的先锋，即借由计算机和网络平台，发挥人类技能，去解决大规模、复杂的问题。

　　2009年，谷歌收购了这个天才的项目。随后人们就发现，验证码里怎么会出现疑似门牌号码的图片？没错，这些就是门牌号，来自Google拍摄的街景。为了提高地图的准确度，那些机器人识别不出来的门牌号码，就可以丢给reCaptcha让广大网友帮忙识别了。

　　谷歌已能自动识别你是人是妖！

　　未来·大道无形

　　还嫌验证码麻烦吗？

　　谷歌开发了一种没有验证码的验证码，只提供了一个复选框，里面写着“我不是机器人”。当你打钩的瞬间，谷歌便可以借此区分你是一个真人还是自动程序。

　　所谓道高一尺，魔高一丈。

　　当年“魔”还只是发发垃圾广告获利，后来用计算机还能破解密码、盗号、操纵网络舆论和投票……试想，如果没有验证码，黄牛用个电脑程序就可以把大量12306的火车票购入囊中。巨大的黑金利益，催生了破解验证码的疯狂。

　　为了防止验证码被轻易破解，十几年间验证码陆续发展出了多种形式。比如验证码最早是数字，后来是字母，然后是数字加字母，后来腾讯又推出了汉字验证码。汉字就汉字吧，还给汉字打上了马赛克。验证码还开始跟手机短信结合。如果没有验证需求，在微信已经一统天下的今天，手机短信几乎失去了存在的必要。

　　但上述不管怎么变，验证码都依然处于输入字符的时代。而惯于挑战人类想象力的谷歌则反向行之，先是推出了图片验证码，后来又致力于把人类再从输入验证码中解放出来。

　　这个牛气闪闪的项目，就是上面谷歌收购的reCaptcha的新版。去年底，谷歌宣称，他们开发了一种没有验证码的验证码“No Captcha reCaptcha”），只提供了一个复选框，里面写着“Im not a robot”（我不是机器人）。当你打钩之后，谷歌就能利用“风险分析引擎”以此来判断你到底是不是真人。

　　谷歌敢颠覆传统验证码的背后，有着强大的人工智能技术的支撑。“风险分析引擎”，就像一个善于搜集蛛丝马迹、深谙行为分析术的超级FBI。他们会收集大量信息，包括IP地址和cookies，然后通过收集这些数据看对方是否和过去在互联网上的行为一致，来判定这个用户究竟是不是机器人。即便是在单击复选框之前移动鼠标的那一瞬间，谷歌都可以借此区分一个真人和一个自动程序之间的那点微妙的差异。

　　如果你被谷歌判断为“可疑”，那它就会给你传统的验证码进行第二次验证。这里面既包括升级版的字符验证码，也包括图片验证码——早在2009年，谷歌就研发出了这种新型的图片验证码。谷歌高级研究科学家表示：“我们的技术拓展了图形验证码的表现形式，让分辨验证码图形的过程不再枯燥无味，而平添了不少乐趣。”

　　如果您有兴趣去细看谷歌的图片验证码。您就会觉得有点眼熟，跟12306最近被吐沫星子淹死的验证码如出一辙！（据《新民周刊》）

qiansi506 · 发表于 2016-3-1 16:32:24

继续支持没话说~ 楼主真强

		自动登录	找回密码
密码			立即注册

验证码的魔道之战

站长推荐 /1