发布日期:2014-06-10 09:14:02 +0000
我们阅读互联网的激荡十几年,看尽巨头之争、指点江山、群雄逐鹿。这些离我们又近又遥远:近是指的我们作为用户离的很近,我们能清楚的感知到又一起的电商大战,谷歌的退出百度的崛起、打车APP回馈或者各种新产品的发布。而作为一个创业者,这又离我们很遥远:阅读这些容易,而深刻去体会行业的发展兴衰,思维转变,并应用到自己的项目并创业,又是另一回事了。
当我们真正创业的时候,开始甚至根本接触不到什么战略,只是带着几个人几杆枪打猎而已,能打到猎物,饿不死已经着实不易了。
今天我们的数据洞察报告,希望能给大家带来一个新的创业视角。我们先从一个人人皆知的小东西说起:验证码(CAPTCHA)。
验证码背后的故事
关于验证码,我们每个人应该都非常熟悉。几乎所有网络应用的注册、提交信息或者交互信息时都要求输入指定图片上的七歪八扭的文字,这是为了防止使用特定程序模拟用户行为。例如:论坛灌水、批量注册ID、各种刷票、等。我们每个人都有输入验证码的经历。
验证码,这个源自卡内基梅隆大学的发明英文名是CAPTCHA(下文统一称之为CAPTCHA),是一个很高大上的名字的缩写:Completely Automated Public Turing test to tell Computers and Humans Apart (全自动区分计算机和人类的图灵测试)。区分计算机和人类的图灵测试,那什么是图灵测试呢?
1950年10月,图灵发表了一篇题为《机器能思考吗?》的论文,成为划时代之作。正是这篇文章,为图灵赢得了桂冠——“人工智能之父”。在这篇论文里,图灵提出“机器思维”的概念,对智能问题从行为主义的角度给出了定义,由此提出假想:即一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(Turing Testing)。
而CAPTCHA,是最简单、应用最广的行之有效的、全自动化的图灵测试。如果你是人类,就可以正确的输入歪曲的字符,如果是计算机,就不能。
从2000年CAPTCHA出现开始,人工智能领域就有无数科学家和黑客致力于破解它!为什么有大量的人试图破解呢?
大家想想:图灵测试是“人工智能之父”图灵提出来的,而代表人工智能学科最高水平的卡内基梅隆大学研究出来最通用的图灵测试CHPTCHA,谁要是能通过技术手段来识别出来,谁就一个单挑了人工智能领域的江湖泰斗“少林寺”!想想一个人单挑了“少林寺”是什么感觉?!
卡内基梅隆大学计算机科学家,CAPTCHA联合开发人Luis von Ahn说:“验证码在2000年左右出现,自2003年开始,每隔几个月就有消息声称有软件可以将其破解。即便是字母验证码被破解,但还有图片验证码,图片验证码变形的背景只有人类才能识别。”
十多年来,大量的团队和公司都在这个上面不断的尝试,但是魔高一尺道高一丈,验证码也不断升级,变得越来越复杂,复杂到有时候我们人类也需要几次尝试才能识别正确。研究人工智能的科学家和黑客们在上面呕心沥血,也很难完成这样“单挑少林寺”的超级壮举。破解CAPTCHA 也就成为了一个神一样存在的目标。
但是如果我告诉你,远在中国的互联网创新精英们早在2003年就已经彻底攻破了CAPTCHA,你信么?
打码模式与打码软件
随着CAPTCHA的使用越来越广泛,破解CAPTCHA不仅仅一项“单挑少林寺”的壮举,还有着大量的经济利益。这个世界上永远不缺为了金钱和荣誉而肝胆涂地的人,有些人“单挑少林寺”是为了江湖荣誉,而更多的人是为了存储在少林寺里面的大量财宝 -- 这些财宝都是附近的财主因为相信少林寺的绝对安全而存放在少林寺的。
从2003年开始,从来没有人能“单挑少林寺”,但是少林寺的珠宝也从来没有安全过。因为发源自中国,推广到全世界有效的破解方法“打码模式”出现了。
所谓的打码模式,其实很简单,就是用人工的方式去破解。破解组织制作了打码软件,当在网上需要输入CAPTCHA时,打码软件自动的把歪曲的图片信息送到打码工人面前,一个熟练的打码工人一分钟可以输入20个以上的CAPTCHA。这就是最早的打码破解模式。
接下来起源于中国的这种人力破解的方式传到了全球各地,各大第三世界国家很多人靠打码为生(不完全统计有100万以上的打码工人存在),而这种工作也有了一个全球通用的名字:CAPTCHA Human Bypass。
有人会问了,少林寺的珠宝到底是什么东西呢?为什么大家都拼命要破解CAPTCHA呢,下面看TOMsInsight的数据组冒死从国内一著名打码软件组织获取的数据:
从2006年开始,中国互联网的游戏和电商开始了高速发展,流量终于可以变现。邮件营销,SEO,IM工具营销等开始火热,打码模式到了新的发展高度,由于打码软件用户的特殊性,也是为了隐藏自己,目前的打码组织都是通过API(国内以易语言API为主,关于易语言这个国内互联网地下世界最常用的语音,TOMsInsight正在调研分析会在稍后分享)来分发,而集成到专有专用的软件中使用(一般使用打码API的软件都是定制开发),所以假设我如果定制一个邮件营销的程序,如果需要识别验证码,我只需要在软件中接入打码组织的API,冲上钱,那么CAPTCHA就再无法阻拦这个程序。
少林寺再也无法保护这些珠宝,而从此垃圾邮件、论坛营销、QQ 的各种群发广告、各种SEO手段,也屡禁不止。著名的图灵测试CAPTCHA在理论上从没有被攻破,但也从没有安全过。
创业视角与分析
我们再回到开头,通过这样的方式来破解人工智能领域神一样存在的目标,虽然目的并不能说是正大光明,但是过程不得不说是一种伟大的创新:虽然并不是在科学领域的突破,而是通过互联网的信息传播速度、商业模式的设计、和劳动力成本不均衡等因素,来达到“通过”图灵测试的目的。
对于大多数创业者来说,技术优势并不成立,所以依靠独一无二的技术来获取竞争上的优势和产品门槛并不现实,而更多的创新只是商业模式、产品设计、或者是思维方式上。
这样的产品或者商业模式在中国互联网世界中已成常态,但是创业者们对此有多少了解呢?看我们接下来一份调查:
可以看出在站长论坛里面沉浸的草根站长们比北京各大创业峰会的高大上创业者们明显更懂得如何利用中国化的互联网思维模式。以生存为目的的站长们,明显知道打到猎物活下去的重要性。而大量想把创新型想法变现,拿到投资,甚至改变世界的高大上创业者们,却又不明白江湖险恶和真正的地气。
中国互联网创新绝对带有中国人独有的智慧,从美国互联网巨头在国内纷纷失败就可见一斑。我们叫嚣着在国内做互联网一定要接地气才能成功。但是“地气”这两个字,却又是慢功夫,是踏实的摸索。很多思维模式的转变不是一朝一夕,同样,接地气也不是说接就接的事情。就如美国的互联网巨头们,多少年了也没学会接中国互联网的地气不是。
------------------------------------------------------
专注于中国互联网的深度数据分析洞察
在这里,沉下心,读懂中国互联网
微信号:
TOMsInsight
点击“阅读原文”查看更多