正文
这样一来,可能适合他的每个同城女性都会出现在匹配列表里,而不适合他的女性一个都不会出现。
Chris McKinlay使用Python脚本快速调取了大量OkCupid的调查问题,然后他将女性约会者分为七个维度,比如“Diverse” 、 “Mindful”,每个都有自己的特点。
从中文系到数学系
对于一名数学专家来说,麦金利的经历有些不同寻常。他在波士顿市郊长大,2001年从明德学院毕业,获得了中文学位。当年八月,他在纽约做兼职,帮助世贸中心北楼第91层的一家公司把中文翻译成英文。五周后9.11事件发生了,第一架飞机在上午8:46撞上世贸中心北楼。幸而麦金利那个时候不当班,正在家睡觉。
“自那之后,我问自己,我真正想做的事情是什么。”他说。一位朋友将他招进了著名的“麻省理工21点小组”的一个分组,在接下来的几年中,他在纽约和拉斯维加斯之间飞来飞去,靠算牌赚到了6万美元的年收入。
“麻省理工21点小组”由麻省理工学院和哈佛学生于1979年组建,曾多次打败拉斯维加斯和大西洋城的众多赌场。Blackjack又称21点,是各地赌场最热门的牌桌项目之一。这在很大程度是因为21点并不完全是碰运气,而要求玩家拥有对数字的敏锐反应、娴熟的算牌技术和沉着冷静的心理。
这段经历激发了他对应用数学的兴趣,他开始攻读数学硕士学位,然后又继续读博。“数学系的学生在很多情况下都可以用到自己的专业,”麦金利说。“比如玩一些新游戏,‘三张牌牌九’之类的,然后回家写一些代码,找出一个策略来打败它。”现在,他要为了爱情做同样的事情。
用假账户搜集数据
首先,麦金利需要数据。就在那天凌晨,他的论文任务继续在另一个窗口里跑的同时,他设置了12个OkCupid假账户,并编写了一个Python脚本来管理它们。这个脚本会搜索麦金利的目标人群(25至45岁之间的异性恋和双性恋女性),访问她们的网页,并在她们的个人资料里搜集所有可用信息:种族、身高、是否吸烟、星座,所有一切。
为了获取问卷数据,他必须做更多的侦查活动。在OkCupid上,只有当你自己回答过某个问题时,你才可以看到别人对这个问题的回答。于是麦金利编写了bot机器人来随机回答每一个问题(假账户的目的不是用来吸引约会对象,所以它们是怎么回答问题的并不重要),然后把目标人群的回答搜集到自己数据库中。
麦金利满意地看着机器人忙忙碌碌。但是,在搜集了约1000份个人资料之后,他遇到了第一个障碍。 OkCupid采用了一个系统来防止这种数据收集活动:它可以轻而易举地发现这种连续、快速的活动。麦金利的机器人一个接一个地被禁了。
克服第一个障碍
他必须训练这些机器人,让它们的活动显得有人味。