案例:看程序媛如何通过数据挖掘找到对象的
Posted 数据化管理
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了案例:看程序媛如何通过数据挖掘找到对象的相关的知识,希望对你有一定的参考价值。
本文是一个真实的犹太裔程序媛在婚恋网站通过自身设计的评分系统找对象的故事,希望可以为广大单身朋友一些启发,早日找到属于自己的另一半。
主人公的名字叫艾米•韦伯。几年前,她发现自己走到又一段美好恋情的尽头,一切绚丽消逝,如果你问她,到底怎么了?“真不懂,为什么每次都这样都是以失败告终”,她就去问身边的人,看看其他人怎么想(以下将使用主人公第一人称来讲述整个故事)。
顺其自然
我找到姥姥,姥姥总是有很多忠告,姥姥说:“别太挑剔了,你得多跟人谈谈,还有最重要的是,顺其自然,缘分始终会来的”。而实际上,我有着这样的特质:我总要找依据、总是沉浸在数字当中,长期和公式、图表打交道。
同时,我的家庭非常和睦,所以,她从小就想,长大以后要有一个温暖的大家庭。所以这次分手我很伤心,我当时30岁,想着起码要和下一任交往6个月,才能真正确定关系,然后再考虑搬到一起住,之后再过段时间,才考虑订婚。
所以,如果想在35岁之前要孩子,就意味着我必须提前五年为结婚做准备,很明显,这样太慢了,如果“顺其自然”等缘分,那么,我要面临的变数是“运气”。但这是我最不想使用的策略,因为这个策略太不靠谱了。
适合的男生有多少
首先,我想探个究竟,看看随缘偶遇真命天子的概率有多高,我住在费城,这是个大城市,我很简单的以为,地方越大,机会越大,但是当我越是往下算的时候就发现事实没这么乐观了。
1、费城人口总共150万,估计一半是男性,有效人数下降到75万;
2、我的目标是30到36岁之间的男性,他们占这部分人口的4%,算起来可能剩下3万人;3、我要找犹太人,因为我本身也是,犹太人只占这部分人口的2.3%;
4、然后,估计10个人当中有一个我会喜欢;
5、还有,我和爱打高尔夫球的完全合不来;
也就是说,对我而言,在整个费城仅有35位男士适合约会!
与此同时,我的家庭中其他成员全部都结了婚,而且还生了很多很多的孩子,所以我总有巨大的压力和紧迫感,要尽快解决人生大事。这时候,我有两个办法:一是可以听姥姥的话,尝试“顺其自然”碰上那一位,在费城茫茫150万人海中,偶遇那35位男士其中的一位。
又或者,我可以试试婚恋网。
遭遇打击
作为程序员,其实我挺喜欢婚恋网站,因为我们可以运用运算规则推算结果,所谓运算规则其实很简单,当我们遇到问题,只要收集数据放到系统里面就能找到解决办法。
不过婚恋网站的运算规则太简单,在几千年前就可以找到,例如犹太族,从很早以前就有媒人,虽然他们没有列出公式,但在脑子里,一定琢磨过这些问题,比如,女孩会喜欢男孩吗?两家人能处得来吗?拉比(犹太教师或法学导师)会怎么说?他们会不会马上生孩子?媒人们会先想好这些问题,再把两个人凑到一起就完事了。
而我呢,我想,能不能通过数学和公式帮我找到白马王子?我决定注册,这里还有一个小插曲,我开设了几个婚恋网账户,碰巧那段时间特别、特别忙,不过那还不是最大的问题,最大的问题是,我讨厌填问答表,所以我直接把简历复制粘贴上去。
在个人描述部分,我说我是个获奖记者和未来思考者;让我描述兴趣爱好和理想人选,我填了“赚钱”和日语流利,还写了很多关于网页编码的内容,这样确实不太好。然而还是有很多男士和我约会,婚恋网站的配对公式为我找到一大批男士,他们不断约我,可结果却特别糟糕,其中有一位叫史蒂夫的技术男,婚恋网站的配对公式发现我们都对小玩意着迷,我们是数学迷、数据迷、还是80年代歌迷,我同意见他,然后这位技术男带我到费城一家特别高消费的西餐厅,刚到餐厅我们就发现交谈的不太有意思,但他点了很多吃的,他连菜单都不用看,就点了几份开胃菜、几份主食,还帮我点了一些。忽然间桌上堆满了大盘小盘的吃的,还有很多很多瓶酒。
开始统计数据
我开始纪录那些无聊又尴尬的性暗示语言、不适当的用词,还有对方逼我与他击掌的次数,然后我开始统计这些数据,并且找到一些关联,我发现,不知道为什么,喝苏格兰威士忌的男性能让我立马联想到“性怪癖”,当然不是说他们不好,只是不适合我。同样,婚恋网站把我们凑到一起的配对公式也不差,它们按预先设计好的正常运行,用提取到的用户信息,比如我的简历,再和其他人的信息配对。
可见,真正的问题是,虽然公式会按部就班,我们却没有。当我们面对空白栏,填写个人信息的地方,没有多少人可以赤裸裸地描述完全真实地自己。另一个问题是,网站总爱问:你喜欢猫还是喜欢狗、爱看惊悚片还是爱情片?之类地问题。我又不是来找笔友,我在找丈夫,对吧?而这些数据比较肤浅。
所以我有个新计划,继续上婚恋网,但只把它们当作资料库,而不是继续被动的等公式配对,我要把整个系统反过来,重新定义。既然公式配对用的是肤浅信息,我决定自己问问题,我要找的另一半,需要具备哪些条件呢?我开始写,不停地写,到最后我积攒了72个数据点。
1、我想找犹太人,找一个与我有共同文化背景和观点的人,但他又不会强迫我每周五六去犹太集会;
2、我想找一个勤奋的人,因为我觉得工作特别重要,但不能工作狂;
3、我还想找一个打算生两个小孩,而且在育儿方面和我观点一致的人。也就是说,他完全不介意要孩子三岁学钢琴、可能还外加一些电脑课如果条件允许的话。
4、我还想找一个愿意远足异乡的人,一起去约旦的彼得拉;
5、还有我希望他比我重20磅;
......
有了这72个数据点,说实话,还真不少了,接下来我整理出优先次序。分两层排列这些数据点,第一层的打分从100排到91,列有有我希望找一个很聪明的人,一个可以给我带来挑战和刺激的人等等。然后在第二层放上另一组数据点,打分从80排到10,这些对我同样重要但不是必不可少。
建立打分系统
列表完毕之后我开始建立计分系统,我想尝试,借助数学计算出我和网站人选是否匹配,我想对方至少要达到700分,才给他发电子邮件,或者回信;达到900分,才答应约会。我不会轻易投入感情,除非对方超过1500分才可以考虑。这个方法还挺有效的。我回到婚恋网,发现了Jewishdoc57,他出奇的帅而且谈吐出众,曾经登上富士山,爬过长城,而且他喜欢旅行。
我想,我成功了!编码已经被破解,我终于发现了犹太的白马王子,正如家人所愿。问题只有一个,他并不喜欢我。看来有一个变数我还没有考虑,那就是竞争对手。社交网站,都有哪些其他的女性?
我发现了SmileyGirl1978,她说她是“快乐、活泼、有趣的女孩”她填写的职业是教师,她说她“很傻、很友善”,“常常”爱逗大家笑,就在那一刻,点击完一个又一个类似的个人档案之后,我知道还需要市场调研,接着我在婚恋网站建立了10个虚拟的男士档案公布出去。
市场调研
我把虚拟男士放出来之后,还遵守了一些规矩,首先我没有主动联系女性,只等着看能吸引到谁。我的主要关注点有两个方面:
定性数据。比如,幽默感、语调、声音、沟通方式这些女性的共通点是什么。
定量数据。比如个人档案的平均长度,两次通信之间隔多久。
我想证明的是,如果有机会面对面交流,我的竞争力不比SmileyGirl1978差,所以我想知道怎么调整网上档案,才能最好的呈现自己。一个月之后,我收集了大量数据,足够再分析一回。
结果发现,内容很重要,聪明的人往往写很多,3千、4千、甚至5千字的自我介绍,也许这么多内容真的非常非常有意思,但是很难匹敌最受欢迎那男女精选的97个字,虽然我们不一定感觉得到;高手们的另一个杀手锏是不特定语言,以我为例,你看《英国病人》是我最喜欢的电影,但它不适合放在个人档案里面,因为这是一个肤浅的数据点,有人可能会有不同的意见,并且因此决定不和我约会,仅仅因为他们不愿意花三小时看一场电影。
还有,积极正面的语言很重要,看这些关键词,里面是最常用的词语,最受欢迎的女性都在用,比如:“有趣”、“女孩”,还有”爱“,后来我意识到,没必要写一个低智商的简介。还记得吗?我说,我能讲流利的日语,并且熟悉网页编码。这些都没问题。重点是怎么写能让自己显得更亲切,让别人知道怎么采取主动。除此之外,时机也非常重要,当我们拿到别人的手机号码,或者聊天账号,碰巧凌晨两点还没睡,也许不是联系他们的好时机,最受欢迎的女性一般会等23小时再进行下一次的沟通,这也是我们约会时的常规做法。
最后,轮到照片了。所有受欢迎女性都会露一些肩膀,或者她们看起来很棒的部分身体,形成鲜明对比的是我当时上传的照片。
获得成功
掌握了这些信息之后,我建立了一个超级档案,我,还是我,只是,在这个生态系统当中更加优化的我。事实证明我做的很不错,我成了婚恋网最受欢迎的人!
然后没过多久,我发现这个人,Thevennin,他说他接受犹太风俗,还说他的工作是捕猎北极小海豹。我觉得这个说法很有意思,他详谈了很多关于旅行的事,引用了各种有趣的文化,他外表和谈吐都是我想要的,当场就拿下850分,够约会了。三个星期之后我们见面,谈了足足14个小时,从咖啡店到餐厅,到另一家咖啡厅再到另一家餐厅,那天晚上他送我回家之后,我重新评估:1050分。看来,我一直还不够挑剔。
一年半之后,我们去旅游。在约旦的佩特拉,他单膝下跪求婚,一年之后我们结婚,又过了一年半我们的女儿佩特拉出生了。
可以看到,我很享受这段精彩人生,不过问题是,这一切对你有什么意义?事实可以证明,爱有计算规则,但不是我们在网上看到的那些,而是你自己写出来的。所以无论你要寻觅另一半,还是找回激情,又或者要创业。只需要真真切切的找出自己的框架,按自己的规则进行发挥,爱多挑剔就多挑剔。
对原视频感兴趣的朋友可以看一下:http://m.v.qq.com/play/play.html?coverid=&vid=g01604n6hr6&ptag=2_5.6.2.12104_copy
数据化管理的培训信息:
我在六月23~23日的厦门场《营运数据分析》培训名额目前还挺宽裕,这个时间段有空的朋友可以来厦门约,报名请添加助理微信:zr958277517,了解培训内容详情请点击参考:(深圳场报名已满,全国其他场次现在皆可报名)。
以上是关于案例:看程序媛如何通过数据挖掘找到对象的的主要内容,如果未能解决你的问题,请参考以下文章