导读:花田的技术团队在对海量软硬数据进行分析的基础上,总结出一些人物特征,建立出一定数量的人物模型。再分析具体用户,将其分门别类套入各种模型。这样,用户心仪其中某一个人,便可向其推荐这一类人。
“大数据”作为时下最火热的IT行业的词汇,屡屡见诸报端:电商网站通过数据分析判断用户购买习惯,社交网站通过数据分析分类用户圈子。那么婚恋网站可否通过数据分析向用户精准推送适合的婚恋对象?答案应该是肯定的。“数据能够开口说话当红娘”,网易花田(love.163.com)的负责人夏天宇如是说。
网易花田作为网易布局交友领域的重要一步于2012年底上线,作为网易交友高级总监,数据管理和数据分析出身的夏天宇从一开始便相信:通过挖掘全站用户数据,并结合用户注册产品和使用产品的时间,网易花田可以更精准的为用户推荐合适的匹配,就像是专门定制的一样。
花田的技术团队在对海量软硬数据进行分析的基础上,总结出一些人物特征,建立出一定数量的人物模型。再分析具体用户,将其分门别类套入各种模型。这样,用户心仪其中某一个人,便可向其推荐这一类人。
目前网易花田对数据的挖掘体现在三个方面:
1、基于用户公开显示的基本资料,在后台为用户贴标签。
年龄、身高、职业、收入、择偶要求等这些用户公开显示的资料,最直接反映用户的个人现状和择偶期望,但让用户自己去发掘的时间成本很高。网易花田通过对这些数据进行挖掘分析,为全平台的用户主动推荐匹配度较高的人选。另一方面,由于用户规模足够大,数据分析结果还能够基本反映出大众的择偶要求,比如:年龄22岁的男性用户寻找的异性年龄段一般在18-22岁之间——这些普遍性数据也在用户匹配中占有部分比重。
2、挖掘用户的行为数据,建立用户的。
网易花田每日活跃用户中超过30%会产生互动行为:例如点击感兴趣异性的页面,对异性动态发表“赞”或评论等。用户互动作为一种隐式反馈,相比用户填写的资料更加细致,能够更精准的反映出用户对什么类型的异性更感兴趣。一般情况下,虽然用户的择偶要求较明确,但基于比较泛的筛选条件,一些隐含要求比如购房、购车、名企、名校等没有表达出来,而网易花田通过对用户行为数据的分析能够得到更精准的用户兴趣模型。
3、分析用户Q&A数据,为你推荐真正情投意合的人。
Q&A是网易花田推出的一个问答题库系统,通过设置价值观、兴趣爱好、生活习惯、爱情观等分类问题,让用户参与答题。目前花田平台预设300道QA题,已经有20%左右的用户拥有Q&A数据,平台用户答题量数据达到千万级。网易花田对Q&A数据的分析,能够发现两个异性之间在生活习惯、价值观、兴趣爱好等方面的契合度,建立数据模型,促使用户快速找到沟通的话题。
此外,花田技术团队正试图通过自然语言处理技术和语义分析方法来解码用户性格,实现“软硬兼施”的精准推荐。首先,他们运用切分词方法,从用户的“内心独白”中提取出现频率较高的关键词;再将这些关键词分类,如感性词汇或理性词汇;最后,通过文本分析、语义分析,从中挖掘出用户的性格是内向、外向、理想化还是现实派等等。这一技术目前还在测试中,2013年下半年会逐步投入使用。届时,宅男“定制”女友将拥有除3D打印机之外的另外一条可行之路。