论文部分内容阅读
冬日的圣何塞依然舒适,阳光照在脸上温暖、祥和。Double Tree酒店会议厅,一个有趣的话题正在被讨论着:“大数据如此之万能,那为何我还单身?”
近年来,越来越多的人追捧一句话:“除了相信上帝之外,我们必须相信数据。”“大数据”以其独具的海量、多样性、高价值等特征痴迷了诸多领域的人,似乎它可以解决一切难题。
此刻,这个有趣的问题勾起了美国存储与网络领先厂商LSI公司工程师的兴趣。Bob Quinn发言:“這或许是因为你的数据有问题。”但是,紧接着,Bob意识到,通过数据分析和挖掘,其实可以给出更专业、有效的解决方案,就像LSI公司日常为客户提供的业务—有效管理海量数据,同时使数据中心实现最高性能和效率。
Bob是LSI企业战略办公室副总裁兼首席技术专家。Bob的方案是,检索全球单身男士的数据库,将爱情特征进行量化,最终得出一个理想的结果。“数据架构需要改变,原先是单个服务器锁定单个目标,现在是多个服务器追踪多个目标。” 即,有效管理和分析海量数据。
更酷的是,筛选过程可以瞬间完成。“当你进入一个酒吧,看到一个挺顺眼的人,分析工具将帮你一秒钟分析你的DNA和他的DNA,得出结论,你们的孩子将可以进世界顶级大学,还是会变成一个毒贩子。”Bob说道。这一过程追求得是数据的最高性能和效率。
这听上去很酷?事实上,这仅是大数据的一个简单应用。
这么一个庞大的婚恋数据库显示,有约20%的恋爱关系是从网络、手机约会服务开始的。作为一个人口大国,中国有约1.4亿“嗷嗷待哺”的单身男女希望从网络交友网站找到自己的真爱。美国18岁以上单身的男女数量为9000万,约占总人口数量的40%,其中又有4000万指望网络约会网站带给他们一个“都教授”或“千颂伊”。
当然,大多数用户可能不会知道,在各种婚恋网站、APP为他们推荐合适对象的背后,有一群数据库专家、大数据科学家和数学家在辛勤地工作。
用户在注册全球著名婚恋网站eHarmony时,需要填写一份资料问卷,包括个人喜好、身材状况、爱好以及其他细节。有了这些数据之后,eHarmony利用Oracle 10G数据库从分布全球的服务其中搜索最投缘的交往对象。系统要与其他2000多万名注册用户进行数据比对,至少要进行10亿次计算。经过一系列复杂的算法,你未来的爱人就出现了屏幕上。eHarmony的个人资料库数据总量超过4TB。
设计精良的方程式加上强力的数据中心,这就是在线交友精准匹配的秘密所在。只要用户对自己的资料进行了修改,系统仍旧可以在短时间内为用户找到最合适的交往对象。
不过大数据在线交友还有许多要改进的地方,因为用户的资料不可能完全真实,尤其是个性方面。许多人都活在自己的世界中,他们认为别人怎么看待自己,结果恰恰相反,自认为开朗的人,在现实生活中很有可能就是一个闷骚男。而且随着征友征婚的人越来越多,用户资料会越来越多,数据库也将越来越大,交友征婚网站只有在软件和硬件两方面同时创新,同时进步才能满足用户需求。
网络交友邂逅大数据,说不定真的可以遇见真爱。
近年来,越来越多的人追捧一句话:“除了相信上帝之外,我们必须相信数据。”“大数据”以其独具的海量、多样性、高价值等特征痴迷了诸多领域的人,似乎它可以解决一切难题。
此刻,这个有趣的问题勾起了美国存储与网络领先厂商LSI公司工程师的兴趣。Bob Quinn发言:“這或许是因为你的数据有问题。”但是,紧接着,Bob意识到,通过数据分析和挖掘,其实可以给出更专业、有效的解决方案,就像LSI公司日常为客户提供的业务—有效管理海量数据,同时使数据中心实现最高性能和效率。
Bob是LSI企业战略办公室副总裁兼首席技术专家。Bob的方案是,检索全球单身男士的数据库,将爱情特征进行量化,最终得出一个理想的结果。“数据架构需要改变,原先是单个服务器锁定单个目标,现在是多个服务器追踪多个目标。” 即,有效管理和分析海量数据。
更酷的是,筛选过程可以瞬间完成。“当你进入一个酒吧,看到一个挺顺眼的人,分析工具将帮你一秒钟分析你的DNA和他的DNA,得出结论,你们的孩子将可以进世界顶级大学,还是会变成一个毒贩子。”Bob说道。这一过程追求得是数据的最高性能和效率。
这听上去很酷?事实上,这仅是大数据的一个简单应用。
这么一个庞大的婚恋数据库显示,有约20%的恋爱关系是从网络、手机约会服务开始的。作为一个人口大国,中国有约1.4亿“嗷嗷待哺”的单身男女希望从网络交友网站找到自己的真爱。美国18岁以上单身的男女数量为9000万,约占总人口数量的40%,其中又有4000万指望网络约会网站带给他们一个“都教授”或“千颂伊”。
当然,大多数用户可能不会知道,在各种婚恋网站、APP为他们推荐合适对象的背后,有一群数据库专家、大数据科学家和数学家在辛勤地工作。
用户在注册全球著名婚恋网站eHarmony时,需要填写一份资料问卷,包括个人喜好、身材状况、爱好以及其他细节。有了这些数据之后,eHarmony利用Oracle 10G数据库从分布全球的服务其中搜索最投缘的交往对象。系统要与其他2000多万名注册用户进行数据比对,至少要进行10亿次计算。经过一系列复杂的算法,你未来的爱人就出现了屏幕上。eHarmony的个人资料库数据总量超过4TB。
设计精良的方程式加上强力的数据中心,这就是在线交友精准匹配的秘密所在。只要用户对自己的资料进行了修改,系统仍旧可以在短时间内为用户找到最合适的交往对象。
不过大数据在线交友还有许多要改进的地方,因为用户的资料不可能完全真实,尤其是个性方面。许多人都活在自己的世界中,他们认为别人怎么看待自己,结果恰恰相反,自认为开朗的人,在现实生活中很有可能就是一个闷骚男。而且随着征友征婚的人越来越多,用户资料会越来越多,数据库也将越来越大,交友征婚网站只有在软件和硬件两方面同时创新,同时进步才能满足用户需求。
网络交友邂逅大数据,说不定真的可以遇见真爱。