百万个冷知识百万个冷知识

百万个冷知识
一起学习百万个冷知识

善意还是龌龊?Facebook如何利用大数据(facebook在美国的地位)

Intetix Foundation(贤明泰思促进会)由从事统计数据自然科学、非营利性组织和公共行政研究的中国研究者发动成立,致力透过统计数据自然科学改善人类社会风气和自然生态。透过连络、调动中德最顶级的统计数据自然生物学家和社会风气自然生物学家,以及分布在亚洲地区的义工,她们谢鲁瓦弘扬着她们的历史使命:为美好未来穿鞘统计数据价值。

书名镜像:How Facebook is Using Big Data: Good, Bad, and Ugly

原作者:Avantika Monnappa

结语

一则来自高盛集团的调查报告曾表示,直到2009年底,那些拥有少于1000位雇主的子公司已经储存了她们客户的现实生活中少于200万亿元二进制的统计数据。

在过去的六年里,SNS新闻媒体上统计数据的猛增,增加了这一不可思议的储存统计信息量:上万亿元条twitter最新消息,数千万个Facebook里的“赞”,除了更多数量的Foursquare(打卡应用的泰斗)“打卡”。除了Instagram和Pinterest也为海量数据的重要信息统计数据做了贡献。SNS新闻媒体所搜集的统计数据,其数量已足够多不可思议。

社会风气新闻媒体加快创新的脚步、促进成本的节省并加强国际品牌间的大规模合作。在每两个金融行业,子公司都在使用那些因特网来经营和提升她们的服务和产品的质量,并监控其使用者们对于她们国际品牌的意见反馈。

SNS新闻媒体与大统计数据的结合将达到两个崭新的技术水准。

Facebook

作为两个在近三年里累积了少于12亿亚洲地区使用者的非主流网络因特网,Facebook存储了大量的使用者统计数据,这使它成为两个巨大的“统计数据主题公园”。

2015年SNS新闻媒体市场推广金融行业调查报告表示,Facebook在众多SNS因特网中异军突起。

她们每天都发送给Facebook统计资料库堆积如山的重要信息:100万条Facebook最新消息被发布、45万个“赞”被点选,除了3.5千张新相片被上载。

大多数人起先可能对那些重要信息一屑罔顾。但是有了那些统计数据,Facebook就能知道谁是她们的朋友,她们是甚么样子,她们在哪里,她们正在做甚么,她们喜欢甚么,她们憎恶甚么等等。一些人类学家甚至认为Facebook掌握她们足够多的重要信息,所以它比她们的个人医生更懂她们!

除了谷歌,Facebook可能是唯一一家拥有消费者高度详细统计数据的子公司。使用Facebook的使用者越多,她们获取的重要信息也就越庞大。Facebook斥巨资来提高她们自身搜集、储存和分析统计数据的能力,但它并不是止步于此。除了分析使用者统计数据,Facebook也有其他分析其使用者行为的方式:

1. 跟踪电脑cookies:Facebook在互联网上透过追踪cookies来追踪它的使用者。若使用者在登录Facebook同时浏览网页,它就能跟踪到其使用者正在访问的网站地址。

2. 面部识别:Facebook近期将投资重点放在了面部识别和图像处理功能上。Facebook储存使用者共享图像,所以它能在网络上跟踪到使用者和其他Facebook使用者头像。

3. 建议使用的标签:透过在Facebook里添加的标签,使用者的图像能够进行画面处理和面部识别。

4. 分析点“赞”:最近一项由剑桥大学和微软子公司研究院发动的研究表明,仅仅透过分析使用者在Facebook点过的“赞”,就能精准预测其在一定范围内的个人特性,这包括预测使用者的性取向、对生活的满意度、智力水平、情感的稳定性、宗教、酒精以及药物的摄入情况、情感状态、年龄、性别、种族以及政治观点等方面的重要信息。

Facebook 子公司的首席分析师Ken Rudin曾提到:“大统计数据关系到子公司的生死存亡”。他补充到,“Facebook依赖于Hadoop(分布式系统基础架构)式的两个大规模装置,那是两个透过廉价服务器群来解决问题的可拓展的计算机开放源代码框架。出于这个目的,Facebook甚至设计了自己的硬件设备,而Hadoop只是Facebook应用的众多大统计数据技术的一种。

实例:

以下例子展现Facebook如何利用其储存的大统计数据。

Facebook相片回忆器

在公司成立十周年之际,Facebook向使用者提供查看和分享短片的功能,这个短片记录了使用者从注册之日到现在的SNS网络活动。这就是Facebook的相片回忆器,这段视频其实是由使用者收获了最多评论和“赞”数的相片和状态组成的,并配上一段怀旧的背景音乐。

“我已投”

Facebook已经成功将政治活动捆绑在其使用者的参与中,她们透过两个社会风气实验使使用者能够用两个在她们个人资料上的显示“我已投”。

这个实验在2010年美国中期选举运行地十分有效。当使用者看到投票按钮,她们就极有可能去投票,并会在和她们同样参与其中的朋友直言不讳地分享。在Facebook所有的6100万使用者当中,有20%的使用者看到她们的朋友们投票了,自己也会去投。

Facebook统计数据自然科学部门称,透过6万名选民在Facebook上的直接投票和由社会风气感染效应而产生的28万名选民,总共为这次中期选举贡献了34万张投票。

庆祝骄傲

Facebook随即推出一款叫作庆祝骄傲的彩虹大头照滤镜工具。类似这样的庆祝活动之前是前所未见的,直到2013年,当时300万使用者开始将头像改为红色等号以此支持婚姻平等,“红色等号”正是美国最具影响力的反同性恋歧视组织HRC标志。Facebook提供两个简单方法将头像变成彩虹色。

据Facebook发言人William Nevius说,短短几个小时内就有少于百万的使用者更改头像。在这样的狂潮下,人们不禁关注起Facebook在进行使用者情绪的追踪方面和其隐藏行为方面的研究起着怎样的引导作用。Facebook的两位统计数据自然生物学家在发表的论文《对线上SNS运动支持的扩散》中分析在Facebook里能预测婚姻平等支持率的要素。根据这篇文章可知导致使用者将头像更改为红色等号的原因。

担忧

隐私问题

因为统计数据隐藏着巨大财富,广告商如饥饿秃鹫般伺机等待。这导致使用者对隐私问题的高度担忧。尽管Facebook不断向使用者保证重要信息只有在使用者允许下才能共享和匿名出售给市场推广者,但是问题仍然存在。举个例子,很多使用者抱怨隐私设置不易理解或太复杂。使用者很容易不经意间分享她们的状态。Facebook为了解决那些问题反而使得使用者更加迷惑。

另两个浮现的隐私问题是由脸部识别引起的,这一技术促使2011年欧盟隐私监管机构进行调查。Facebook的相片搜索功能又引起一场轩然大波,因为该功能给陌生人提供比以往更多访问私人统计数据的重要信息。

因此,Facebook使用者都有两个问题,个人隐私真的无法保障吗?

Facebook的两个问题:

Ken Rudin 说依赖大统计数据的子公司经常在框架结构上有两个错误:

1.她们过于依赖某一种技术,如Hadoop。Facebook依赖于Hadoop软件的大量安装,这个高度可扩展开源框架利用大量低成本服务器来解决问题。为了这个目的,子公司甚至设计自己的内部硬件。Rudin先生补充道Hadoop只是众多大统计数据技术的一种,是不足以满足子公司业务需求的。

他又说,“Facebook分析过程始于300PB统计数据分析仓库”。为了应答特定查询,统计数据经常被分离出统计数据仓库,放在表中使得统计数据能被研究。团队也研制两个搜索引擎对统计数据仓库中统计数据进行编制索引。那些都是Facebook为管理和分析而使用众多技术的冰山一角。

2.子公司常常为了无意义问题使用大统计数据。Rudin先生说“在Facebook,所谓两个有意义问题是被可以答出可以改变行为的基础性问题。如果你不认为两个问题的答案可以引导改变你的经营模式,那么这个问题根本没有问的必要”。

Facebook的最近进展

主题统计数据

Facebook最近向它的一些合作伙伴介绍“主题统计数据”。

“主题统计数据”是甚么?

“主题统计数据”是这样一种能将消费者关于国际品牌,事件,活动,和主题的意见反馈展示给市场推广者,在某种程度上保护消费者个人隐私的技术。

市场推广者反过来可以利用从“主题统计数据”得到的重要信息来选择性得改变她们在因特网和其他渠道的营销方式。

先前由第三方提供的此类统计数据由于样本量过小而收效甚微,况且得到规律是不可能的。透过引入“主题统计数据”,Facebook将统计数据分类并且将相关使用者的个人重要信息剥离,透过提供某个特定活动中使用者潜在的(消费)行为来帮助市场推广者。这为市场推广者带来两个可行的,全面的首次新使用者视图。

关于隐私问题,Facebook已作出安全承诺。所有用于主题统计数据的重要信息都将被匿名搜集。

参与人员:策划-徐睿艺、樊茜茜;

编译-欧阳碧娜、王诗萁;

编辑-梁雅祺;

推广-申洪浩、李华芳 、李燕云

转载声明:欢迎转载,请您在转载时保留署名和引用重要信息。欢迎您在知乎或微信上关注她们。

未经允许不得转载:百万个冷知识 » 善意还是龌龊?Facebook如何利用大数据(facebook在美国的地位)
分享到: 更多 (0)

百万个冷知识 带给你想要内容

联系我们