据VentureBeat报道,当Cambridge Analytica等大数据公司宣称自己影响到2016年美国总统大选后,它们立刻成为媒体关注的重点。这些公司通过社交媒体贴文和第三方数据推断出用户的性格特征,并利用高度可操纵化的广告影响民意。利用购物习惯、杂志订阅、Facebook“点赞”以及其他高达5000项输入等大量数据,Cambridge Analytica等公司可以对美国2.2亿成年人的性格作出预测。

88cbd1a4fbaa4cce9286a9d15a79d33620170329083645.jpg

有了这些非常详细的“档案”,Cambridge Analytica就可以针对你的性格进行“行为微定位”。但是这家公司并非唯一这样做的机构。财富500强企业的品牌营销员、数字广告上以及各种各样的分析公司,都在通过分析社交媒体和公开贴文寻找影响消费者的更好机会。初步研究显示,针对消费者性格推出的广告,在Facebook上获得点击率高达63%。

如果你在Facebook或Twitter上非常活跃,你的社交媒体资料可能泄露你的很多信息,这些信息可被广告商利用。美国宾夕法尼亚大学计算机科学教授莱尔·昂加尔(Lyle Ungar)利用他的职业发展统计和机器学习方法从文本中提取洞见,重点关注你的Facebook和Twitter贴文,特别是与你的健康和福祉有关的内容。

经过对你社交媒体行为进行数年研究,昂加尔及其团队可以对你做出以下五项推测:

1.年龄和性别

女性来自金星,男性来自火星。当你分析男女在社交媒体上使用的语言时,这种区别就更加明显。女性更多使用情绪词汇、第一人称,更多提及心理和社交过程。而男性大量使用脏话和游戏术语,他们的占有欲更强,比如总会加上“我的妻子”、“我的女友”,女性则只使用丈夫或男友。

e26661b8f0a44a7697f2095d409a2e7320170329083645.png

在自我表达过程中,男女在年龄方面的差异也很大。即使使用类似短语,也可以看出你是否足够“成熟”。昂加尔及其团队在MyPersonality项目中分析了7.5万份Facebook资料,才得出上诉结论。如果你觉得好奇,可以在昂加尔的网站(http://www.wwbp.org/agegender.html)上尝试下年龄或性别预测,看看其预测模型是否足够准确。

6041ec8b7f7f485da4af998cc20770f920170329083645.png

2.性格特征

麦尔斯-布瑞格斯性格类型指标(Myers-Briggs)可能很受欢迎,开放性、尽责性、外向性、宜人性以及神经质等五大性格特征,在预测中表现出更高的预测价值。但性格特征毕竟不是实物,你不可能精确到小数点后多少位。在最好的情况下,在进行实际预测时,研究人员会发现“弱阳性”和“负相关性”。

de83f89f81e54e21bb456c63e69f1fbb20170329083645.png

如果你想知道自己在神经质测试中得分多少,IPIP-300是可用到的更全面测试之一。你也可以使用昂加尔的社交媒体资料分析法。除了年龄和性别,性格特征在我们的语言表达中也截然不同。显然,外向性的人等不及参加派对,而内向性的人多沉迷于动漫、互联网以及游戏等。

即使个人资料中的照片选择,也会泄露我们的性格特征。性格非常开放的人更有可能选择艺术性和非正统性照片,而且这些照片都不是他们自己的面孔。他们也有更好的审美感,选择对比对、清晰度以及饱和度更高的照片。而尽责性的人则会做出相反的选择,他们通常张贴自己的正面照,而且只有脸部。外向性的人倾向于张贴自己与其他人的合影。

3.职业

72211189fff34d98b2944a190a22e5ca20170329083645.png

如果你没有与职业社交网站LinkedIn上的人联系,你可能不会去看他们的资料和当前职位。事实证明,他们在Twitter上的公开发言也可能隐秘地揭示这个信息。这并不令人感到惊讶。高管们通常会写有关商业或金融新闻方面的东西,而低级职员会用更多时间讨论个人兴趣爱好,而非与工作相关的主题。昂加尔的同事丹尼尔·彼得洛(Daniel Preotiuc-Pietro)及其团队能够通过分析Twitter上的用语,非常准确地分析出某人的职业。

4.自恋与精神变态者

cdc31b45a53a42d0b5c06c15ff059a7b20170329083645.jpg

通过社交媒体语言,你还可以发现令人毛骨悚然的东西。自恋者追求声望、地位以及其他人的艳羡,而精神变态者缺乏悔念、敏感性,对道德毫不关心。喜好权谋的人故意操纵和利用其他人实现自己的目标。这些人类行为的阴暗面可被合并称为“黑暗三弦”。正如预期的那样,精神变态者更多使用攻击性和暴力语言,比如杀戮、愤怒以及其他负面情绪用语。权谋者大量使用垃圾邮件和广告贴文。行为分析也可发现这些性格特征。自恋者更有可能发布涉及地理位置的推文,不太可能发布重复性贴文或标签,这显示他们对推文进行了精心策划。

5.死于心脏病的可能性

31cd09927efb4635b5b7059b0615957420170329083645.png

在2015年研究论文中,昂加尔及其团队描述了一种模式,只使用Twitter上的数据就能预测心脏病的死亡率,甚至比其他传统因素(包括人口、社会经济)与健康危险因素(比如吸烟、糖尿病、高血压以及肥胖)相结合的方法更准确。在人际关系恶劣和慢性压力下,心脏病会加重。昂加尔及其团队追踪反映负面社会交往、负面情绪(比如愤怒)以及脱离社会的语言,这些标志都是心血管疾病死亡的更精确预兆。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-18 11:33:00
运维管理 当数据中心遇上机器学习,你要失业了!
机器学习是人们迄今为止挖掘大数据潜力而发现的最强大的工具,而数据中心行业是受益最大的行业之一。 <详情>
2017-07-18 10:23:27
大数据技术 人工智能和机器学习如何帮助IT团队解决数据管理问题
掌握和处理大量数据对于IT部门来说是一个挑战。以下是人工智能(AI)和机器学习如何帮助人们分类、组织和汇总大量信息的方法。 <详情>
2017-07-07 16:44:40
运维管理 机器学习工具在数据中心的应用与发展
在互联网诞生之初,数据中心规模很小并且很简单。一个大型电子商务服务数据中心仅用几个19英寸机架来部署所需的服务器,存储器,以及网络设备。如今,超大型数据中心成千上 <详情>
2017-05-31 17:13:52
国际资讯 NVIDIA旨在通过Isaac计划构建更好的机器人
NVIDIA在推出用于机器人和无人机的Jetson TX2硬件之后,昨天在Computex发布“Isaac计划”,该计划专注于加速各种机械设备的开发。 <详情>
2017-05-04 13:49:47
公众号 Gartner市场分析:分析、机器学习和AI是 CRM 未来发展方向
先进的分析、机器学习和人工智能 (AI) 将在未来三年内彻底改变 CRM。 <详情>