据VentureBeat报道,当Cambridge Analytica等大数据公司宣称自己影响到2016年美国总统大选后,它们立刻成为媒体关注的重点。这些公司通过社交媒体贴文和第三方数据推断出用户的性格特征,并利用高度可操纵化的广告影响民意。利用购物习惯、杂志订阅、Facebook“点赞”以及其他高达5000项输入等大量数据,Cambridge Analytica等公司可以对美国2.2亿成年人的性格作出预测。

88cbd1a4fbaa4cce9286a9d15a79d33620170329083645.jpg

有了这些非常详细的“档案”,Cambridge Analytica就可以针对你的性格进行“行为微定位”。但是这家公司并非唯一这样做的机构。财富500强企业的品牌营销员、数字广告上以及各种各样的分析公司,都在通过分析社交媒体和公开贴文寻找影响消费者的更好机会。初步研究显示,针对消费者性格推出的广告,在Facebook上获得点击率高达63%。

如果你在Facebook或Twitter上非常活跃,你的社交媒体资料可能泄露你的很多信息,这些信息可被广告商利用。美国宾夕法尼亚大学计算机科学教授莱尔·昂加尔(Lyle Ungar)利用他的职业发展统计和机器学习方法从文本中提取洞见,重点关注你的Facebook和Twitter贴文,特别是与你的健康和福祉有关的内容。

经过对你社交媒体行为进行数年研究,昂加尔及其团队可以对你做出以下五项推测:

1.年龄和性别

女性来自金星,男性来自火星。当你分析男女在社交媒体上使用的语言时,这种区别就更加明显。女性更多使用情绪词汇、第一人称,更多提及心理和社交过程。而男性大量使用脏话和游戏术语,他们的占有欲更强,比如总会加上“我的妻子”、“我的女友”,女性则只使用丈夫或男友。

e26661b8f0a44a7697f2095d409a2e7320170329083645.png

在自我表达过程中,男女在年龄方面的差异也很大。即使使用类似短语,也可以看出你是否足够“成熟”。昂加尔及其团队在MyPersonality项目中分析了7.5万份Facebook资料,才得出上诉结论。如果你觉得好奇,可以在昂加尔的网站(http://www.wwbp.org/agegender.html)上尝试下年龄或性别预测,看看其预测模型是否足够准确。

6041ec8b7f7f485da4af998cc20770f920170329083645.png

2.性格特征

麦尔斯-布瑞格斯性格类型指标(Myers-Briggs)可能很受欢迎,开放性、尽责性、外向性、宜人性以及神经质等五大性格特征,在预测中表现出更高的预测价值。但性格特征毕竟不是实物,你不可能精确到小数点后多少位。在好的情况下,在进行实际预测时,研究人员会发现“弱阳性”和“负相关性”。

de83f89f81e54e21bb456c63e69f1fbb20170329083645.png

如果你想知道自己在神经质测试中得分多少,IPIP-300是可用到的更全面测试之一。你也可以使用昂加尔的社交媒体资料分析法。除了年龄和性别,性格特征在我们的语言表达中也截然不同。显然,外向性的人等不及参加派对,而内向性的人多沉迷于动漫、互联网以及游戏等。

即使个人资料中的照片选择,也会泄露我们的性格特征。性格非常开放的人更有可能选择艺术性和非正统性照片,而且这些照片都不是他们自己的面孔。他们也有更好的审美感,选择对比对、清晰度以及饱和度更高的照片。而尽责性的人则会做出相反的选择,他们通常张贴自己的正面照,而且只有脸部。外向性的人倾向于张贴自己与其他人的合影。

3.职业

72211189fff34d98b2944a190a22e5ca20170329083645.png

如果你没有与职业社交网站LinkedIn上的人联系,你可能不会去看他们的资料和当前职位。事实证明,他们在Twitter上的公开发言也可能隐秘地揭示这个信息。这并不令人感到惊讶。高管们通常会写有关商业或金融新闻方面的东西,而低级职员会用更多时间讨论个人兴趣爱好,而非与工作相关的主题。昂加尔的同事丹尼尔·彼得洛(Daniel Preotiuc-Pietro)及其团队能够通过分析Twitter上的用语,非常准确地分析出某人的职业。

4.自恋与精神变态者

cdc31b45a53a42d0b5c06c15ff059a7b20170329083645.jpg

通过社交媒体语言,你还可以发现令人毛骨悚然的东西。自恋者追求声望、地位以及其他人的艳羡,而精神变态者缺乏悔念、敏感性,对道德毫不关心。喜好权谋的人故意操纵和利用其他人实现自己的目标。这些人类行为的阴暗面可被合并称为“黑暗三弦”。正如预期的那样,精神变态者更多使用攻击性和暴力语言,比如杀戮、愤怒以及其他负面情绪用语。权谋者大量使用垃圾邮件和广告贴文。行为分析也可发现这些性格特征。自恋者更有可能发布涉及地理位置的推文,不太可能发布重复性贴文或标签,这显示他们对推文进行了精心策划。

5.死于心脏病的可能性

31cd09927efb4635b5b7059b0615957420170329083645.png

在2015年研究论文中,昂加尔及其团队描述了一种模式,只使用Twitter上的数据就能预测心脏病的死亡率,甚至比其他传统因素(包括人口、社会经济)与健康危险因素(比如吸烟、糖尿病、高血压以及肥胖)相结合的方法更准确。在人际关系恶劣和慢性压力下,心脏病会加重。昂加尔及其团队追踪反映负面社会交往、负面情绪(比如愤怒)以及脱离社会的语言,这些标志都是心血管疾病死亡的更精确预兆。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-07-24 16:26:35
市场情报 亚马逊云科技人工智能与机器学习技术助力科学家绘制完整的脑部地图
艾伦研究所数据和技术主管Shoaib Mufti带领团队与亚马逊云科技合作,将利用这张脑图创建全球大的脑细胞开源数据库。这是人类首次对关于哺乳动物大脑结构和功能的大规模数据 <详情>
2022-12-06 11:10:00
云资讯 亚马逊云科技推出八项Amazon SageMaker全新功能
2022年12月5日 ,亚马逊云科技在2022 re:Invent全球大会上宣布,为端到端机器学习服务Amazon SageMaker 推出八项新功能。 <详情>
2022-09-05 11:47:04
云资讯 亚马逊云科技推动AI/ML创新三大驱动力 加速人工智能与机器学习的规模化落地
亚马逊云科技通过三大AI/ML创新驱动力——处理海量多样化数据、加速推动产业规模化落地以及赋能更多AI开发者,加速推动各行业创新。 <详情>
2022-05-11 11:18:03
云资讯 亚马逊云科技:在云中打造统一数据基础底座是企业实现数智融合有效途径
数据与智能的统一和融合,意味着数据构建和实施项目更加高效,数据在两者之间能够无缝流转,企业可以快速具备相关能力,推动自身数字化转型迈向新的高度。 <详情>
2021-11-11 17:53:00
市场情报 NVIDIA Omniverse Replicator 为机器人生成合成训练数据
如要提高具有挑战性的AI计算机视觉应用的性能,就需要使用大型、多样化的数据集来复制目标域的内在分布。 <详情>