Twitter可以预测谁会发展出产后抑郁症吗?

                                                                       

Mika Heittola/Shutterstock
来源:Mika Heittola/Shutterstock

社会数据分析的新领域为我们提供了比以往更多的资源来调查社会现象.我最喜欢的社交数据分析新领域应用方式之一是在2013年由Microsoft Research发表的精美研究报告中. [1] .通过分析孕妇的Twitter提要,研究人员可以以80%的准确度预测 一个女人是否会继续发生产后. /p>

他们首先招募了将近400名妇女参加.他们从Twitter收集了数据,包括女性推文的文字,他们的收藏夹和回复.然后他们测量了四种行为:

  • 参与..这包括某人发推文的频率,这些推文中有多少是对其他人的回复以及他们发布了多少链接,转发和问题.
  • 社交网络.在Twitter上,这仅仅是关注的人数和某人的关注者人数.
  • 情感.他们使用工具来分析人们使用的单词的类型,并测量表示幸福,悲伤,焦虑,悲伤等的单词的帖子.
  • 语言样式.深入了解语言细节之后,这些衡量标准着眼于文章,辅助动词,代词和推文中的介词.这些词很有趣,因为它们不具有我们所说的核心含义,但是根据人的情绪,性格或其他特征,它们在人与人之间往往会有所不同.我们也很难控制它们,因为我们大多是在不知不觉中选择它们的.

在建立属性列表后,对妇女进行(PPD)征象监测.尽管所有妇女的行为在怀孕过程中都发生了变化,但继续患PPD的妇女却以不同的方式发生了变化.研究人员建立了利用这些微小差异的计算机模型.然后,这些计算机模型可以查看一个人的Twitter提要,并猜测她是否会继续开发PPD.

仅使用妇女分娩前的数据,她们的模型就可以准确地将妇女分为可能患有PPD的妇女,其准确率约为70%.但是,PPD通常在分娩后一个月左右发展.当研究人员在产后头几周添加了Pem症状开始出现的时,算法变得更好,达到了80%或更高的准确度.

妇女的Twitter行为以什么方式改变?继续发展PPD的女性倾向于减少推文的频率和关注者的数量,以及使用第二人称和第三人称代词("he","they","you")的人数,而这样做的女性则倾向于在所有类别中 not 开发的PPD实际上增加了.

另一方面,发展PPD的女性倾向于提出更多的问题,而没有减少提出问题的女性.

有趣的科学见解是,这些都是PPD的直接表达的精妙线索.这意味着,即使女性试图隐藏自己的潜在病情,至少从算法上来说,她们也不太可能成功地做到这一点.

作为医师的诊断工具,这项技术具有广阔的前景.它是非侵入性的,并且具有如此高的准确性,可能有助于发信号通知哪些新妈妈可能会从额外的监视和中受益.

[1] De Choudhury,Munmun,Scott Counts和Eric Horvitz. “通过社交媒体预测产后情绪和行为的变化." SIGCHI计算系统人为因素会议论文集. ACM,2013年.

                                               
0
订阅评论
提醒
0 评论
内联反馈
查看所有评论