贝尔实验室和周公“掰手腕”:AI算法解梦成为现实

本小妞迷上赌 提交于 2020-10-16 12:59:45

  

  作者 | 青 暮、蒋宝尚

  编辑 | 青 暮

  

几百年前的爱尔兰。有一对夫妻,他们彼此相爱。丈夫的头发是浅棕红色的、卷曲的,妻子也是卷发。他们是牧羊人,靠用绵羊毛织布来谋生。妻子甚至把还在羊背上的羊毛直接织成了布。这个冬季对于绵羊而言非常温暖,因为新的羊毛从紧贴皮肤的编织羊毛下生长出来了。然后,出现了几个富人,抢走了他们的土地,还砍断了男人的腿。

  上述文字描述了一位三十岁女艺术家的梦境,对于这个梦境报告,下图给出了评估结果。结果显示,这个梦境的属性是想象的、负面情绪的、男性特征的,以及有攻击性的,并被归类为噩梦(红色)。

  

  你可能会以为这是一个解梦师给出的判断,但实际上,为女艺术家解梦的,是一个AI算法。

  最近,在一篇发表于《皇家社会科学学会》期刊上的研究中,来自诺基亚贝尔实验室(Nokia Bell Labs)和罗马大学的三位研究员合力 使用AI算法分析了数千个梦,表示AI可以识别并量化梦的特征,特征之间的相互关系,以及梦境反映的情绪,从而帮助心理学家快速识别患者中潜在的压力源和心理健康问题。

  

  这篇文章在Science网站上也有推荐

  例如,一位十几岁的女孩Izzy描述她的梦境:“我当时在家里,那愚蠢的《Looney Tunes》节目中可怕的红色怪物正四处走动。”

  用AI给出的判断是负面情绪的、有攻击性的,并归类为噩梦,如下图所示。结合Izzy的年龄,这个梦境很可能是她青春期焦虑的一种表现,反映了她日常的焦虑情绪。

  

  1

  梦境解读基础:连续性假说

  在历史上,人们一直试图从梦中提取隐藏的意义。古巴比伦人相信梦境包含了预言,而古埃及人则将其视为神灵传达的信息。1890年代,西格蒙德·弗洛伊德为梦境中的人物、物体和场景赋予了象征意义。

  今天,大多数心理学家都支持“连续性假说”(continuity hypothesis),认为梦是清醒生活的延续。在文章开头的梦境中,我们也能看到,女艺术家的梦境反映了审美概念。确实,许多研究表明,梦通常反映了日常生活,可以充当夜间治疗师,帮助人们处理心事,并为现实生活中的问题做准备。

  诺基亚贝尔实验室的计算社会科学家、该研究的合著者Luca Maria Aiello说: “如果我们能够从规模上更好地理解梦境,或许未来也可以量身定制改善清醒生活的技术。”

  

  但是,对于心理学家而言,梦境分析是一项耗时的任务,他们必须将梦境日记提取为组成部分并搜索主题和模式。为了加快这一过程,Aiello和同事建立了一种算法, 该算法自动分析了DreamBank.net整理的24,000多个梦境报告。

  使用在心理学常用的编码系统,该算法为每个梦境计算出一系列分数:例如,人物的平均攻击性,或负面情绪与正面情绪的比率。 当研究人员将算法计算出的分数与心理学家计算出的分数进行比较时,发现匹配率高达76%。

  研究人员说,该系统可以帮助心理学家快速识别异常梦,异常梦可能预示着压力源或潜在的心理健康问题。通过将每个梦境的得分与没有身体或精神疾病报告的人的梦境得分的平均值进行比较,该算法可以识别出异常梦。

  该算法还使研究人员能够根据性别、年龄或精神病状况分析梦境的差异。Izzy拥有长达13年的梦境日记,在她青春期最初的这段时间里,经常会出现负面情绪,而这段时间的情绪通常与社交焦虑有关。

  

当我到达学校时,Samantha和我见面。她给了我一些我在书包里发现的纸,一张纸写着我对Dylan Moran的爱,而另一张纸则写着我对Daryl、Eugene、Dmitri和Darius的爱。我真的很害怕,我告诉她不要告诉任何人。她正在和Payton说话,我非常担心。

  这个也是Izzy的梦境,AI判断这个梦境是男性特征的、象征友情的、部分女性特征的,以及负面情绪的,但耐人寻味的是,AI还将其归类为美梦。

  

  类似地,被诊断为创伤后应激障碍的越南战争退伍军人的梦境报告的攻击性高于平均水平。

  

作为越南战争的见证者,我认为战争总是离我不远。我躺在双层床上,整理某人的物品。这个人显然已经死了,他收集了一些邮票。我翻阅一本小专辑时,看到了我小时候收集的许多美国航空邮票。突然,附近的一个人被枪击并倒下。我看到子弹飞过,射向他附近的泥水。两位身穿红色和白色条纹连衣裙的护士向他伸出援手,完全背对着敌人。他们的英勇或愚蠢使我惊讶,一名护士照料了那名受了致命伤的男子。

  这位越南战争退伍军人的梦境明显带有攻击性特征,AI将其判断为想象的、负面情绪的,以及攻击性的,并归类为噩梦。

  

  “梦境不仅告诉我们当天的经历,而且还告诉我们自己是谁”,Aiello说,梦境报告中的模式倾向于反映日常生活中的模式,从而支持连续性假设。

  哈佛大学的睡眠精神病学家Robert Stickgold表示,这项研究是对梦境使用自动文本分析的一个“很好的例子”。但他告诫说,不同人群之间梦境的明显差异实际上可能源于报告差异。例如,女人在梦中不一定会比男人经历更多的情绪,但她们可能会使用更多充满情绪的词语来描述梦境。Stickgold说:“我们对梦境报告之间的差距估计可能要更加保守。”

  他还指出,在不了解梦者的情况下,很难将梦境与清醒生活联系起来。Aiello表示同意,而且他不认为他的算法会很快使治疗师失业。他说:“我认为这个算法为梦境科学家扩大研究规模提供了非常有价值的支持。这并不意味着专家将没有更准确的方法来评估梦境。”

  相较于普通人积极向上的中产美梦,一个平静的下午对于这位越南战争退伍军人而言已属难得。

  

我正在乡下与我心爱的狗Rusty同行。和往常一样,我没有给她套上项圈,她很快乐,尽管有点紧张。我们继续步行,到达一个富裕的居民区。那里既安全又安静,周围绿树成荫。我穿蓝色牛仔裤,安心地走路。Rusty按照她的习惯在嬉戏。我们到达一家关闭的商店。我宠爱她,她将胳膊放在我的身上。我感到有一种强烈的幸福感。实际上,爱的感觉是我长期以来最深刻的感受。

  可惜的是,AI正确地将其归类为美梦,但只发现了“动物”的特征。目前AI只能以关键词标注来判断梦境特征,而不能理解其背后的“故事”。

  

  Aiello希望有一天以移动APP的形式从更大规模的梦境报告中提供即时的算法见解。这将有助于增加数据集,并使研究人员更容易得出结论。他说,但梦者本人也可能会因此受益。“这对于更好地了解自己的生活和心理可能会很有用。”

  2

  五个假设说明现实与梦境的关系

  

  前面也提到,这项研究在近期发表于《皇家社会科学学会》期刊上,由诺基亚贝尔实验室(Nokia Bell Labs)和罗马大学的三位研究员合力完成。

  在论文中,作者设计一种新的自然语言处理算法,并利用该算法自动分析了 DreamBank.net 数据库中的 24000 多个梦境。

  具体而言, 该算法能够将梦境中的语言分解为更小的片段,把段落化为字句,而后制出树形图,通过一定的语法规则帮助人们理解梦境中字句之间的关系。这种算法还可将逐个单词,单词之间的相互关系划分归类,并将其与积极或消极的情感相联系。

  在具体算法设计过程中,作者研究了五个因素:1、性别差异;2、处在青春期的年轻人;3、战争;4、失明;5、日常暴力。然后根据这五个因素给出了五个假设,整篇论文的工作都是在用AI论证这五个假设:

  在性别差异因素探究中,作者引用了之前文化和心理学领域的研究结论,即女性的攻击行为比男性的攻击行为更温和;女性的情绪表达能力比男性的也更强。因此,根据连续性假设,作者得出假设:女性的梦境更加感性,且“攻击”程度有限。

  在青春期因素中,作者考虑到青年的情绪稳定性,与父母的冲突以及社会焦虑等因素,作者做出假设:青少年的梦境以消极情绪为特征。

  在战争因素中,作者的考察对象是从战场中返回的军人,因此做出假设:退伍军人的梦境是以消极情绪和攻击性为特征的。这个假设在越战老兵身上得到了验证,毕竟那群老兵的梦境经常与内疚和暴力相关。

  盲人由于看不见,其嗅觉会增强,另外其想象的色彩比一般人要丰富,因此作者给出假设:盲人的梦境大多和虚构的人物以及现实中的照顾者息息相关。

  在日常暴力因素中,作者研究的对象是美国,因为美国的暴力犯罪水平在20世纪60年代相当可观,经过调查得出假设:经历过“社会动荡时期”的人,其梦境以攻击性为特征。这个假设通过调查9.11恐怖袭击得到了验证。

  3

  基于成分的NLP分析

  作者在论文中采用的是霍尔和范德卡斯尔梦境编码系统,这一系统是从《梦的内容分析(The content analysis of dreams)》中提取出来,霍尔和范德卡斯尔系统一共将梦境分为了10个类别:

  1、人物:人物、动物或者其他特征

  2、互动:人物之间的社交互动(如接吻)

  3、情绪:人物经历的情绪或表示某种情况的情绪(如悲伤);

  4、活动:角色执行的身体动作和感官体验(例如嗅觉);

  5、奋斗:主人公的成功或失败;

  6、(失误)命运:由于主人公的行为,导致了主人公身上发生了幸运和不幸;

  7、设置和对象:场景中存在的物理环境或对象(例如户外、武器);

  8、描述性要素:物体、人物和动作的属性和质量(如颜色、大小、速度);

  9、食物和进食:食物的存在或进食行为;

  10、来自过去的元素:和主人公过去有联系的人物或元素(例如年轻的自己);

  当然,以上10个元素并不是同等重要,其中有三类:人物、社会互动和情绪是最有价值的。因为这三个因素包含了:谁在场,有哪些行动,表达了哪些情感等信息。作者也将重点放在根据反映这三个类别的衡量标准对每个梦境报告进行编码。编码结果如下:

  

  有了上述三个指标,作者然后设计算法分析名为“梦库(Dream Bank)”的大型公共梦境报告数据库中的24000份梦境报告(DreamBank是一个由经过验证的研究收集的梦的公共数据库)。

  

  算法工具在梦的报道例子中的应用。

  整个算法的分析过程为:1、通过构建动词(VBD)和名词(NN,NNP)树来解析梦境。然后使用两个外部知识库,使得算法能够识别名词中的人物、动物和虚构人物;3、根据人物的性别、是否死亡以及是否虚构对人物进行分类;4、识别表示友好、攻击性和性互动的动词;5、根据每个动词的两个行为者(动词前的名词和动词后的名词)可识别与否,确定每个动词是否反映“互动”场景;;6、以及使用Emolex识别正面和负面情感词。

  在具体的自然语言技术上,该算法主要基于成分的分析。即将梦境报告文本进行分解解成部分,然后可以独立地对其进行分析。这里的成分指的是:作为连贯单位表现的词组,它们要么属于短语类别(例如名词短语、动词短语),要么属于词汇类别(例如名词、动词、形容词、连词、副词)。

  随后将“组成成分”被反复分割成单个词水平的“子组成成分”。这个过程的结果是一棵解析树,即一个树状图,树的根是初始句子,结点是成分和子成分,叶子是单个单词。

  成分被迭代地拆分为子成分,向下延伸到单个单词的级别。该过程的结果是语法分析树,即树状图,其根是初始句子,边是反映英语语法结构的产生式规则(例如,根据主谓划分拆分完整的句子),节点是成分和子成分,而叶子是单独的单词。

  在所有公开可用的基于成分的分析技术中,作者的算法结合了来自Python NLTK 工具包的StanfordParser(这是一个基于概率上下文无关文法的解析器)。该工具输出解析树,并用相应的词汇或短语类别注释节点和叶子。

  在构建树之后,通过应用NLTK中的形态函数Morphy,该工具将树叶中包含的所有单词转换为相应的词条(例如,它将“dreaming” 转换成 “dream”)。

  Via

  https://www.sciencemag.org/news/2020/08/new-algorithm-can-find-hidden-patterns-your-dreams

  https://royalsocietypublishing.org/doi/pdf/10.1098/rsos.192080

  http://www.social-dynamics.net/dreams/

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!