原文作者:Xinxi Wang and Ye Wang
在歌曲相关因素中,音乐音频内容是非常重要的。在大多数情况下,我们喜欢/不喜欢一首歌,这是因为它的音频内容具有一些特征,例如人声、旋律、节奏、音色、体裁、乐器或歌词。没有听内容,我们对这首歌的质量几乎一无所知,更不用说我们是否喜欢它了。因为音乐内容在很大程度上决定了我们的偏好,所以内容应该能够为推荐提供良好的预测能力。
然而,现有的音乐推荐者对音乐音频内容的依赖往往会产生不尽如人意的推荐效果。它们都遵循两个阶段的方法:提取传统的音频内容特征,如梅尔倒谱系数(MFCC),然后使用这些特征预测用户偏好。然而,传统的音频内容特征不是为音乐推荐或与音乐相关的任务而创建的(例如,MFCC最初用于语音识别)。在发现他们也能描述诸如体裁、音色和旋律等高级音乐概念之后,他们才开始关注音乐推荐。使用这些特性可能会导致推荐性能在以下两个方面下降。1.由于所谓的语义鸿沟,高层概念无法准确描述。2.即使特征描述是准确的,高级的概念对于用户的音乐偏好也可能不是必需的。因此,传统功能可能无法考虑与音乐推荐相关的信息。
我们认为,一种有效的基于内容的音乐推荐方法的关键是一套好的内容特征。人工获取这样的特征是可能的,但费时费力。一个更好的方法是将现有的两阶段方法结合到一个统一的自动化过程中:自动和直接从音频内容中学习特征,以最大限度地提高推荐性能。深度学习技术的最新发展使这种统一的方法成为可能。事实上,人们已经开始使用深度学习来学习其他音乐任务的特征,如音乐流派分类和音乐情感预测,并取得了很好的效果。
基于内容的方法还经常结合协作过滤(CF),根据志同道合的用户的兴趣推荐歌曲。大多数现有的推荐基于CF,因为它具有较高的准确性。然而,由于它仅仅依赖于使用数据,所以当遇到新的歌曲问题时,CF是无能为力的——它不能推荐没有以前使用历史的歌曲。基于内容的方法不会遇到这个问题,因为它们可以根据歌曲的音频内容进行预测,而音频内容通常可供在线商家使用。因此,基于内容的方法可以在新歌场景中拯救CF。由于CF和基于内容的方法利用了不同维度的信息,因此可以将它们组合成一种混合方法,以便更好地进行预测。
因此,我们首先开发了一个基于内容的模型,该模型可以自动同时从音频内容中提取特征并进行个性化推荐。然后我们开发了一种混合方法来结合CF和内容特征。具体而言,本文力求做出以下贡献:
•:基于内容的方法:我们开发了一个基于概率图形模型和深度学习社区提出的深度信任网络(DBN)的基于内容的推荐模型。它将特征学习和推荐相结合。虽然它不依赖于协作过滤,但它在冷启动阶段和热启动阶段都优于依赖于CF的基于内容的基线模型。
•混合方法:为了将CF和音乐内容结合起来,我们将自动学习的音频功能应用于高效的混合模式。实验结果表明,在混合方法中,所学习的特征对CF具有补充作用,并且优于传统的特征。
本文的其余部分安排如下。第二节简要回顾了目前流行的音乐推荐方法,简要介绍了深度信任网络及其在音乐任务中的应用。第3节介绍了我们的基于内容和混合推荐模型,并讨论了在我们的实验中使用的基于基线内容的模型。第4节描述了我们广泛的实验评估。第五部分对本文的工作进行了总结,并对未来的研究方向进行了探讨。
来源:CSDN
作者:yong_ss
链接:https://blog.csdn.net/yong_ss/article/details/104619773