分类:音乐自然语言处理

来自Big Physics
Jinshanw讨论 | 贡献2019年6月28日 (五) 16:04的版本 →‎参考文献


自然语言处理用算法来理解语言,尤其是文字的时间序列。自然地,由于音乐是音符或者和弦的时间序列,自然语言处理技术就可以用于音乐的理解。

研究背景

音乐是如何表达人的思想情感的,有什么特定的表达单位吗,就像语言的词汇?是否可以搞清楚音乐的产生机制然后来编制乐谱呢?更进一步,好听的音乐是否具有一定的物理的和脑科学的基础呢,还是说,仅仅是后天习惯造成的,约定俗成的?

目前,已经有不少这样的工作。例如[1]就用了音符层次的矢量表示加上LSTM来产生音乐和考察音符之间的通过表示矢量反映出来的关系。

技术和进一步研究的问题

从自然语言处理中借过来以字母为基础的矢量表示和语言模型,结合字母ngram表示,来给音乐的基本结构——音符和音程(暂时忽略和弦,或者暂时把多声部当做多个独立声部处理)——一个矢量表示,并且以此为基础来构建生成模型。


参考文献

  1. Allen Huang, Raymond Wu, Deep Learning for Music, arXiv:1606.04930

引用错误:在<references>中以“Briot:MusicLMReview”名字定义的<ref>标签没有在先前的文字中使用。

本分类目前不含有任何页面或媒体文件。