分类:音乐自然语言处理
来自Big Physics
自然语言处理用算法来理解语言,尤其是文字的时间序列。自然地,由于音乐是音符或者和弦的时间序列,自然语言处理技术就可以用于音乐的理解。
研究背景
音乐是如何表达人的思想情感的,有什么特定的表达单位吗,就像语言的词汇?是否可以搞清楚音乐的产生机制然后来编制乐谱呢?更进一步,好听的音乐是否具有一定的物理的和脑科学的基础呢,还是说,仅仅是后天习惯造成的,约定俗成的?
目前,已经有不少这样的工作。例如[1]就用了音符层次的矢量表示加上LSTM来产生音乐和考察音符之间的通过表示矢量反映出来的关系。
技术和进一步研究的问题
从自然语言处理中借过来以字母为基础的矢量表示和语言模型,结合字母ngram表示,来给音乐的基本结构——音符和音程(暂时忽略和弦,或者暂时把多声部当做多个独立声部处理)——一个矢量表示,并且以此为基础来构建生成模型。
参考文献
- ↑ Allen Huang, Raymond Wu, Deep Learning for Music, arXiv:1606.04930
引用错误:在<references>
中以“Briot:MusicLMReview”名字定义的<ref>
标签没有在先前的文字中使用。
本分类目前不含有任何页面或媒体文件。