一種面向簡(jiǎn)譜圖像的音高及對(duì)應(yīng)歌詞提取方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202010036491.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111274891A 公開(kāi)(公告)日 2020-06-12
申請(qǐng)公布號(hào) CN111274891A 申請(qǐng)公布日 2020-06-12
分類號(hào) G06K9/00(2006.01)I 分類 -
發(fā)明人 尹學(xué)淵;祁松茂;江天宇 申請(qǐng)(專利權(quán))人 成都嗨翻屋科技有限公司
代理機(jī)構(gòu) 成都睿道專利代理事務(wù)所(普通合伙) 代理人 成都嗨翻屋科技有限公司
地址 610041四川省成都市高新區(qū)益州大道中段722號(hào)1幢1單元12層1201號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種面向簡(jiǎn)譜圖像的音高及對(duì)應(yīng)歌詞提取方法及系統(tǒng),系統(tǒng)應(yīng)用該方法,方法包括:將待識(shí)別的簡(jiǎn)譜圖像轉(zhuǎn)化為灰度圖,并進(jìn)行矯正;將處理后的簡(jiǎn)譜圖像輸入訓(xùn)練好的字符識(shí)別模型,識(shí)別得到簡(jiǎn)譜圖像的字符及字符的位置信息的集合;根據(jù)字符的位置信息對(duì)字符進(jìn)行排序分行,得到每行字符的字符集合;根據(jù)字符集合進(jìn)行字符篩選,篩除無(wú)關(guān)信息,并將多個(gè)字符行的集合分為音高行和歌詞行兩個(gè)集合;將歌詞行內(nèi)的字符逐一與音高行內(nèi)的字符進(jìn)行距離計(jì)算;根據(jù)計(jì)算得到的距離以及單個(gè)字符的位置信息對(duì)音高字符和歌詞字符進(jìn)行匹配;從簡(jiǎn)譜圖像中剪切出音高字符圖像;分析剪切圖像中浮點(diǎn)的存在性及位置占比,判斷音高;更新歌詞與對(duì)應(yīng)音高的匹配結(jié)果。??