一種基于音頻內(nèi)容檢索的多媒體資源檢索方法
基本信息
申請(qǐng)?zhí)?/td> | CN200810062073.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN100565532C | 公開(kāi)(公告)日 | 2009-12-02 |
申請(qǐng)公布號(hào) | CN100565532C | 申請(qǐng)公布日 | 2009-12-02 |
分類(lèi)號(hào) | G06F17/30(2006.01)I;G10L15/08(2006.01)I;G10L15/14(2006.01)I;G10L15/02(2006.01)I;G10L15/06(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 葉睿智 | 申請(qǐng)(專(zhuān)利權(quán))人 | 杭州微著網(wǎng)絡(luò)有限公司 |
代理機(jī)構(gòu) | 杭州求是專(zhuān)利事務(wù)所有限公司 | 代理人 | 葉睿智;杭州微著網(wǎng)絡(luò)有限公司 |
地址 | 310013浙江省杭州市西湖區(qū)西溪路525號(hào)浙江大學(xué)科技園A東326室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于音頻內(nèi)容檢索的多媒體資源檢索方法。包括如下步驟:1)預(yù)處理服務(wù)器將視頻和音頻轉(zhuǎn)化為標(biāo)準(zhǔn)的待識(shí)別語(yǔ)音;2)語(yǔ)音識(shí)別服務(wù)器將訓(xùn)練語(yǔ)料訓(xùn)練成聲學(xué)模型,并將待識(shí)別語(yǔ)音和聲學(xué)模型匹配得到語(yǔ)意文本索引;3)索引服務(wù)器存儲(chǔ)和組織關(guān)鍵詞索引,并匹配檢索條件得到檢索結(jié)果。本發(fā)明利用音頻中關(guān)鍵詞檢出技術(shù),獲得了音視頻資源內(nèi)在的語(yǔ)意信息,對(duì)文本化的語(yǔ)意信息進(jìn)行索引,提供了更全面可靠的音視頻資源信息索引,可以讓檢索系統(tǒng)更準(zhǔn)確的匹配到多媒體資源,并且定位到檢索詞在音視頻中出現(xiàn)的精確位置。 |
