一種基于音頻內(nèi)容檢索的多媒體資源檢索方法

基本信息

申請(qǐng)?zhí)?/td> CN200810062073.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN100565532C 公開(kāi)(公告)日 2009-12-02
申請(qǐng)公布號(hào) CN100565532C 申請(qǐng)公布日 2009-12-02
分類(lèi)號(hào) G06F17/30(2006.01)I;G10L15/08(2006.01)I;G10L15/14(2006.01)I;G10L15/02(2006.01)I;G10L15/06(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 葉睿智 申請(qǐng)(專(zhuān)利權(quán))人 杭州微著網(wǎng)絡(luò)有限公司
代理機(jī)構(gòu) 杭州求是專(zhuān)利事務(wù)所有限公司 代理人 葉睿智;杭州微著網(wǎng)絡(luò)有限公司
地址 310013浙江省杭州市西湖區(qū)西溪路525號(hào)浙江大學(xué)科技園A東326室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于音頻內(nèi)容檢索的多媒體資源檢索方法。包括如下步驟:1)預(yù)處理服務(wù)器將視頻和音頻轉(zhuǎn)化為標(biāo)準(zhǔn)的待識(shí)別語(yǔ)音;2)語(yǔ)音識(shí)別服務(wù)器將訓(xùn)練語(yǔ)料訓(xùn)練成聲學(xué)模型,并將待識(shí)別語(yǔ)音和聲學(xué)模型匹配得到語(yǔ)意文本索引;3)索引服務(wù)器存儲(chǔ)和組織關(guān)鍵詞索引,并匹配檢索條件得到檢索結(jié)果。本發(fā)明利用音頻中關(guān)鍵詞檢出技術(shù),獲得了音視頻資源內(nèi)在的語(yǔ)意信息,對(duì)文本化的語(yǔ)意信息進(jìn)行索引,提供了更全面可靠的音視頻資源信息索引,可以讓檢索系統(tǒng)更準(zhǔn)確的匹配到多媒體資源,并且定位到檢索詞在音視頻中出現(xiàn)的精確位置。