一種基于音頻內(nèi)容檢索的多媒體資源檢索方法

基本信息

申請?zhí)?/td> CN200810062073.8 申請日 -
公開(公告)號 CN101281534A 公開(公告)日 2008-10-08
申請公布號 CN101281534A 申請公布日 2008-10-08
分類號 G06F17/30(2006.01);G10L15/08(2006.01);G10L15/14(2006.01);G10L15/02(2006.01);G10L15/06(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 葉睿智 申請(專利權(quán))人 杭州微著網(wǎng)絡(luò)有限公司
代理機(jī)構(gòu) 杭州求是專利事務(wù)所有限公司 代理人 葉睿智;杭州微著網(wǎng)絡(luò)有限公司
地址 310013浙江省杭州市西湖區(qū)西溪路525號浙江大學(xué)科技園A東326室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于音頻內(nèi)容檢索的多媒體資源檢索方法。包括如下步驟:1)預(yù)處理服務(wù)器將視頻和音頻轉(zhuǎn)化為標(biāo)準(zhǔn)的待識別語音;2)語音識別服務(wù)器將訓(xùn)練語料訓(xùn)練成聲學(xué)模型,并將待識別語音和聲學(xué)模型匹配得到語意文本索引;3)索引服務(wù)器存儲和組織關(guān)鍵詞索引,并匹配檢索條件得到檢索結(jié)果。本發(fā)明利用音頻中關(guān)鍵詞檢出技術(shù),獲得了音視頻資源內(nèi)在的語意信息,對文本化的語意信息進(jìn)行索引,提供了更全面可靠的音視頻資源信息索引,可以讓檢索系統(tǒng)更準(zhǔn)確的匹配到多媒體資源,并且定位到檢索詞在音視頻中出現(xiàn)的精確位置。