一種基于音頻內(nèi)容檢索的多媒體資源檢索方法
基本信息
申請?zhí)?/td> | CN200810062073.8 | 申請日 | - |
公開(公告)號 | CN101281534A | 公開(公告)日 | 2008-10-08 |
申請公布號 | CN101281534A | 申請公布日 | 2008-10-08 |
分類號 | G06F17/30(2006.01);G10L15/08(2006.01);G10L15/14(2006.01);G10L15/02(2006.01);G10L15/06(2006.01) | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 葉睿智 | 申請(專利權(quán))人 | 杭州微著網(wǎng)絡(luò)有限公司 |
代理機(jī)構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 葉睿智;杭州微著網(wǎng)絡(luò)有限公司 |
地址 | 310013浙江省杭州市西湖區(qū)西溪路525號浙江大學(xué)科技園A東326室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于音頻內(nèi)容檢索的多媒體資源檢索方法。包括如下步驟:1)預(yù)處理服務(wù)器將視頻和音頻轉(zhuǎn)化為標(biāo)準(zhǔn)的待識別語音;2)語音識別服務(wù)器將訓(xùn)練語料訓(xùn)練成聲學(xué)模型,并將待識別語音和聲學(xué)模型匹配得到語意文本索引;3)索引服務(wù)器存儲和組織關(guān)鍵詞索引,并匹配檢索條件得到檢索結(jié)果。本發(fā)明利用音頻中關(guān)鍵詞檢出技術(shù),獲得了音視頻資源內(nèi)在的語意信息,對文本化的語意信息進(jìn)行索引,提供了更全面可靠的音視頻資源信息索引,可以讓檢索系統(tǒng)更準(zhǔn)確的匹配到多媒體資源,并且定位到檢索詞在音視頻中出現(xiàn)的精確位置。 |
