直播平臺語音收集方法、系統(tǒng)及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202010066065.1 | 申請日 | - |
公開(公告)號 | CN111625614A | 公開(公告)日 | 2020-09-04 |
申請公布號 | CN111625614A | 申請公布日 | 2020-09-04 |
分類號 | G06F16/31(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 寧思喬;劉德友 | 申請(專利權(quán))人 | 全息空間(深圳)智能科技有限公司 |
代理機構(gòu) | 北京挺立專利事務(wù)所(普通合伙) | 代理人 | 全息空間(深圳)智能科技有限公司 |
地址 | 518000廣東省深圳市福田區(qū)梅林街道北環(huán)大道7014號深華運輸大樓301A-02 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種直播平臺語音收集方法、系統(tǒng)及存儲介質(zhì),該語音收集方法包括如下步驟:S1:一種直播平臺語音收集方法,其包括如下步驟:S1:確認用戶身份、收集用戶在直播平臺上操作產(chǎn)生的原始語音文件;S2:對S1所得原始語音文件進行清洗、篩除原始語音文件中的破損文件、形成一次數(shù)據(jù);S3:將S2所得一次數(shù)據(jù)轉(zhuǎn)化為文本文件、并將該文本文件按對應(yīng)用戶ID進行存儲;S4:對S3所得文本文件進行清洗、篩除含有亂碼的文本文件、形成二次數(shù)據(jù);S5:對S4所得二次數(shù)據(jù)進行關(guān)鍵詞抓取、并依據(jù)關(guān)鍵詞進行排序、形成三次數(shù)據(jù)。本發(fā)明能夠能夠?qū)τ脩舢a(chǎn)生的語音數(shù)據(jù)進行篩選、收集和排序、從而實現(xiàn)對用戶更精準的智能服務(wù)推送。?? |
