直播平臺語音收集方法、系統(tǒng)及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010066065.1 申請日 -
公開(公告)號 CN111625614A 公開(公告)日 2020-09-04
申請公布號 CN111625614A 申請公布日 2020-09-04
分類號 G06F16/31(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 寧思喬;劉德友 申請(專利權(quán))人 全息空間(深圳)智能科技有限公司
代理機構(gòu) 北京挺立專利事務(wù)所(普通合伙) 代理人 全息空間(深圳)智能科技有限公司
地址 518000廣東省深圳市福田區(qū)梅林街道北環(huán)大道7014號深華運輸大樓301A-02
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種直播平臺語音收集方法、系統(tǒng)及存儲介質(zhì),該語音收集方法包括如下步驟:S1:一種直播平臺語音收集方法,其包括如下步驟:S1:確認用戶身份、收集用戶在直播平臺上操作產(chǎn)生的原始語音文件;S2:對S1所得原始語音文件進行清洗、篩除原始語音文件中的破損文件、形成一次數(shù)據(jù);S3:將S2所得一次數(shù)據(jù)轉(zhuǎn)化為文本文件、并將該文本文件按對應(yīng)用戶ID進行存儲;S4:對S3所得文本文件進行清洗、篩除含有亂碼的文本文件、形成二次數(shù)據(jù);S5:對S4所得二次數(shù)據(jù)進行關(guān)鍵詞抓取、并依據(jù)關(guān)鍵詞進行排序、形成三次數(shù)據(jù)。本發(fā)明能夠能夠?qū)τ脩舢a(chǎn)生的語音數(shù)據(jù)進行篩選、收集和排序、從而實現(xiàn)對用戶更精準的智能服務(wù)推送。??