一種媒體行業(yè)知識圖譜的構(gòu)建方法
基本信息
申請?zhí)?/td> | CN202110429931.3 | 申請日 | - |
公開(公告)號 | CN112948510A | 公開(公告)日 | 2021-06-11 |
申請公布號 | CN112948510A | 申請公布日 | 2021-06-11 |
分類號 | G06F16/28;G06F40/295 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 孫偉芳;朱立松;黃建杰;張勇 | 申請(專利權(quán))人 | 央視國際網(wǎng)絡(luò)無錫有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 214000 江蘇省無錫市新區(qū)震澤路18號無錫(國家)軟件園金牛座D棟3、5、6樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明是媒體行業(yè)知識圖譜的構(gòu)建方法,包括:1)對媒體數(shù)據(jù)進(jìn)行預(yù)處理,包括中文單句拆分和組合;2)采用自然語言處理方法,挖掘出有效實(shí)體和關(guān)系,按照SPO三元組的模式進(jìn)行三元組建模;3)將建模的三元組存入媒體知識圖譜中;4)基于挖掘出來的實(shí)體,從現(xiàn)有通用知識圖譜中匹配抓取新聞娛樂領(lǐng)域數(shù)據(jù),填補(bǔ)到媒體知識圖譜中。本發(fā)明的優(yōu)點(diǎn):(1)本發(fā)明構(gòu)建的媒體知識圖譜的數(shù)據(jù)更豐富且更符合媒體行業(yè)的業(yè)務(wù)需求;(2)將NLP聯(lián)合提取關(guān)系的模型引入到本發(fā)明媒體知識圖譜的構(gòu)件中,大大簡化了工作的雜度,模型性能優(yōu);(3)構(gòu)建的媒體知識圖譜作為基礎(chǔ)數(shù)據(jù),可為媒體行業(yè)及企業(yè)發(fā)展提供一個大數(shù)據(jù)分析平臺,數(shù)據(jù)更全面,關(guān)系更清晰。 |
