大規(guī)模知識(shí)圖譜本體自動(dòng)抽取方法、終端設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110380611.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113127645A | 公開(kāi)(公告)日 | 2021-07-16 |
申請(qǐng)公布號(hào) | CN113127645A | 申請(qǐng)公布日 | 2021-07-16 |
分類號(hào) | G06F16/36(2019.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 洪萬(wàn)福;張林娜 | 申請(qǐng)(專利權(quán))人 | 廈門淵亭信息科技有限公司 |
代理機(jī)構(gòu) | 廈門市精誠(chéng)新創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 何家富 |
地址 | 361000福建省廈門市軟件園二期望海路61號(hào)801單元N8-01 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及大規(guī)模知識(shí)圖譜本體自動(dòng)抽取方法、終端設(shè)備及存儲(chǔ)介質(zhì),該方法中包括:S1:從知識(shí)圖譜中獲取實(shí)體;S2:采用規(guī)則匹配算法對(duì)提取的實(shí)體進(jìn)行初步分類;S3:采用命名實(shí)體識(shí)別模型對(duì)步驟S2中未分類的實(shí)體進(jìn)行命名實(shí)體識(shí)別,并確認(rèn)識(shí)別到的命名實(shí)體的類型;S4:針對(duì)步驟S3中命名實(shí)體識(shí)別后的剩余實(shí)體,采用聚類算法進(jìn)行分類;S5:將步驟S2、S3和S4的分類結(jié)果進(jìn)行合并與調(diào)整,得到最終的分類結(jié)果。本發(fā)明創(chuàng)新性地融合多種技術(shù)手段,有效的實(shí)現(xiàn)了工業(yè)界大規(guī)模知識(shí)圖譜的本體自動(dòng)抽取工作,在無(wú)任何人工標(biāo)注數(shù)據(jù)的情況下,仍可實(shí)現(xiàn)對(duì)復(fù)雜、量級(jí)大、臟數(shù)據(jù)多的知識(shí)圖譜進(jìn)行實(shí)體的本體抽取。 |
