一種物質(zhì)名稱提取方法、裝置及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202010892360.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112183076A | 公開(公告)日 | 2021-01-05 |
申請(qǐng)公布號(hào) | CN112183076A | 申請(qǐng)公布日 | 2021-01-05 |
分類號(hào) | G06F40/258(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 白芳;楊宇星;周杰龍 | 申請(qǐng)(專利權(quán))人 | 北京望石智慧科技有限公司 |
代理機(jī)構(gòu) | 北京三聚陽(yáng)光知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京望石智慧科技有限公司 |
地址 | 100080北京市海淀區(qū)中關(guān)村19號(hào)新中關(guān)大廈B座1708 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種物質(zhì)名稱提取方法、裝置及存儲(chǔ)介質(zhì),其中,方法包括如下步驟:獲取待提取文本文件;確定所述待提取文本文件是否包含預(yù)設(shè)標(biāo)識(shí);當(dāng)所述待提取文本文件包含所述預(yù)設(shè)標(biāo)識(shí),利用預(yù)先訓(xùn)練好的物質(zhì)名稱提取模型對(duì)所述預(yù)設(shè)標(biāo)識(shí)對(duì)應(yīng)的文本內(nèi)容進(jìn)行目標(biāo)物質(zhì)名稱提取。通過(guò)實(shí)施本發(fā)明,根據(jù)預(yù)設(shè)標(biāo)識(shí)查找預(yù)設(shè)標(biāo)識(shí)對(duì)應(yīng)部分的文本內(nèi)容中是否含有物質(zhì)名稱信息,而預(yù)設(shè)標(biāo)識(shí)可以預(yù)先根據(jù)需要設(shè)定,提高了物質(zhì)名稱提取的靈活性,并且,當(dāng)預(yù)設(shè)標(biāo)識(shí)為專利文本中實(shí)施例、步驟等對(duì)應(yīng)的文本內(nèi)容包含詳細(xì)技術(shù)內(nèi)容介紹之類的關(guān)鍵字,在提高物質(zhì)名稱提取的針對(duì)性的同時(shí),不需要對(duì)整篇專利進(jìn)行名稱提取,從而提高物質(zhì)名稱提取的效率。?? |
