一種物質(zhì)名稱提取方法、裝置及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010892360.2 申請日 -
公開(公告)號 CN112183076A 公開(公告)日 2021-01-05
申請公布號 CN112183076A 申請公布日 2021-01-05
分類號 G06F40/258(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 白芳;楊宇星;周杰龍 申請(專利權(quán))人 北京望石智慧科技有限公司
代理機(jī)構(gòu) 北京三聚陽光知識產(chǎn)權(quán)代理有限公司 代理人 北京望石智慧科技有限公司
地址 100080北京市海淀區(qū)中關(guān)村19號新中關(guān)大廈B座1708
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種物質(zhì)名稱提取方法、裝置及存儲介質(zhì),其中,方法包括如下步驟:獲取待提取文本文件;確定所述待提取文本文件是否包含預(yù)設(shè)標(biāo)識;當(dāng)所述待提取文本文件包含所述預(yù)設(shè)標(biāo)識,利用預(yù)先訓(xùn)練好的物質(zhì)名稱提取模型對所述預(yù)設(shè)標(biāo)識對應(yīng)的文本內(nèi)容進(jìn)行目標(biāo)物質(zhì)名稱提取。通過實施本發(fā)明,根據(jù)預(yù)設(shè)標(biāo)識查找預(yù)設(shè)標(biāo)識對應(yīng)部分的文本內(nèi)容中是否含有物質(zhì)名稱信息,而預(yù)設(shè)標(biāo)識可以預(yù)先根據(jù)需要設(shè)定,提高了物質(zhì)名稱提取的靈活性,并且,當(dāng)預(yù)設(shè)標(biāo)識為專利文本中實施例、步驟等對應(yīng)的文本內(nèi)容包含詳細(xì)技術(shù)內(nèi)容介紹之類的關(guān)鍵字,在提高物質(zhì)名稱提取的針對性的同時,不需要對整篇專利進(jìn)行名稱提取,從而提高物質(zhì)名稱提取的效率。??