基于本體詞庫的商品評論屬性詞抽取方法
基本信息
申請?zhí)?/td> | CN201510138316.1 | 申請日 | - |
公開(公告)號 | CN104715049B | 公開(公告)日 | 2017-11-28 |
申請公布號 | CN104715049B | 申請公布日 | 2017-11-28 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 馬睿;周曉鋒;潘福成 | 申請(專利權(quán))人 | 無錫中科泛在信息技術(shù)研發(fā)中心有限公司 |
代理機構(gòu) | 無錫市大為專利商標事務(wù)所(普通合伙) | 代理人 | 殷紅梅;劉品超 |
地址 | 214135 江蘇省無錫市新區(qū)菱湖大道200號中國傳感網(wǎng)國際創(chuàng)新園C座 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于本體詞庫的商品評論屬性詞抽取方法,包括下述步驟:步驟1,對評論文本預(yù)處理:首先將每條評論文本分割為不同的子句;其次,對每條評論的各個子句,結(jié)合屬性詞本體詞庫,進行分詞,然后進行詞性標注,去停用詞,接著在子句中搜索名詞作為該條評論的屬性詞候選集;步驟2,對屬性詞候選集中的屬性詞進行歸類:步驟3,在各個屬性詞候選集中,合并屬性詞的同義詞類:步驟4,經(jīng)過對屬性詞候選集中的合并操作之后,將每個同義詞類的中心詞認定為屬性詞候選集對應(yīng)的子句的屬性詞。本發(fā)明相比于傳統(tǒng)的文本處理提取屬性詞的方法效率更高。 |
