簡介
有時候需要確定一篇新聞文本的地名,比如
上海市實施了垃圾分類...
其地名,即歸屬地是上海,本工具就是實現(xiàn)這個功能的。
給定一篇文章,可包含標(biāo)題和正文(或僅標(biāo)題,僅正文),確定其 歸屬地 (地名)。
-
結(jié)果標(biāo)準(zhǔn):
- 區(qū)分國內(nèi)國外,
- 國外到國家名一級
- 國內(nèi)到省市一級
安裝
- 使用 python3
$ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .
使用方法
樣例1
import
loc_reg
title
=
'湖南2018年度企業(yè)環(huán)境信用評價公示 39家企業(yè)擬被評“不良”'
passage
=
'今天,記者從湖南省生態(tài)環(huán)境廳獲悉,我省2018年度企業(yè)環(huán)境信用評價擬定結(jié)果正在長沙市進(jìn)行公示,擬評定環(huán)境誠信企業(yè)31家、環(huán)境合格企業(yè)1247家、環(huán)境風(fēng)險企業(yè)121家、環(huán)境不良企業(yè)39家。'
print
(
loc_reg
.
predict
(
title
,
passage
)
)
結(jié)果為:
{
'國內(nèi)'
:
[
{
'省'
:
'湖南'
,
'市'
:
'長沙'
}
]
}
樣例2
passage
=
'近日,布魯塞爾爆發(fā)了大規(guī)模罷工游行,城市服務(wù)、商店、餐飲店均受到影響,原因和歐盟稅收等政策有關(guān)。'
print
(
loc_reg
.
predict
(
passage
)
)
結(jié)果為:
{
'國外'
:
[
'比利時'
]
}
說明
- 從輿情新聞數(shù)據(jù)中隨機(jī)抽取 100 篇自測,正確率 93%。其他類型文本未測試,效果待定。
如果覺得好用,請 follow 我一下 https://github.com/dongrixinyu
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
