黄色网页视频 I 影音先锋日日狠狠久久 I 秋霞午夜毛片 I 秋霞一二三区 I 国产成人片无码视频 I 国产 精品 自在自线 I av免费观看网站 I 日本精品久久久久中文字幕5 I 91看视频 I 看全色黄大色黄女片18 I 精品不卡一区 I 亚洲最新精品 I 欧美 激情 在线 I 人妻少妇精品久久 I 国产99视频精品免费专区 I 欧美影院 I 欧美精品在欧美一区二区少妇 I av大片网站 I 国产精品黄色片 I 888久久 I 狠狠干最新 I 看看黄色一级片 I 黄色精品久久 I 三级av在线 I 69色综合 I 国产日韩欧美91 I 亚洲精品偷拍 I 激情小说亚洲图片 I 久久国产视频精品 I 国产综合精品一区二区三区 I 色婷婷国产 I 最新成人av在线 I 国产私拍精品 I 日韩成人影音 I 日日夜夜天天综合

給定一篇文本(新聞),確定其歸屬地(地名)的python工具

系統(tǒng) 1935 0

簡介

有時候需要確定一篇新聞文本的地名,比如

            
              上海市實施了垃圾分類...

            
          

其地名,即歸屬地是上海,本工具就是實現(xiàn)這個功能的。

給定一篇文章,可包含標題和正文(或僅標題,僅正文),確定其 歸屬地 (地名)。

  • 結(jié)果標準:
    • 區(qū)分國內(nèi)國外,
    • 國外到國家名一級
    • 國內(nèi)到省市一級

安裝

  • 使用 python3
            
              $ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .

            
          

使用方法

樣例1

            
              
                import
              
               loc_reg
title 
              
                =
              
              
                '湖南2018年度企業(yè)環(huán)境信用評價公示 39家企業(yè)擬被評“不良”'
              
              
passage 
              
                =
              
              
                '今天,記者從湖南省生態(tài)環(huán)境廳獲悉,我省2018年度企業(yè)環(huán)境信用評價擬定結(jié)果正在長沙市進行公示,擬評定環(huán)境誠信企業(yè)31家、環(huán)境合格企業(yè)1247家、環(huán)境風險企業(yè)121家、環(huán)境不良企業(yè)39家。'
              
              
                print
              
              
                (
              
              loc_reg
              
                .
              
              predict
              
                (
              
              title
              
                ,
              
               passage
              
                )
              
              
                )
              
            
          

結(jié)果為:

            
              
                {
              
              
                '國內(nèi)'
              
              
                :
              
              
                [
              
              
                {
              
              
                '省'
              
              
                :
              
              
                '湖南'
              
              
                ,
              
              
                '市'
              
              
                :
              
              
                '長沙'
              
              
                }
              
              
                ]
              
              
                }
              
            
          

樣例2

            
              passage 
              
                =
              
              
                '近日,布魯塞爾爆發(fā)了大規(guī)模罷工游行,城市服務(wù)、商店、餐飲店均受到影響,原因和歐盟稅收等政策有關(guān)。'
              
              
                print
              
              
                (
              
              loc_reg
              
                .
              
              predict
              
                (
              
              passage
              
                )
              
              
                )
              
            
          

結(jié)果為:

            
              
                {
              
              
                '國外'
              
              
                :
              
              
                [
              
              
                '比利時'
              
              
                ]
              
              
                }
              
            
          

說明

  • 從輿情新聞數(shù)據(jù)中隨機抽取 100 篇自測,正確率 93%。其他類型文本未測試,效果待定。

如果覺得好用,請 follow 我一下 https://github.com/dongrixinyu


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論