摘 要
隨著互聯網的快速發展,各類社交媒體平臺如微信、QQ等也與日俱增,而微博更是集成了傳統網站、論壇、博客等的優點,并加上了人與人之間的互動性、關系親密程度等多種智能算法,并以簡練的形式讓數據爆發性的傳播,促進了人與人之間的交流。網民可以通過微博來分享自己的生活,同時抒發自己的喜怒哀樂。因此對微博每天產生的信息量的分析和利用的需求顯得更為迫切。
情感分析,也稱傾向性分析、意見抽取和意見挖掘。主要是通過對帶有情感色彩的主觀性文本進行分析、處理、歸納然后進行推理的過程。而微博,人口基數大,涉及的話題廣泛,對人們的日常生活產生了不可估量的影響,而對微博的情感分析,更是有著十分重要的意義。為此,本文針對了微博文本的情感分析進行了如下幾個工作。
首先,使用微博官方的API對微博進行抓取,進行分類標注。然后,對微博文本進行預處理,主要包括去掉無意義,對微博文本沒有影響的詞語。其次,使用SVM算法對文本進行初步的篩選,主要是去除特別明顯的廣告等無關性的微博。最后使用樸素貝葉斯對微博進行情感分析,將微博分為積極、消極、客觀三類,同時使用AdaBoost算法對樸素貝葉斯算法進行加強。
這些帶有情感信息的微博是非常寶貴的資源,通過情感分析可以獲取網民的此時的心情,對某個事件或事物的看法,可以挖掘其潛在的商業價值,還能對社會的穩定做出一定的貢獻。
關鍵詞:情感分析; AdaBoost; 樸素貝葉斯; 文本分類; 數據挖掘
點擊此處下載文檔和源碼
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
