在以前做過的一個C#項目中,當時有個需求就是按頁提取word文檔的內容,后來這個需求用不到了,但是從中間摸索出來了一些方法。現在作出的這個程序,對于.doc、.docx、格式word文件,基本都上能夠讀取,也碰到過特殊文件不能讀取的情況,幾率很小。
要想操作word文檔,在C#中需要引入?Microsoft.Office.Interop.Word.dll, 這個在vs2010中添加引用時直接就就可以找得到,本程序中使用的版本是14.0.0.0.。
直接使用會報錯誤 無法嵌入互操作類型 :
將dll文件的屬性 “ 互操作類型”改為false即可解決錯誤。
程序代碼如下:
1
///
<summary>
2
///
按頁號得到word文件的內容
3
///
</summary>
4
///
<param name="filepath">
文件路徑
</param>
5
///
<param name="pageNum">
頁號
</param>
6
public
string
getWordContentByPage(
string
filepath,
int
pageNum)
7
{
8
9
FileInfo f =
new
FileInfo(filepath);
10
if
(!
f.Exists)
11
{
12
return
null
;
13
}
14
string
file_name =
f.Name;
15
string
file_path =
f.FullName;
16
int
pageCount =
0
;
17
18
Microsoft.Office.Interop.Word.Document doc =
null
;
19
20
Microsoft.Office.Interop.Word.ApplicationClass app =
new
Microsoft.Office.Interop.Word.ApplicationClass();
21
22
object
missing =
System.Reflection.Missing.Value;
23
object
FileName =
file_path;
24
25
object
readOnly =
true
;
26
object
isVisible =
false
;
27
28
try
29
{
30
//
打開文檔。為什么這么多貌似無用的參數,額,這個我也不知道。。。
31
doc = app.Documents.Open(
ref
FileName,
ref
missing,
ref
readOnly,
32
ref
missing,
ref
missing,
ref
missing,
ref
missing,
ref
missing,
33
ref
missing,
ref
missing,
ref
missing,
ref
isVisible,
ref
missing,
34
ref
missing,
ref
missing,
ref
missing);
35
36
Microsoft.Office.Interop.Word.WdStatistic stat =
Microsoft.Office.Interop.Word.WdStatistic.wdStatisticPages;
37
38
pageCount = doc.ComputeStatistics(stat,
ref
missing);
//
得到文檔總頁數
39
40
object
What =
Microsoft.Office.Interop.Word.WdGoToItem.wdGoToPage;
41
object
Which =
Microsoft.Office.Interop.Word.WdGoToDirection.wdGoToNext;
42
object
page = pageNum +
""
;
//
頁數
43
44
//
ran1 指到要讀頁數頁尾
45
Microsoft.Office.Interop.Word.Range ran1 = doc.GoTo(
ref
What,
ref
Which,
ref
page,
ref
missing);
46
47
//
rand2 為 rand1 的上一頁,如果 rand1是首頁的話也無妨,這樣rand2指向文檔頭部第一個插入位置
48
Microsoft.Office.Interop.Word.Range ran2 =
ran1.GoToPrevious(Microsoft.Office.Interop.Word.WdGoToItem.wdGoToPage);
49
50
object
objStart = ran2.End;
//
頁首,
51
52
object
objEnd = ran1.Start;
//
頁尾
53
54
//
如果是最后頁則只指定從頁首開始讀取,頁尾值忽略
55
if
(page.Equals(
""
+
pageCount))
56
{
57
objStart =
ran1.Start;
58
objEnd =
missing;
59
}
60
61
Microsoft.Office.Interop.Word.Range r3 = doc.Range(
ref
objStart,
ref
objEnd);
62
String content = r3.Text;
//
此時就已經得到了當前頁面的文本內容
63
64
object
saveOption =
Microsoft.Office.Interop.Word.WdSaveOptions.wdDoNotSaveChanges;
65
//
關閉當前操作文檔
66
doc.Close(
ref
saveOption,
ref
missing,
ref
missing);
67
app.Quit(
ref
saveOption,
ref
missing,
ref
missing);
68
69
return
content;
70
}
71
catch
(Exception ex)
72
{
73
throw
ex;
74
}
75
}
?
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061
微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元

