這是org.apache.poi.xwpf.converter下載,WORD07轉(zhuǎn)HTML所需JAR包,org.apache.poi.xwpf.converter,入口類是HWPFDocument,當前(3.10)版本中參考了org.apache.poi.hwpf.model和org.apache.poi.hwpf.usermodel包中的接口,后期版本中可能會不同的接口。
org.apache.poi.xwpf.converter是XWPFDocument,從這個類中可以獲取段落、圖片、表格、標題等信息。
下載包中的示例比較少,分別在examples下的HWPF和XWPF中;另外,可以從SVN上獲取部分測試示例代碼(HWPF和XWPF)。
基礎信息讀取 使用org.apache.poi.hwpf.extractor.WordExtractor類,其接受input Stream或者HWPFDocument作為實例化參數(shù),使用getText()方法獲取全部paragraphs,或者使用getParagraphText()獲取每個paragraph中的文字信息
特定信息讀取 為獲取特定的文字或元素,首先需要創(chuàng)建org.apahce.poi.hwpf.HWPFDocument實例,通過getRange()方法獲取所有range,然后從中獲取所有paragraphs,以及更小的元素信息。
頁眉頁腳信息 獲取文檔的頁眉頁腳信息,首先需要創(chuàng)建org.apahce.poi.hwpf.HWPFDocument實例,然后創(chuàng)建org.apache.poi.hwpf.usermodel.HeaderStores實例,并將HWPFDocument實例作為參數(shù)傳入。通過HeaderStores實例可以獲取頁眉、頁腳、首頁、奇數(shù)頁、偶數(shù)頁等信息。另外,HeaderStores可以移除頁眉頁腳中的宏命令。
修改文本信息 使用(Range、Paragraph、CharacterRun中的)insertBefore()和insertAfter()方法可以修改相應文本信息。
其他一些測試示例,見SVN。
基礎信息讀取 通過org.apache.poi.xwpf.extractor.XWPFWordExtractor進行基礎信息讀取,其接受input steam或XWPFDocument作為實例化參數(shù)。調(diào)用其getText()方法可以獲取所有paragraphs、tables以及headers等中的信息。
特定信息讀取 為獲取特定文字或元素,首先需要創(chuàng)建org.apache.poi.xwpf.XWPFDocument實例,利用實例選擇感興趣的IBodyElement要素(Table, Paragraph等),然后獲得一個XWPFRun,最后從XWPFRun中獲取文本或?qū)傩孕畔ⅰ?span style="display:none">W35紅軟基地
頁眉頁腳信息 獲取文檔的頁眉頁腳信息,首先需要創(chuàng)建org.apache.poi.xwpf.XWPFDocument實例,然后創(chuàng)建org.apache.poi.xwpf.usermodel.XWPFHeaderFooter實例,并將HWPFDocument實例作為參數(shù)傳入。通過XWPFHeaderFooter實例可以獲取頁眉、頁腳、首頁、奇數(shù)頁、偶數(shù)頁等信息。
修改文本信息 從XWPFParagraph中,可以獲取組成文本信息的XWPFRun要素。如果要添加新文本,調(diào)用createRun()方法或者文本末端添加一個XWPFRun要素,insertNewRun(int)可以paragraph的指定位置添加一個XWPFRun要素。一旦有了XWPFRun,可以調(diào)用其setText(String)方法修改文本內(nèi)容,如果想增加一個空白要素,如tabs或則line breaks,需要調(diào)用addTab()和addCarriageReturn()方法。