要想从WORD文档中提取图片,可以借助Aspose.Words控件来实现,下面的代码为JAVA的代码。
一、实现思路
1 使用Document.GetChildNodes method方法选择所有Shape节点。
2 循环访问节点集合。
3 检查Shape.HasImage布尔属性。
4 使用Shape.ImageData属性提取图像的数据。
5 保存图像数据到一个文件。
二、功能代码
public void extractImagesToFiles() throws Exception
{
Document doc = new Document(getMyDir() + "Image.SampleImages.doc");
NodeCollection shapes = doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
for (Shape shape : (Iterable<Shape>) shapes)
{
if (shape.hasImage())
{
String imageFileName = java.text.MessageFormat.format(
"Image.ExportImages.{0} Out{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(getMyDir() + imageFileName);
imageIndex++;
}
}
}