ASP.NET实现WORD文件自动转换PDF

需求分析:客户的项目以B/S结构为主,提供一个WORD文件在后台自动转换PDF,经过实际测试,如果该篇WORD文档有100多页的话,转换需要20分钟左右的时间(环境:CPU是奔腾M 1.6G,512M内存),整个CPU的占用率近乎95%~100%,此结果告诉客户以后,客户提议:到客户下班后,自动转换PDF,同时如果使用人确认要查看该PDF文档,如果没有转换,提供给客户选择,是现在转换PDF,还是由服务器在客户下班后,自动转换。

项目功能:按需求分析要写两个功能
***为:B/S结构后台转换,要提交给客户选择
第二为:Windows服务WORD文件自动转换PDF

这两个分类:核心的转换程序都是采用线程的方式执行,只不过***个功能是针对一个WORD文件,第二个功能针对所有未转换的WORD文件

分析到现在:我们开始实战转换了!

一:必备工具

安装必须的工具MS VS.Net2003,MS Office2003,Adobe Acrobat 7.0 Professional,postscript.exe,gs811w32.exe
◆MS VS.Net2003的安装不说明
◆MS Office2003的安装不说明
◆Adobe Acrobat 7.0 Professional安装说明

运行setup.exe文件,出现输入序列号,就运行注册机,用鼠标在***行刷下就可以看见序列号,复制粘贴到Adobe Acrobat 7.0 Professional安装程序对话框,安装到***出现注册时,点击PHONE...将安装程序中显示的第二行序列号(***行是刚才注册机生成的序列号)复制粘贴到注册机的第二行,点击右边的按钮,再用鼠标刷第三行授权号就出来了,将其复制粘贴到安装程序的***一行,完成安装注册!
◆postscript.exe默认安装就可以了,它是一个PDF转换时所需要的脚本
◆gs811w32.exe默认安装就可以,它其实是个PDF虚拟打印机的驱动

二:配置虚拟打印机

进入Windows的控制面板,进入打印机,点击"添加打印机"图标.在安装对话框上"按一步",出现选择打印机时,在制造商一栏中选择"Generic",在打印机一栏中,选择"MS Publisher Color Printer",然后一路按下一步,知道安装结束.

三:开始写***个程序(脚本程序)

为什么要使用脚本程序进行转换呢,其实实际测试过程中,使用PDF Distiller的对象引用到C#后,转换成功,但整个PDF Distiller对象不能释放,第二次再转换时,就发生了错误,故此处使用脚本程序实现转换.这样我们只要在C#的程序中调用脚本程序就可以实现 WORD到PDF的转换。

宿主脚本文件名:ConvertDoc2PDF.js

脚本文件内容:

 
 
 
  1. var files = WScript.Arguments;  
  2. var fso = new ActiveXObject("Scripting.FileSystemObject");  
  3. var word = new ActiveXObject("Word.Application");  
  4. var PDF = new ActiveXObject("PDFDistiller.PDFDistiller.1");  
  5. word.ActivePrinter = "MS Publisher Color Printer";  
  6.  
  7. //files(0) 为WORD文档文件名  
  8. //files(1) 为,转换后需要保存的路径  
  9. //调用fso.GetBaseName(files(0))后,为无路径,无扩展名,的文件名  
  10. //files.length为文件参数的个数,使用循环可以支持多个WORD文档的转换  
  11.  
  12. var docfile = files(0);  
  13. var psfile = files(1) + fso.GetBaseName(files(0)) + ".ps";  
  14. var pdffile = files(1) + fso.GetBaseName(files(0)) + ".pdf";  
  15. var logfile = files(1) + fso.GetBaseName(files(0)) + ".log";  
  16.  
  17. try{  
  18. var doc = word.Documents.Open(docfile);  
  19. //WORD文件转成PS文件;  
  20. word.PrintOut(false, false, 0, psfile);  
  21. doc.Close(0);  
  22.  
  23. //PS文件转成PDF文件;  
  24. PDF.FileToPDF(psfile,pdffile,"");  
  25.  
  26. fso.GetFile(psfile).Delete();//删除PS脚本文件  
  27. fso.GetFile(logfile).Delete();//删除转换的日志文件  
  28.  
  29. word.Quit();  
  30. WScript.Echo("isuccess");//成功  
  31. WScript.Quit(0);  
  32. }  
  33. catch(x)  
  34. {  
  35. word.Quit();  
  36. WScript.Echo("isfail");//失败  
  37. WScript.Quit(0);  

然后测试该脚本程序

启动MS-DOS,输入如下命令:c:\>cscript //nologo c:\ConvertDoc2PDF.js c:\test.doc c:\

说明:

运行成功后将看到test.pdf文档了
c:\test.doc参数对应的是脚本程序中的files(0)
c:\参数对应的是脚本程序中的files(1)

你可以安照该脚本改写成,支持多个参数,使用FOR循环,一次转换多个WORD文档,此处没有使用多个文件转换功能,是考虑到,该段脚本放在C#的线程中执行,这样一来也可以转换多个WORD文档.

四:使用C#调用ConvertDoc2PDF.js脚本

新建一个C#的WINDOWS应用程序,添加一个按钮button1添加一个函数,函数名StartConvertPDF

 
 
 
  1. publicvoidStartConvertPDF()  
  2. {  
  3. Processproc=newProcess();  
  4. proc.StartInfo.FileName="cmd.exe";  
  5. proc.StartInfo.WorkingDirectory=@"c:\";  
  6. proc.StartInfo.CreateNoWindow=true;  
  7. proc.StartInfo.UseShellExecute=false;  
  8. proc.StartInfo.RedirectStandardInput=true;//输入重定向  
  9.  
  10. proc.Start();  
  11. proc.StandardInput.WriteLine(@"cscript//nologoc:\ConvertDoc2PDF.jsc:\test.docc:\");  
  12. proc.StandardInput.WriteLine("exit");  
  13. proc.WaitForExit();  

结束语:

以上介绍ASP.NET实现WORD文件自动转换PDF,Adobe Acrobat 7.0 Professional,postscript.exe,gs811w32.exe这三个文件可以在itbaby.jss.cn下载,都包含在同一个RAR的压缩文件中了。

itbaby.jss.cn是动态域名,主机在作者家里,如果网站不能访问,说明电脑没有开,请稍后几天再试。

【编辑推荐】

  1. 浅析ASP.NET的PageBase和MasterPage
  2. ASP.NET的XML Web服务方法
  3. 详解部署ASP.NET环境
  4. 实现ASP.NET全球化
  5. 解决ASP.NET AJAX脚本的错误问题
THE END