C# 通过xsl转换大xml文件方法
通过xsl转换大xml文件
这几天在做这个,网上的几个方法我都试过了,汇总如下
方法一:
XPathDocument myXPathDoc = new XPathDocument(tbXMLFile.Text);
XslCompiledTransform myXslTrans = new XslCompiledTransform();
myXslTrans.Load(tbXSLFile.Text);
XmlTextWriter myWriter = new XmlTextWriter("toSolrXML.xml", null);
myWriter.Formatting = Formatting.Indented;
myXslTrans.Transform(myXPathDoc, null, myWriter);
这种方法可以很好的转换xml文件,但是转换大xml文件时就无能为力了,我转55mb的xml时,报内存错误。
方法二:
MSXML2.DOMDocument xmldoc = new DOMDocument();
xmldoc.async = false;
xmldoc.preserveWhiteSpace = true;
xmldoc.load(tbXMLFile.Text);
MSXML2.DOMDocument xsldoc = new DOMDocument();
xsldoc.async = false;
xsldoc.load(tbXSLFile.Text);
MSXML2.DOMDocument result = new DOMDocument();
result.async = false;
result.preserveWhiteSpace = true;
xmldoc.transformNodeToObject(xsldoc, result);
result.save("toSolrXML.xml");
这种方法可以很好的转换大xml文件,但是save方法生成的文件没有换行。可读性很差。
方法三:
XmlTextWriter myWriter = new XmlTextWriter("toSolrXML.xml", null);
myWriter.Formatting = Formatting.Indented;
System.Xml.Xsl.XslCompiledTransform t = new System.Xml.Xsl.XslCompiledTransform();
XmlReaderSettings settings = new XmlReaderSettings();
settings.ProhibitDtd = false;
XmlReader xmlReader = XmlReader.Create(tbXMLFile.Text, settings);
XmlReader xslReader = XmlReader.Create(tbXSLFile.Text);
t.Load(xslReader);
t.Transform(xmlReader, null, myWriter);
这种方式是三种中最好的,速度快,能转换大文件,而且生成的xml文件是有换行的,可读性强
相关文档:
一、认识Web.config文件
Web.config 文件是一个XML文本文件,它用来储存 ASP.NET Web 应用程序的配置信息(如最常用的设置ASP.NET Web 应用程序的身份验证方式),它可以出现在应用程序的每一个目录中。当你通过.NET新建一个Web应用程序后,默认情况下会在根目录自动创建一个默认的Web.config文件,包括默认 ......
PKM2这个个人知识管理软件相信很多人用过,可以把数据导出为chm电子书,但是不知道为什么倒出来的chm不能按照标题排序,所以我就导出为xml格式,弄个xsl来显示它.
<?xml version="1.0" encoding="gb2312"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output me ......
<?xml version="1.0" encoding="utf-8"?>
<userdata createuser="false">
<dataconnection>
<server>xml test</server>
<uid>sa</uid>
<pwd>sa</pwd>
</dataconnection> ......
XML的产生?
XML的全称是Extensible Markup Language,意思是可扩展的标记语言,它是标准通用标记语言(Standard Generalized Markup Language, SGML)的一个子集。SGML功能非常强大,是可以定义标记语言的元语言。
W3C组织于2004年2月4日,发布了XML1.1的推荐标准,这是最新的XML版本,不过目前大多数的应用还是基于XML1.0的 ......
转自江边孤鸟: http://blog.csdn.net/jbgh608/archive/2007/08/31/1767414.aspx
W3school 的xsl教程: http://www.w3school.com.cn/xsl/index.asp
产品几年前使用ASP,后来升级到.Net 1.1,再升级到2.0,一直都有用XSLT转换XML生成网页的方式,稍微整理下。
XML file:
<?xml version="1.0"& ......