C++中使用Expat解析XML
日期:2010-4-13使用expat的原因很多,主要还是因为expat更灵活。习惯了TinyXML,一开始不太习惯expat,分析一下,其实很容易上手的。
1.回调函数
以下案例解析xml文件中的elment,attribute和text。expat使用回调方式返回xml数据,解析器解析到一个element及其内部属性后,将调用事先设置好的函数,同样,当element结束和text结束后,也会分别调用对应的函数。
2.如何处理数据之间的包含关系
典型的方式是定义三个函数分别处理elment开始(含属性)、element结束和文本内容。回调函数的第一个参数是自定义的,通常用于存储 XML文档的上下文信息,用XML_SetUserData可以设置这个参数,下例中传递一个整数指针,以便在每次回调时能知道该元素是第几层元素。
该参数也可以是一个栈对象的地址,开始一个元素时,将新元素对应的数据压入堆栈,处理下一级元素时,新元素是栈顶元素在子元素,然后处理完了继续把该元素压入堆栈,继续下一级新的子元素。当元素结束后,需要出栈,以便解析下个兄弟元素程时能取到父节点。
好啦,基本应用还是很简单的,实际上Expat的API函数不多。
3.如何处理属性
属性通过ElementHandler回调函数传入,这里有一个char atts就是属性,这是一个字符指针数组,如果有N个属性,数组大小就是2N+1,最后一个素组元素为空指针,奇数指针对应属性名称,偶数指针对应属性值(字符串格式)。可以在一个循环中处理多个属性,当遇到空指针时,表示没有更多属性了。
好啦,先看sample吧:
#include
#include"expat.h"
#pragmawarning(disable:4996)
#defineXML_FMT_INT_MOD"l"
staticvoidXMLCALLstartElement(voiduserData,constcharname,constcharatts)
{
inti;
intdepthPtr=(int)userData;
for(i=0;i printf(""); printf(name); depthPtr+=1; for(i=0;atts[i]!=0;i+=2) { printf("%s=%s",atts[i],atts[i+1]); } printf("\n"); } staticvoidXMLCALLendElement(voiduserData,constcharname) { intdepthPtr=(int)userData; depthPtr-=1; } intmain(intargc,charargv[]) { charbuf[BUFSIZ];XML_Parserparser=XML_ParserCreate(NULL); intdone;intdepth=0; XML_SetUserData(parser,&depth); XML_SetElementHandler(parser,startElement,endElement); FILEpFile=argc<2?stdin:fopen(argv[1],"rb"); do {intlen=(int)fread(buf,1,sizeof(buf),pFile); done=len if(XML_Parse(parser,buf,len,done)==XML_STATUS_ERROR) { fprintf(stderr,"%satline%"XML_FMT_INT_MOD"u\n", XML_ErrorString(XML_GetErrorCode(parser)), XML_GetCurrentLineNumber(parser)); return1; } } while(!done); XML_ParserFree(parser); fclose(pFile); return0; } 4.其他ElementHanlder expat还可以设置CData,Comment的handler,另外一些函数本人还没使用过,涉及到更多的xml标准的知识,如果需要,可以参考官方的手册。