Android开发笔记XML数据解析方法及优缺点

来自：网络

时间：2023-07-25

阅读：

何为XML数据

XML 指可扩展标记语言（eXtensible Markup Language）。

可扩展标记语言（英语：Extensible Markup Language，简称：XML）是一种标记语言，是从标准通用标记语言（SGML）中简化修改出来的。其最主要的功能就是为了方便数据的传输与交换。

在Android开发中，我们有时候也需要从服务器上获取xml数据并加以解析

如何解析XML数据

1.Pull解析

这里我们根据谷歌官方的开发者文档提供的方法，也是其推荐的方法来解析xml数据。

1.分析Feed中感兴趣的标签内容

例如：

  <?xml version="1.0" encoding="utf-8"?>
  <feed xmlns="http://www.w3.org/2005/Atom" xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule" ...">
  <title type="text">newest questions tagged android - Stack Overflow</title>
  ...
      <entry>
      ...
      </entry>
      <entry>
          <id>http://stackoverflow.com/q/9439999</id>
          <re:rank scheme="http://stackoverflow.com">0</re:rank>
          <title type="text">Where is my data file?</title>
          <category scheme="http://stackoverflow.com/feeds/tag?
          tagnames=android&sort=newest/tags" term="android"/>
          <category scheme="http://stackoverflow.com/feeds/tag?
          tagnames=android&sort=newest/tags" term="file"/>
          <author>
              <name>cliff2310</name>
              <uri>http://stackoverflow.com/users/1128925</uri>
          </author>
          <link rel="alternate" href="http://stackoverflow.com/
          questions/9439999/where-is-my-data-file" />
          <published>2012-02-25T00:30:54Z</published>
          <updated>2012-02-25T00:30:54Z</updated>
          <summary type="html">
              <p>I have an Application that requires a data 
              file...</p>
          </summary>
      </entry>
      <entry>
      ...
      </entry>
  ...
  </feed>

就是一份xml数据，其中两个对应<>中的内容即为一个标签中的内容，比如说entry标签中嵌套的id标签为：

<id>http://stackoverflow.com/q/9439999</id>

其内容即为http://stackoverflow.com/q/9439999

2.选择解析器

为了解析xml数据，我们需要选择一些解析器来帮助我们分析数据。

官方文档中提到：

XmlPullParser，这是一种在 Android 上解析 XML 的高效且可维护的方式。以前，Android 有此接口的两个实现：

KXmlParser（通过 XmlPullParserFactory.newPullParser()）。

ExpatPullParser（通过 Xml.newPullParser()）。

任一选择都可以。此部分中的示例使用 ExpatPullParser（通过 Xml.newPullParser()）。

3.实例化解析器

前文提到过，有具体的两种方式实例化解析器，分别是用工厂类生成或者直接用实例生成。比如：

  //工厂类生成：
      XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
      XmlPullParser xmlPullParser = factory.newPullParser();        
  //实例生成：
      XmlPullParser xmlPullParser = Xml.newPullParser();

两者任选其一即可。

4.然后我们可以具体配置一下解析器

     public class StackOverflowXmlParser {
     private static final String ns = null;
     public List parse(InputStream in) throws XmlPullParserException, IOException {
         try {
             XmlPullParser parser = Xml.newPullParser();
             parser.setFeature(XmlPullParser.
             FEATURE_PROCESS_NAMESPACES, false);
             parser.setInput(in, null);
             parser.nextTag();
             return readFeed(parser);
         } finally {
             in.close();
         }
      }
         ...
     }

其中，parser.setFeature(XmlPullParser.FEATURE_PROCESS_NAMESPACES, false);这一行是用来禁用名称空间的，当然setFeature方法还可以用来配置解析器的其他一些参数，可以查看官方的文档。

parser.setInput(in, null);是设置了具体的数据流和编码格式，如果设置为null则使用系统默认的编码。此处还可以只设置一个字节流(Reader),比如：

xmlPullParser.setInput(new StringReader(xmlData));

parser.nextTag();调用 nextTag() 开始解析过程 ,官方的文档里是这样描述的：

Call next() and return event if it is START_TAG or END_TAG otherwise throw an exception. It will skip whitespace TEXT before actual tag if any.

就是说，如果是START_TAG或END_TAG，则调用next()并返回事件，否则抛出异常。它将跳过实际标记之前的空白TEXT(如果有的话)。本质代码：

      int eventType = next();
     if(eventType == TEXT &&  isWhitespace()) {   // skip whitespace
         eventType = next();
     }
     if (eventType != START_TAG &&  eventType != END_TAG) {
         throw new XmlPullParserException("expected start or end 
         tag", this, null);
     }
     return eventType;

next()方法则是用来获取下一个解析事件的。

5.创建具体的方法来解析数据

  private List readFeed(XmlPullParser parser) throws 
  XmlPullParserException, IOException {
  List entries = new ArrayList();
  parser.require(XmlPullParser.START_TAG, ns, "feed");
  while (parser.next() != XmlPullParser.END_TAG) {
          if (parser.getEventType() != XmlPullParser.START_TAG) {
              continue;
          }
          String name = parser.getName();
          // Starts by looking for the entry tag
          if (name.equals("entry")) {
              entries.add(readEntry(parser));
          } else {
              skip(parser);
          }
      }
      return entries;
  }

这里一开始的require方法是用来测试条件的，它接受三个参数，分别是预期的事件类型，名称空间，名称。

它将测试当前事件是否属于给定的类型，以及名称空间和名称是否匹配。Null将匹配任何名称空间和任何名称。如果测试未通过，则抛出异常。异常文本指示解析器位置、预期事件和不满足需求的当前事件。

这里的next事件可能返回的两个值，XmlPullParser.START_TAG 和 XmlPullParser.END_TAG 分别对应的是开始解析一个节点和完成一个节点的解析的标志。还有一个重要的标志是XmlPullParser.END_DOCUMENT,对应的是解析工作完成。

skip函数则是用来跳过不感兴趣的标签的。

  private void skip(XmlPullParser parser) throws 
  XmlPullParserException, IOException {
  if (parser.getEventType() != XmlPullParser.START_TAG) {
      throw new IllegalStateException();
  }
  int depth = 1;
  while (depth != 0) {
      switch (parser.next()) {
      case XmlPullParser.END_TAG:
          depth--;
          break;
      case XmlPullParser.START_TAG:
          depth++;
          break;
      }
  }
}

接下来则会进入到entry标签中进行进一步的解析：

  public static class Entry {
  public final String title;
  public final String link;
  public final String summary;
  private Entry(String title, String summary, String link) {
      this.title = title;
      this.summary = summary;
      this.link = link;
  }
 }
  // Parses the contents of an entry. If it encounters a title,
   summary, or link tag, hands them off
  // to their respective "read" methods for processing. 
  Otherwise, skips the tag.
  private Entry readEntry(XmlPullParser parser) throws 
  XmlPullParserException, IOException {
      parser.require(XmlPullParser.START_TAG, ns, "entry");
      String title = null;
      String summary = null;
      String link = null;
      while (parser.next() != XmlPullParser.END_TAG) {
          if (parser.getEventType() != XmlPullParser.START_TAG) {
              continue;
          }
          String name = parser.getName();
          if (name.equals("title")) {
              title = readTitle(parser);
          } else if (name.equals("summary")) {
              summary = readSummary(parser);
          } else if (name.equals("link")) {
              link = readLink(parser);
          } else {
              skip(parser);
          }
      }
      return new Entry(title, summary, link);
  }
  // Processes title tags in the feed.
  private String readTitle(XmlPullParser parser) throws 
  IOException, XmlPullParserException {
      parser.require(XmlPullParser.START_TAG, ns, "title");
      String title = readText(parser);
      parser.require(XmlPullParser.END_TAG, ns, "title");
      return title;
  }
  // Processes link tags in the feed.
  private String readLink(XmlPullParser parser) throws 
  IOException, XmlPullParserException {
      String link = "";
      parser.require(XmlPullParser.START_TAG, ns, "link");
      String tag = parser.getName();
      String relType = parser.getAttributeValue(null, "rel");
      if (tag.equals("link")) {
          if (relType.equals("alternate")){
              link = parser.getAttributeValue(null, "href");
              parser.nextTag();
          }
      }
      parser.require(XmlPullParser.END_TAG, ns, "link");
      return link;
  }
  // Processes summary tags in the feed.
  private String readSummary(XmlPullParser parser) throws 
  IOException, XmlPullParserException {
      parser.require(XmlPullParser.START_TAG, ns, "summary");
      String summary = readText(parser);
      parser.require(XmlPullParser.END_TAG, ns, "summary");
      return summary;
  }
  // For the tags title and summary, extracts their text values.
  private String readText(XmlPullParser parser) throws IOException, XmlPullParserException {
      String result = "";
      if (parser.next() == XmlPullParser.TEXT) {
          result = parser.getText();
          parser.nextTag();
      }
      return result;
  }
  ...
  }

这里官方示例写的比较复杂，但是模块化做的较好。这里创建了一个静态内部类Entry来辅助组织并返回数据。首先开始读取后利用getName()方法来获取节点的名称，对于每个具体的节点，也分别写了不同的方法来读取。

我们首先来看最基本的读取方法readText方法，这实际上是对解析器提供的getText方法的封装，当解析的下一个事件为TEXT时，即利用getText方法将其内容返回出去。
接着其实其他的解析方法都大同小异，但都要根据标签内部具体的内容来设计具体的解析逻辑，比如实例中比较特殊的readLink方法，其中有一个getAttributeValue方法，是根据名称空间和具体的属性名称来获取属性值的，

比如上面的代码：

String relType = parser.getAttributeValue(null, “rel”);

就是设置无名称空间，获取了Link标签里rel的具体的值。

然后再根据rel的值来决定是否解析href的值。

2.简单的Pull解析

上面的Pull解析未免太过繁琐，在Android第一行代码中也有较为简单的解析：

要解析的数据：

    <apps>
        <app>
            <id>1</id>
            <name>Google Maps</name>
            <version>1.0</version>
        </app>
        <app>
            <id>2</id>
            <name>Chrome</name>
            <version>2.1</version>
        </app>
        <app>
            <id>3</id>
            <name>Google Play</name>
            <version>2.3</version>
        </app>
    </apps>

具体的解析方法：

private void parseXMLWithPull(String xmlData){
    try{
        XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
        XmlPullParser xmlPullParser = factory.newPullParser();
        xmlPullParser.setInput(new StringReader(xmlData));
        int eventType = xmlPullParser.getEventType();
        String id = "";
        String name = "";
        String version = "";
        while(eventType != XmlPullParser.END_DOCUMENT){
            String nodeName = xmlPullParser.getName();
            switch (eventType){
                case XmlPullParser.START_TAG:{
                    if("id".equals(nodeName)){
                        id = xmlPullParser.nextText();
                    }else if("name".equals(nodeName)){
                        name = xmlPullParser.nextText();
                    }else if ("version".equals(nodeName)){
                        version = xmlPullParser.nextText();
                    }
                }
                break;
                case XmlPullParser.END_TAG: {
                    if("app".equals(nodeName)){
                        Log.d("MainActivity","id is "+id);
                        Log.d("MainActivity","name is "+name);
                        Log.d("MainActivity","version is "+version);
                    }
                }
                break;
                default:
                    break;
            }
            eventType = xmlPullParser.next();
        }
    }catch (Exception e){
        e.printStackTrace();
    }
}

这里省去了一些繁琐的检测，名称空间的设置等，并且用XmlPullParser.END_DOCUMENT作为判断解析事件是否完成的标志。

3.SAX解析

SAX解析与Pull解析类似，是由事件驱动的。其采用流式解析，解析与读取同步，读到哪就解析到哪。

要用SAX解析，我们就需要用到接口ContentHandle，一般情况下，我们可以继承系统自带的DefaultDocument，并且重写其中的五个方法。

这里我们解析上面2中简单Pull解析中的数据，重写DefaultHandle类：

public class MyHandle extends DefaultHandler {
private final String TAG = "MainActivity";
private String nodeName;
private StringBuilder id;
private StringBuilder name;
private StringBuilder version;
@Override
public void startDocument() throws SAXException{
    id = new StringBuilder();
    name = new StringBuilder();
    version = new StringBuilder();
}
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes)
throws SAXException{
    nodeName = localName;
}
@Override
public void characters(char[] ch,int start,int length)throws SAXException{
    if("id".equals(nodeName)){
        id.append(ch,start,length);
    }else if("name".equals(nodeName)){
        name.append(ch,start,length);
    }else if("version".equals(nodeName)){
        version.append(ch,start,length);
    }
}
@Override
public void endElement(String uri,String localName,String qName)throws SAXException{
    if("app".equals(localName)){
        Log.d(TAG,"id is "+ id.toString().trim());
        Log.d(TAG,"name is "+name.toString().trim());
        Log.d(TAG,"version is "+version.toString().trim());
        id.setLength(0);
        name.setLength(0);
        version.setLength(0);
    }
}
@Override
public void endDocument() throws  SAXException{
    super.endDocument();
 }
}

SAX解析类似于触发器，每个方法都会在一个特定的时候被调用，startDocument方法

会在开始解析任务时执行，startElement方法会在开始解析一个节点时执行，characters是具体解析节点的过程，endElement方法会在一个节点解析完成时执行，endDocument方法会在整个解析过程完成后执行。

总的来说，SAX解析的模版比较固定，语义也比较清晰。

目录一、向设备传输文件命令二、操作步骤2.1 连接设备2.2 启动windows的cmd2.3 输入adb push指令三、总结一、向设备传输文件命令用于在windows系统下，向设备传输文件。二、

2024-06-09 01:14:15

目录一、前言二、绘制原理三、总结一、前言旋转菜单是一种占用空间较大，实用性稍弱的UI，一方面由于展示空间的问题，其展示的数据有限，但另一方面真由于这个原因，对用户而言趣味性

2024-06-09 01:14:12

目录一、了解什么是Android Studio二、了解什么是sqlite三、创建项目文件四、创建活动文件和布局文件五、创建数据库连接数据库六、创建实体类实现注册功能七、实现登录功能

2024-06-09 01:14:09

目录原理解析主动监测被动监测在第三方图片加载库回调中进行大图监测在网络加载图片时进行大图监测使用ASM插桩进行大图监控注意事项与优化技巧总结原理解析内存占用计算首

2024-06-09 01:14:05

目录概念类简介简单例子执行流程一、在执行完 AsyncTask.excute() 后二、方法分析源码分析一、主分支二、次分支主分支部分一、分析mWorker二、分析mFuture三、回过头来看一

2024-06-09 01:14:03

目录Kotlin 协程的异常处理概述异常处理六大准则准则一：协程的取消需要内部配合问题：cancel不被响应解决：使用 isActive 判断是否处于活跃状态准则二：不要打破协程的父子结构问

2024-06-09 01:14:00

目录一、前言需求问题二、方案方案：自定义Presentation原理WindowType问题解决WindowManagerImpl 问题方案：Delagate方式：兼容总结一、前言Android 多屏互联的时代，必然会出现多

2024-06-09 01:13:57

目录一、前言二、实现方法三、全部代码四、总结一、前言在很多app种内置了语音助手，也存在各种动画，主要原因是处理2个阶段问题，第一个是监听声音的等待效果，第二个是语意解析存

2024-06-09 01:13:55

目录Flutter路由跳转基本路由跳转返回上一页路由基本路由跳转传参命名路由跳转命名路由跳转需要先配置路由命名路由跳转传参命名路由替换跳转移除所有页面返回到根页面Flut

2024-06-09 01:13:52

目录前言提取蒙版蒙版绘制扩大蒙版（影子）闪烁效果总结全部代码前言先看下我们阔爱滴海绵宝宝，其原图是一张PNG图片，我们给宝宝加上描边效果，今天我们使用的是图片蒙版技术。说到

2024-06-09 01:13:50

目录Android EditText设置边框简介快速开始Android EditText设置边框简介Android应用程序中给EditText设置边框。效果图：快速开始1.在res/drawable目录下新建样式文件 edit_b

2024-06-09 01:13:47

目录前言安装Qt安装JDK配置环境问题解决SDK配置报错：× Android SDK Command-line Tools runsQt版本出现错误：无法检测 Qt 版本所使用的 ABI。安卓构建套件警告：no device

2024-06-09 01:13:44

目录stack特性示例stack特性在Flutter中，你可以使用Stack和Positioned来创建悬浮 UI。Stack允许你将多个小部件叠放在一起，而Positioned则用于定位小部件在Stack中的位置。示

2024-06-09 01:13:42

目录Okhttp 介绍Okhttp 中几个重要类的介绍OkHttpClientOkHttpClient使用注意OkHttpClient的创建不需要了可以关闭Call 类Request 类RequestBody总结一下OKHTTP架构图OKHttp

2024-06-09 01:13:39

目录1. HVAC 功能介绍1.1 双区温度调节1.2 空调开关1.3 内/外循环1.4 风量调节1.5 风向调节1.6 A/C开关1.7 主副驾座椅加热1.8 除霜1.9 自动模式2. HVAC 源码结构3. HVAC 核

2024-06-09 01:13:36

目录前言1. 布局自动滚动的思路2. 最终效果3. 代码实现4. 总结前言在平时的开发中，有时会碰到这样的场景，设计上布局的内容会比较紧凑，导致部分机型上某些布局中的内容显示不完

2024-06-09 01:13:34

目录BuildContext 简介BuildContext的主要作用BuildContext 简介BuildContext是Flutter中的一个重要概念，表示当前Widget在树中的位置上下文。它是一个对Widget树的一个位置

2024-06-09 01:13:26

目录需求和背景实现安全管理类相关工具类需求和背景行业相关，对安全性较高的程序一般都需要添加完整性检测的功能，以防止程序被篡改，从而导致安全问题的发生。
相关的支付应用

2024-06-09 01:13:24

目录Android开发各种Gradle错误缺少依赖项版本冲突配置错误Android开发各种Gradle错误在开发Android应用程序时，我们可能会遇到各种Gradle错误。这些错误可能来自不同的原因，

2024-06-09 01:13:22

目录Draggable介绍构造函数参数说明使用示例DragTarget介绍构造函数参数说明使用示例DragTarget如何接收Draggable传递过来的数据结束语Draggable介绍Draggable是Flutter框

2024-06-09 01:13:20

目录前言：步骤：引用库实战过程我的案例前言：我们在上一篇文章中学到了Recyclerview但是在现实中往往需求不是那么的简单，可能需要多种需求合并起来，例如常见的上下拉刷新，删除 ite

2024-06-09 01:13:18

目录滑动冲突的原理解决方法外部拦截法内部拦截法注意事项和优化技巧总结滑动冲突的原理Android的事件分发机制是基于ViewGroup的。当用户在屏幕上触摸时，事件会首先传递给最

2024-06-09 01:13:16

目录背景横线效果网格效果基础属性绘制背景色绘制边框线绘制四个边角线扫描线绘制及移动特点背景最近在开发新项目时，使用了扫描二维码的功能，一般扫描二维码的效果是一条横线

2024-06-09 01:12:49

目录HTextView前言HTextView的简单使用方法HTextView引入line使用以及效果fade使用以及效果typer使用以及效果rainbow使用以及效果scale使用以及效果evaporate使用以及效果f

2024-06-09 01:12:45

目录应用设置一个不同于全局的多语言系统设置中支持为应用设置单独多语言入口在哪里自动添加手动添加在应用内部设置多语言应用设置一个不同于全局的多语言通常情况下多语言

2024-06-09 01:12:43

目录报错错误原因解决方法序列化和反序列化结语报错使用fluro时报错type ‘String’ is not a subtype of type ‘Queue<Task>’报错如下：错误原因在使

2024-06-09 01:12:41

目录Kotlin 协程 supervisorScope {} 运行崩溃解决前言解决方法kotlin 协程异常处理Kotlin 协程 supervisorScope {} 运行崩溃解决前言简单介绍supervisorScope函数，它用于创

2024-06-09 01:12:38

目录一、ADB简介1、什么是adb2、为什么要用adb二、准备工具1、下载adb2、配置环境变量3、连接 4、电脑打开cmd窗口三、ADB命令详解1、基本命令2、权限命令 3、建立连接4、ap

2024-06-09 01:12:36

目录引言解决上下文问题上下文类型引言我在恢复安卓Termux数据时遇到了权限问题，我将数据恢复到/data/data目录中，并用chown设置了正确的用户和组，但是Termux在访问时还是遇到

2024-06-09 01:12:32

目录APT作用Android基本编译流程APT基本使用1、自定义注解2、注解处理器注解处理器注解处理器注册java代码生成3. 对外调用4. 调用总结APT，Annotation Processing Tool，即注

2024-06-09 01:12:30

2020-09-23

2021-02-18

2021-05-16

2021-01-19

2020-10-14

2020-05-18

2020-10-14

2020-10-23

Android开发笔记XML数据解析方法及优缺点

目录

何为XML数据

如何解析XML数据

1.Pull解析

2.简单的Pull解析

3.SAX解析

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道