基于XML技术的网页内容提取
如题 请问能不能给点指点,关于这个课题我不知道该怎么准备!
说得太简洁了,不理解 买几本xml基础的书看看 是解析xml吗?如果是,建议先用dom解析,找到方法后,可以直接使用jquery解析,建议使用jquery解析,可以直接找到想要的东西,也可以把xml转化成json对象,用js直接调用! 我也想知道,比如你向新浪发送一个请求,然后他返回个xml,怎样解析出来,然后再显示出来.大家知道遨游不,就像他那样子,你的服务器上没有任何资源,可是你可以链接到新浪或者网易等等,得到他的资源显示在自己的网站中。很神奇,怎么做到了。这个是云吗?和web service 有什么联系? 困惑ing........引用 楼主看起来不是要做商用的东西,而是要准备一个课题,用来做论文的是吧。 这样的话应该不允许使用不是自己写的解析html库吧。 嗯,确实不是商用的,只是我毕设相关的课题,实际上是可以引用已经有的类库的,不算违规,其实毕设要求挺简单,就是用C#编写一个程序 能够将网页内的纯文本数据给提取出来!引用 引用 6 楼 gordonkkk 的回复: 楼主看起来不是要做商用的东西,而是要准备一个课题,用来做论文的是吧。 这样的话应该不允许使用不是自己写的解析html库吧。 嗯,确实不是商用的,只是我毕设相关的课题,实际上是可以引用已经有的类库的,不算违规,其实毕设要求挺简单,就是用C#编写一个程序 能够将网页内的纯文本数据给提取出来! htmlparser就可以 不过你问的是C# 你可以换个版去问.. XML网页用XSL做转换 可以在文件头看到用于转换的XSL地址
相关问答:
需要兼容ie firefox safari 等浏览器 IE 可以用FSO 但是在其他浏览器不能用 一般的浏览器处于安全考虑都不允许JavaScript读写本地文件的吧 XML文档内容如下(user.xml): <?xml version="1.0&qu ......
DataSet导出xml 批处理(循环)得怎么处理 XML文件 <A> <B> <C> </C> &nb ......
以下代码在IE下是可以正常,但是用NETBOX封装就不行了,运行到红色的地方就出错了,说缺少对像,请问怎么样修改。 JScript code: //////////////////// AJAX类//////////////// function getxml ......
如何用c++程序判断xml中各元素的合法性,针对格式上的合法性,返回0或者1 使用MSXML,加载XML后,使用validate方法验证 据说你要在linux下使用。 linux下可以使用Libxml2来操作xml,同样提供了validate的方法 ......