基于XML技术的网页内容提取
如题
我这学期选的课题是这个但是不知道该怎么准备,导师也没怎么说清楚,希望各位达人能指点一二,小弟在这谢过啦!
谢谢你 ,我现在也自己看资料整理思路呢,具体的还要一点时间。
你可以利用webbroser访问一个页面,然后,用webbroser.document获得html dom,webbroser.document.body.outerHTML,就是body元素内的所有HTML了。
webbroser 改为webbrowser
相关问答:
我是利用axiom对xml进行解析!
但却出现下面的错误!
Exception in thread "main" org.apache.axiom.om.OMException: [com.ctc.wstx.exc.WstxLazyException] com.ctc.wstx.exc.WstxUnexpectedCharEx ......
DataSet导出xml 批处理(循环)得怎么处理
XML文件
<A>
<B>
<C>
</C>
&nb ......
有这样一段由.net生成的xml(由dataset转化而来):
<NewDataSet> <xs:schema id="NewDataSet" xmlns="" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:msdata=& ......
如题
请问能不能给点指点,关于这个课题我不知道该怎么准备!
说得太简洁了,不理解
买几本xml基础的书看看
是解析xml吗?如果是,建议先用dom解析,找到方法后,可以直接使用jquery解析,建 ......