日期:2014-05-17 浏览次数:20879 次
String str = "<li class=\"center\"><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'><img src=\"http://avatar.profile.csdn.net/5/3/8/2_ever089010.jpg\" onmouseover=\"try{showUserCard(this,'ever089010')}catch(ex){};\"/></a></li>"
+ "<li title=\"总技术分:0;总技术排名:499417\"><dfn><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'>ever089010</a></dfn></li>"
+ "<li class=\"center\"><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'><img src=\"http://avatar.profile.csdn.net/5/3/8/2_ever089010.jpg\" onmouseover=\"try{showUserCard(this,'ever089010')}catch(ex){};\"/></a></li>"
+ "<li title=\"总技术分:0;总技术排名:499417\"><dfn><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'>ever089010</a></dfn></li>";
Pattern pattern = Pattern.compile("<a\\s[^<]*href=\"([^\"]*)\"\\s[^<]*<img\\s[^<]*src=\"([^\"]*)\"\\s[^<]*</a>");
Matcher matcher = pattern.matcher(str);
List<String> linkList=new ArrayList<String>();
List<String> picList=new ArrayList<String>();
while (matcher.find()) {
linkList.add(matcher.group(1));
picList.add(matcher.group(2));
System.out.println(matcher.group(1));
System.out.println(matcher.group(2));
System.out.println("==========");
}
------解决方案--------------------
正则啊,楼主都没给出想抓那个网页……