首页 > 技术文章 > 1.URLConnection

Tsugar 2020-01-31 17:42 原文

//爬虫:
//1.请求到某个网站去
//2.返回一些HTML代码
//3.从HTML代码提取你想要的信息 HTML解析
//4.如果这些HTML中又有你感兴趣的内容
//5.递归爬取
//准备好网址
URL url = new URL("http://zuidazy2.net/");
//准备好连接
java.net.URLConnection urlConnection = url.openConnection();
//发送连接请求
urlConnection.connect();
//确定获取一个输入流对象 强转
InputStream in = (InputStream)urlConnection.getContent();
       //获取一个输出流对象 将输入流对象写进文本
OutputStream out = new FileOutputStream(new File("d://zuidazy.html"));
byte[] b = new byte[1024];
int len = 0;
while ((len=in.read(b))!=-1)
{
out.write(b,0,len);
}
in.close();
out.close();
// //in.available()获取当前流中的数据量
// byte[] b = new byte[in.available()];
// //将数据读取到byte数组中
// in.read(b);
// //将字节数组转换为字符串
// String content = new String(b);
// System.out.println(content);


//下载网易云歌曲
//id=27890306
try {
URL url = new URL("http://music.163.com/song/media/outer/url?id="+id+".mp3");
URLConnection urlConnection = url.openConnection();
urlConnection.connect();
InputStream in = (InputStream)urlConnection.getContent();
FileUtils.copyInputStreamToFile(in,new File("d://意外.mp3"));


} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}


未完成HTML的解析

推荐阅读