字符集、IO流(一)

打印 上一主题 下一主题

主题 1700|帖子 1700|积分 5100

一、字符集

1.1 字符集的来历

盘算机是美国人发明的,由于盘算机可以或许处置处罚的数据只能是0和1构成的二进制数据,为了让盘算机可以或许处置处罚字符,于是美国人就把他们会用到的每一个字符进行了编码(所谓编码,就是为一个字符编一个二进制数据),如下图所示:

美国人常用的字符有英笔墨母、标点符号、数字以及一些特殊字符,这些字符一共也不到128个,以是他们用1个字节来存储1字符就够了。 美国人把他们用到的字符和字符对应的编码总结成了一张码表,这张码表叫做ASCII码表(也叫ASCII字符集)
其实盘算机只在美国用是没有题目标,但是盘算机慢慢的遍及到全世界,当遍及到中国的时候,在盘算机中想要存储中文,那ASCII字符集就不够用了,因为中文太多了,随便数一数也有几万个字符。
于是中国人为了在盘算机中存储中文,也编了一个中国人用的字符集叫做GBK字符集,这里面包含2万多个汉字字符,GBK中一个汉字采用两个字节来存储,为了可以或许显示英笔墨母,GBK字符集也兼容了ASCII字符集,在GBK字符集中一个字母还是采用一个字节来存储
1.2 汉字和字母的编码特点

需要我们注意汉字和字母的编码特点:


  • 假如是存储字母,采用1个字节来存储,一共8位,此中第1位是0
  • 假如是存储汉字,采用2个字节来存储,一共16位,此中第1位是1

当读取文件中的字符时,通过识别读取到的第1位是0还是1来判定是字母还是汉字


  • 假如读取到第1位是0,就以为是一个字母,此时往后读1个字节。
  • 假如读取到第1位是1,就以为是一个汉字,此时往后读2个字节。
1.3 Unicode字符集

在Unicode字符集中包含了世界上全部国家的笔墨,一个字符采用4个自己才存储。
在Unicode字符集中,采用一个字符4个字节的编码方案,又造成另一个题目:假如是说英语的国家,他们只需要用到26大小写字母,加上一些标点符号就够了,本身一个字节就可以表现完,用4个字节就有点浪费。
于是又对Unicode字符集中的字符进行了重新编码,一共设计了三种编码方案。分别是UTF-32、UTF-16、UTF-8; 此中比较常用的编码方案是UTF-8
下面我们详细先容一下UTF-8这种编码方案的特点。
  1. 1.UTF-8是一种可变长的编码方案,工分为4个长度区
  2. 2.英文字母、数字占1个字节兼容(ASCII编码)
  3. 3.汉字字符占3个字节
  4. 4.极少数字符占4个字节
复制代码

1.4 字符集小结

  1. ASCII字符集:《美国信息交换标准代码》,包含英文字母、数字、标点符号、控制字符
  2.         特点:1个字符占1个字节
  3. GBK字符集:中国人自己的字符集,兼容ASCII字符集,还包含2万多个汉字
  4.         特点:1个字母占用1个字节;1个汉字占用2个字节
  5. Unicode字符集:包含世界上所有国家的文字,有三种编码方案,最常用的是UTF-8
  6.     UTF-8编码方案:英文字母、数字占1个字节兼容(ASCII编码)、汉字字符占3个字节
复制代码
1.5 编码息争码

搞清楚字符集的知识之后,我们接下来再带着同砚们使用Java代码完成编码息争码的操作。
其实String类类中就提供了相应的方法,可以完成编码息争码的操作。


  • 编码:把字符串按照指定的字符集转换为字节数组
  • 解码:把字节数组按照指定的字符集转换为字符串

  1. /**
  2. * 目标:掌握如何使用Java代码完成对字符的编码和解码。
  3. */
  4. public class Test {
  5.     public static void main(String[] args) throws Exception {
  6.         // 1、编码
  7.         String data = "a我b";
  8.         byte[] bytes = data.getBytes(); // 默认是按照平台字符集(UTF-8)进行编码的。
  9.         System.out.println(Arrays.toString(bytes));
  10.         // 按照指定字符集进行编码。
  11.         byte[] bytes1 = data.getBytes("GBK");
  12.         System.out.println(Arrays.toString(bytes1));
  13.         // 2、解码
  14.         String s1 = new String(bytes); // 按照平台默认编码(UTF-8)解码
  15.         System.out.println(s1);
  16.         String s2 = new String(bytes1, "GBK");
  17.         System.out.println(s2);
  18.     }
  19. }
复制代码

二、IO流(字节省)

2.1 IO流概述

IO流的作用:就是可以对文件或者网络中的数据进行读、写的操作。如下图所示


  • 把数据从磁盘、网络中读取到步调中来,用到的是输入流。
  • 把步调中的数据写入磁盘、网络中,用到的是输出流。
  • 简朴记:输入流(读数据)、输出流(写数据)


  1. IO流分为两大派系:
  2.         1.字节流:字节流又分为字节输入流、字节输出流
  3.         2.字符流:字符流由分为字符输入流、字符输出流
复制代码

2.2 FileInputStream读取一个字节


需要用到的方法如下图所示:有构造方法、成员方法

使用FileInputStream读取文件中的字节数据,步调如下
  1. 第一步:创建FileInputStream文件字节输入流管道,与源文件接通。
  2. 第二步:调用read()方法开始读取文件的字节数据。
  3. 第三步:调用close()方法释放资源
复制代码
  1. /**
  2. * 目标:掌握文件字节输入流,每次读取一个字节。
  3. */
  4. public class FileInputStreamTest1 {
  5.     public static void main(String[] args) throws Exception {
  6.         // 1、创建文件字节输入流管道,与源文件接通。
  7.         InputStream is = new FileInputStream(("file-io-app\\src\\itheima01.txt"));
  8.         // 2、开始读取文件的字节数据。
  9.         // public int read():每次读取一个字节返回,如果没有数据了,返回-1.
  10.         int b; // 用于记住读取的字节。
  11.         while ((b = is.read()) != -1){
  12.             System.out.print((char) b);
  13.         }
  14.         
  15.         //3、流使用完毕之后,必须关闭!释放系统资源!
  16.         is.close();
  17.     }
  18. }
复制代码
这里需要注意一个题目:由于一个中文在UTF-8编码方案中是占3个字节,采用一次读取一个字节的方式,读一个字节就相当于读了1/3个汉字,此时将这个字节转换为字符,是会有乱码的。
2.3 FileInputStream读取多个字节

FileInputStream调用read()方法,可以一次读取一个字节。但是这种读取方式效率太太太太慢了。 为了提高效率,我们可以使用另一个read(byte[] bytes)的重载方法,可以一次读取多个字节,至于一次读多少个字节,就在于你通报的数组有多大。
使用FileInputStream一次读取多个字节的步调如下
  1. 第一步:创建FileInputStream文件字节输入流管道,与源文件接通。
  2. 第二步:调用read(byte[] bytes)方法开始读取文件的字节数据。
  3. 第三步:调用close()方法释放资源
复制代码
  1. /**
  2. * 目标:掌握使用FileInputStream每次读取多个字节。
  3. */
  4. public class FileInputStreamTest2 {
  5.     public static void main(String[] args) throws Exception {
  6.         // 1、创建一个字节输入流对象代表字节输入流管道与源文件接通。
  7.         InputStream is = new FileInputStream("file-io-app\\src\\itheima02.txt");
  8.         // 2、开始读取文件中的字节数据:每次读取多个字节。
  9.         //  public int read(byte b[]) throws IOException
  10.         //  每次读取多个字节到字节数组中去,返回读取的字节数量,读取完毕会返回-1.
  11.         // 3、使用循环改造。
  12.         byte[] buffer = new byte[3];
  13.         int len; // 记住每次读取了多少个字节。  abc 66
  14.         while ((len = is.read(buffer)) != -1){
  15.             // 注意:读取多少,倒出多少。
  16.             String rs = new String(buffer, 0 , len);
  17.             System.out.print(rs);
  18.         }
  19.         // 性能得到了明显的提升!!
  20.         // 这种方案也不能避免读取汉字输出乱码的问题!!
  21.         is.close(); // 关闭流
  22.     }
  23. }
复制代码
需要我们注意的是:read(byte[] bytes)它的返回值,表现当前这一次读取的字节个数
  1. 也就是说,并不是每次读取的时候都把数组装满,比如数组是 byte[] bytes = new byte[3];
  2. 第一次调用read(bytes)读取了3个字节(分别是97,98,99),并且往数组中存,此时返回值就是3
  3. 第二次调用read(bytes)读取了2个字节(分别是99,100),并且往数组中存,此时返回值是2
  4. 第三次调用read(bytes)文件中后面已经没有数据了,此时返回值为-1
复制代码
还需要注意一个题目:采用一次读取多个字节的方式,也是可能有乱码的。因为也有可能读取到半个汉字的情况。
2.4 FileInputStream读取全部字节

我们可以一次性读取文件中的全部字节,然后把全部字节转换为一个字符串,就不会有乱码了。

  1. // 1、一次性读取完文件的全部字节到一个字节数组中去。
  2. // 创建一个字节输入流管道与源文件接通
  3. InputStream is = new FileInputStream("file-io-app\\src\\itheima03.txt");
  4. // 2、准备一个字节数组,大小与文件的大小正好一样大。
  5. File f = new File("file-io-app\\src\\itheima03.txt");
  6. long size = f.length();
  7. byte[] buffer = new byte[(int) size];
  8. int len = is.read(buffer);
  9. System.out.println(new String(buffer));
  10. //3、关闭流
  11. is.close();
复制代码

  1. // 1、一次性读取完文件的全部字节到一个字节数组中去。
  2. // 创建一个字节输入流管道与源文件接通
  3. InputStream is = new FileInputStream("file-io-app\\src\\itheima03.txt");
  4. //2、调用方法读取所有字节,返回一个存储所有字节的字节数组。
  5. byte[] buffer = is.readAllBytes();
  6. System.out.println(new String(buffer));
  7. //3、关闭流
  8. is.close();
复制代码
一次读取全部字节虽然可以办理乱码题目,但是文件不能过大,假如文件过大,可能导致内存溢出。
2.5 FileOutputStream写字节

往文件中写数据需要用到OutputStream下面的一个子类FileOutputStream。写输入的流程如下图所示

  1. 第一步:创建FileOutputStream文件字节输出流管道,与目标文件接通。
  2. 第二步:调用wirte()方法往文件中写数据
  3. 第三步:调用close()方法释放资源
复制代码
  1. /**
  2. * 目标:掌握文件字节输出流FileOutputStream的使用。
  3. */
  4. public class FileOutputStreamTest4 {
  5.     public static void main(String[] args) throws Exception {
  6.         // 1、创建一个字节输出流管道与目标文件接通。
  7.         // 覆盖管道:覆盖之前的数据
  8. //        OutputStream os =
  9. //                new FileOutputStream("file-io-app/src/itheima04out.txt");
  10.         // 追加数据的管道
  11.         OutputStream os =
  12.                 new FileOutputStream("file-io-app/src/itheima04out.txt", true);
  13.         // 2、开始写字节数据出去了
  14.         os.write(97); // 97就是一个字节,代表a
  15.         os.write('b'); // 'b'也是一个字节
  16.         // os.write('磊'); // [ooo] 默认只能写出去一个字节
  17.         byte[] bytes = "我爱你中国abc".getBytes();
  18.         os.write(bytes);
  19.         os.write(bytes, 0, 15);
  20.         // 换行符
  21.         os.write("\r\n".getBytes());
  22.         os.close(); // 关闭流
  23.     }
  24. }
复制代码

2.6 字节省复制文件

可以用这两种流共同起来使用,做一个文件复制的综合案例。
好比:我们要复制一张图片,从磁盘D:/resource/meinv.png的一个位置,复制到C:/data/meinv.png位置。
复制文件的思路如下图所示:
  1. 1.需要创建一个FileInputStream流与源文件接通,创建FileOutputStream与目标文件接通
  2. 2.然后创建一个数组,使用FileInputStream每次读取一个字节数组的数据,存如数组中
  3. 3.然后再使用FileOutputStream把字节数组中的有效元素,写入到目标文件中
复制代码
  1. /**
  2. * 目标:使用字节流完成对文件的复制操作。
  3. */
  4. public class CopyTest5 {
  5.     public static void main(String[] args) throws Exception {
  6.         // 需求:复制照片。
  7.         // 1、创建一个字节输入流管道与源文件接通
  8.         InputStream is = new FileInputStream("D:/resource/meinv.png");
  9.         // 2、创建一个字节输出流管道与目标文件接通。
  10.         OutputStream os = new FileOutputStream("C:/data/meinv.png");
  11.         System.out.println(10 / 0);
  12.         // 3、创建一个字节数组,负责转移字节数据。
  13.         byte[] buffer = new byte[1024]; // 1KB.
  14.         // 4、从字节输入流中读取字节数据,写出去到字节输出流中。读多少写出去多少。
  15.         int len; // 记住每次读取了多少个字节。
  16.         while ((len = is.read(buffer)) != -1){
  17.             os.write(buffer, 0, len);
  18.         }
  19.         os.close();
  20.         is.close();
  21.         System.out.println("复制完成!!");
  22.     }
  23. }
复制代码
三、IO流资源开释



3.1 JDK7以前的资源开释

在JDK7版本以前,我们可以使用try...catch...finally语句来处置处罚。格式如下
  1. try{
  2.     //有可能产生异常的代码
  3. }catch(异常类 e){
  4.     //处理异常的代码
  5. }finally{
  6.     //释放资源的代码
  7.     //finally里面的代码有一个特点,不管异常是否发生,finally里面的代码都会执行。
  8. }
复制代码
  1. public class Test2 {
  2.     public static void main(String[] args)  {
  3.         InputStream is = null;
  4.         OutputStream os = null;
  5.         try {
  6.             System.out.println(10 / 0);
  7.             // 1、创建一个字节输入流管道与源文件接通
  8.             is = new FileInputStream("file-io-app\\src\\itheima03.txt");
  9.             // 2、创建一个字节输出流管道与目标文件接通。
  10.             os = new FileOutputStream("file-io-app\\src\\itheima03copy.txt");
  11.             System.out.println(10 / 0);
  12.             // 3、创建一个字节数组,负责转移字节数据。
  13.             byte[] buffer = new byte[1024]; // 1KB.
  14.             // 4、从字节输入流中读取字节数据,写出去到字节输出流中。读多少写出去多少。
  15.             int len; // 记住每次读取了多少个字节。
  16.             while ((len = is.read(buffer)) != -1){
  17.                 os.write(buffer, 0, len);
  18.             }
  19.             System.out.println("复制完成!!");
  20.         } catch (IOException e) {
  21.             e.printStackTrace();
  22.         } finally {
  23.             // 释放资源的操作
  24.             try {
  25.                 if(os != null) os.close();
  26.             } catch (IOException e) {
  27.                 e.printStackTrace();
  28.             }
  29.             try {
  30.                 if(is != null) is.close();
  31.             } catch (IOException e) {
  32.                 e.printStackTrace();
  33.             }
  34.         }
  35.     }
  36. }
复制代码

3.2 JDK7以后的资源开释

  1. try(资源对象1; 资源对象2;){
  2.     使用资源的代码
  3. }catch(异常类 e){
  4.     处理异常的代码
  5. }
  6. //注意:注意到没有,这里没有释放资源的代码。它会自动是否资源
复制代码
代码如下:
  1. /**
  2. * 目标:掌握释放资源的方式:try-with-resource
  3. */
  4. public class Test3 {
  5.     public static void main(String[] args)  {
  6.             try (
  7.           // 1、创建一个字节输入流管道与源文件接通
  8.           InputStream is = new FileInputStream("D:/resource/meinv.png");
  9.           // 2、创建一个字节输出流管道与目标文件接通。
  10.           OutputStream os = new FileOutputStream("C:/data/meinv.png");
  11.         ){
  12.             // 3、创建一个字节数组,负责转移字节数据。
  13.             byte[] buffer = new byte[1024]; // 1KB.
  14.             // 4、从字节输入流中读取字节数据,写出去到字节输出流中。读多少写出去多少。
  15.             int len; // 记住每次读取了多少个字节。
  16.             while ((len = is.read(buffer)) != -1){
  17.                 os.write(buffer, 0, len);
  18.             }
  19.             System.out.println(conn);
  20.             System.out.println("复制完成!!");
  21.         } catch (Exception e) {
  22.             e.printStackTrace();
  23.         }
  24.     }
  25. }
复制代码








免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

何小豆儿在此

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表