Java中char[] 和 String 类型占用字节大小问题
作者:威威喵 原文链接:https://blog.csdn.net/smile_Running/article/details/87211916
在 C 语言中
1、char a[10] = {"China"} 中,这个 a 占用多少字节?
答:占用 10 个字节。
解析:上面代码对 a 做了赋值的操作,
a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]='a' ,a[5]='\0',a[6]='\0',a[7]='\0',a[8]='\0',a[9]='\0'
所以,它占用的是 10 个字节。
2、如果单指 ”China“ ?
答:共 6 个字节。China 占 5 个字节,最后以 '\0' 结束,占 1 个字节。
在 Java 语言中
1、String s = "China"; 占多少字节?
答:占 5 个字节。
System.out.println(Charset.defaultCharset());//获取ide默认编码类型
String s = new String("China".getBytes());
byte[] b = s.getBytes();
System.out.println("" + b.length);
以上代码,可以输出 "China" 所占的字节长度为 5
2、String s = "中国"; 占多少字节?
答:如果是 汉字 的情况需要考虑编码。
(1)GBK 编码(ide默认)时,每一个汉字占用 2 个字节,那么中国占 4 个字节。
(2)UTF-8 编码时,每一个汉字占用 3 个字节,那么中国占用 6 个字节。
3、转码问题,GBK 转 UTF-8 时,字节占用会变大吗?反过来呢?
//获取的是 UTF-8编码
System.out.println(Charset.defaultCharset());
String s;
try {
s = new String("中国".getBytes(),"GBK");
byte[] b = s.getBytes();
System.out.println("" + b.length);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
如上代码是:UTF-8 转 GBK 编码格式,s 长度从 6 字节变为 9 字节。
s 内容变化:中国 ―> 涓???
因为当前编码是 UTF-8,转码之后变成了 3 个文字,占用 9 个字节。然而,反过来的情况是这样的:
中国 (gbk) ―> ?й? (utf-8)
s 长度从 4字节 变成了 4字节,虽然长度没发生改变,但是文字已经改变。这里的 ? 占用 1 个字节。
上一篇:java实现屏蔽词功能
栏 目:JAVA代码
下一篇:将List集合中的map对象转为List<对象>形式实例代码
本文标题:Java中char[] 和 String 类型占用字节大小问题
本文地址:http://www.codeinn.net/misctech/59927.html


阅读排行
- 1Java Swing组件BoxLayout布局用法示例
- 2java中-jar 与nohup的对比
- 3Java邮件发送程序(可以同时发给多个地址、可以带附件)
- 4Caused by: java.lang.ClassNotFoundException: org.objectweb.asm.Type异常
- 5Java中自定义异常详解及实例代码
- 6深入理解Java中的克隆
- 7java读取excel文件的两种方法
- 8解析SpringSecurity+JWT认证流程实现
- 9spring boot里增加表单验证hibernate-validator并在freemarker模板里显示错误信息(推荐)
- 10深入解析java虚拟机




