CRYPTO个人总结

打印 上一主题 下一主题

主题 833|帖子 833|积分 2499

Base系列编码浅析

Base编码有很多种,常用的有:base16   base32   base64   base85  base36  base 58  base91  base 92   base62Base16


  • 使用16个ASCII可打印字符(数字0-9和字母A-F),对任意字节数据进行编码。
  • 先获取输入字符串每个字节的二进制值(不足8比特在高位补0),然后将其串联进来,再按照4比特一组进行切分,将每组二进制数分别转换成十进制。
  • Base16编码后的数据量是原数据的两倍:1000比特数据需要250个字符(即 250*8=2000 比特)。

:可以看到8比特数据按照4比特切分刚好是两组,所以Base16不可能用到填充符号“=”。  换句话说:Base16使用两个ASCII字符去编码原数据中的一个字节数据。  Base16编码是一个标准的十六进制字符串(注意是字符串而不是数值),更易被人类和计算机使用,因为它并不包含任何控制字符,以及Base64和Base32中的“=”符号。Base32


  •  Base32编码使用32个可打印字符(字母A-Z和数字2-7)对任意字节数据进行编码的方案,编码后的字符串不用区分大小写并排除了容易混淆的字符,可以方便地由人类使用并由计算机处理。
  •    Base32主要用于编码二进制数据,但是Base32也能够编码诸如ASCII之类的二进制文本。
  •    Base32将任意字符串按照字节进行切分,并将每个字节对应的二进制值(不足8比特高位补0)串联起来,按照5比特一组进行切分,并将每组二进制值转换成十进制来对应32个可打印字符中的一个。

由于数据的二进制传输是按照8比特一组进行(即一个字节),因此Base32按5比特切分的二进制数据必须是40比特的倍数(5和8的最小公倍数)。
 
  例如输入单字节字符“%”,它对应的二进制值是“100101”,前面补两个0变成“00100101”(二进制值不足8比特的都要在高位加0直到8比特),从左侧开始按照5比特切分成两组:“00100”和“101”,后一组不足5比特,则在末尾填充0直到5比特,变成“00100”和“10100”,这两组二进制数分别转换成十进制数,通过上述表格即可找到其对应的可打印字符“E”和“U”,但是这里只用到两组共10比特,还差30比特达到40比特,按照5比特一组还需6组,则在末尾填充6个“=”。填充“=”符号的作用是方便一些程序的标准化运行,大多数情况下不添加也无关紧要,而且,在URL中使用时必须去掉“=”符号。
Base64


  • Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于,所以每6个比特为一个单元,对应某个可打印字符。3个字节有24个比特,对应于4个Base64单元,即3个字节可由4个可打印字符来表示。
  •  在Base64中的可打印字符包括字母A-Z、a-z、数字0-9,这样共有62个字符,此外两个可打印符号在不同的系统中而不同。一些如uuencode的其他编码方法。
  •  它可用来作为电子邮件的传输编码。
  •  Base64常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据,包括MIME的电子邮件及XML的一些复杂数据。

注:BinHex的版本使用不同的64字符集来代表6个二进制数字,但是不被称为Base64。
 
  如果要编码的字节数不能被3整除,最后会多出1个或2个字节,那么可以使用下面的方法进行处理:
 
    (1)先使用0字节值在末尾补足,使其能够被3整除,然后再进行Base64的编码。
       (2)在编码后的Base64文本后加上一个或两个=号,代表补足的字节数。
 
  也就是说:
    当最后剩余两个八位(待补足)字节(2个byte)时,最后一个6位的Base64字节块有四位是0值,最后附加上两个等号;
    如果最后剩余一个八位(待补足)字节(1个byte)时,最后一个6位的base字节块有两位是0值,最后附加一个等号。 
 
参考下表:

Base85


  • base85 也称为Ascii85,是Paul E. Rutter为btoa实用程序开发的一种二进制文本编码形式。通过使用五个ASCII字符来表示四个字节的二进制数据(使编码量1 / 4比原来大,假设每ASCII字符8个比特),它比更有效UUENCODE或Base64的,它使用四个字符来表示三个字节的数据(1 / 3的增加,假设每ASCII字符8个比特)。
  • 用途是Adobe的PostScript和Portable Document Format文件格式,以及Git使用的二进制文件的补丁编码。
  • 与Base64一样,Base85编码的目标是对二进制数据可打印的ASCII字符进行编码。但是它使用了更大的字符集,因此效率更高一些。具体来说,它可以用5个字符编码4个字节(32位)。
摘自wiki介绍的一个例子: Base36

Base36是一个二进制到文本编码表示方案的二进制数据以ASCII通过将其转化为一个字符串格式基数 -36表示。选择36十分方便,因为可以使用阿拉伯数字 0–9和拉丁字母 A–Z [1](ISO基本拉丁字母)表示数字。
每个base36位需要少于6位的信息来表示。
摘自wiki的一个例子:
  有符号的32位和64位整数分别最多只能容纳6个或13个base-36位数字(许多base-36位数字可能会使32位和64位整数溢出)。
  例如,在base-36中,“ 922337203685477575807 ” 的64位带符号整数最大值为“ 1Y2P0IJ32E8E7 ”。
  类似地,在base-36中,“ 2147483647 ” 的32位带符号整数最大值为“ ZIK0ZJ ”。
用于从BASE10编码BASE36的Python代码
  1. def base36encode(integer):
  2.     chars = '0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'
  3.    
  4.      sign = '-' if integer < 0 else ''
  5.      integer = abs(integer)
  6.      result = ''
  7.      while integer > 0:
  8.          integer, remainder = divmod(integer, 36)
  9.          result = chars[remainder]+result
  10.       return sign+result
复制代码
Base58


  • Base58是用于Bitcoin中使用的一种独特的编码方式,主要用于产生Bitcoin的钱包地址。
  • 相比Base64,Base58不使用数字"0",字母大写"O",字母大写"I",和字母小写"l",以及"+"和"/"符号
设计Base58主要的目的是:

  • 避免混淆。在某些字体下,数字0和字母大写O,以及字母大写I和字母小写l会非常相似。
  • 不使用"+"和"/"的原因是非字母或数字的字符串作为帐号较难被接受。
  • 没有标点符号,通常不会被从中间分行。
  • 大部分的软件支持双击选择整个字符串。

Base91

顾名思义,base91需要91个字符来表示ASCII编码的二进制数据。 从94个可打印ASCII字符(0x21-0x7E)中,以下三个字符被省略以构建base91字母:     -(破折号,0x2D)    \(反斜杠,0x5C)    '(撇号,0x27)

  •     basE91是将二进制数据编码为ASCII字符的高级方法。 
  •     它类似于UUencode或base64,但效率更高。 basE91产生的开销取决于输入数据。 它的数量最多为23%(而base64为33%),范围可以降低到14%,通常发生在0字节块上。 
  •     这使得basE91对于通过二进制不安全连接(例如电子邮件或终端线)传输较大的文件非常有用。
转换表由其余字符组成,如下所示。Base92

有关Base92的资料实在是很少,可参考这一篇博客:https://thenoviceoof.com/blog/projects/base92/
Base62


  • Base62编码将数字转换为ASCII字符串(0-9,az和AZ),反之亦然,这通常会导致字符串较短。
               26个小写字母+26个大写字母+10个数字=62 (1)62进制与10进制的互相转化

  • 62进制转10进制与2进制转10进制相似。
     2进制转10进制过程为: 从右到左用二进制的每个数去乘以2的相应次方,次方要从0开始。     62进制转10进制也类似,从右往左每个数*62的N次方,N从0开始。   那么,10进制转62进制也与10进制转2进制类似。  即:不断除以62取余数,然后倒序。 (2)关于短Url的转换 主要思路,维护一个全局自增的id,每来一个长url,将其与一个自增id绑定,然后利用base62将该自增id转换为base62字符串,即完成转换。 
Base100

也就是表情符
解码网址:https://aghorler.github.io/emoji-aes/

了解完简单base家族之后,来给大家总结一下常见编码。。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

写过一篇

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表