1. 伯乐范文网 > 知识库 >

区位码输入法的最大优点是,计算机常用的信息编码有哪几种?

本文目录索引

1,计算机常用的信息编码有哪几种?

计算机常用的编码有:ASCII码,汉字编码等 字符编码就是以二进制的数字来对应字符集的字符,目前用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。 汉字进入计算机的三种途径: ①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。 ②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。 ③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。 以上内容参考:百度百科-汉字编码

计算机常用的信息编码有哪几种?

2,计算机常用的信息编码有哪几种

信息编码(Information Coding)是为了方便信息的存储、检索和使用,在进行信息处理时赋予信息元素以代码的过程。即用不同的代码与各种信息中的基本单位组成部分建立一一对应的关系。信息编码必须标准、系统化,设计合理的编码系统是关系信息管理系统生命力的重要因素。

一般应有的代码有两类,一类是有意义的代码,即赋予代码一定的实际意义,便于分类处理;一类是无意义的代码,仅仅是赋予信息元素唯一的代号,便于对信息的操作。常用的代码类型有:

(1)顺序码,即接信息元素的顺序依次编码;

(2)区间码,即用一代码区间代表某一信息组;

(3)记忆码,即能帮助联想记忆的代码。

3,简述 汉字输入码,汉字内码,汉字字形码,汉字交换码区别

计算机中信息的编码
在计算机中,各种信息都是以二进制编码的形式存在的;也就是说,不管是文字、图形、声音、动画,还是电影等各种信息,在计算机中都是以0和1组成的二进制代码表示的;计算机之所以能区别这些信息的不同,是因为它们采用的编码规则不同。比如:同样是文字,英文字母与汉字的编码规则就不同,英文字母用的是单字节的ASCII码,汉字采用的是双字节的汉字内码;但随着需求的变化,这两种编码有被统一的UNICODE码(由Unicode 协会开发的能表示几乎世界上所有书写语言的字符编码标准)所取代的趋势;当然图形、声音等的编码就更复杂多样了。这也就告诉我们,信息在计算机中的二进制编码是一个不断发展的、高深的、跨学科的知识领域。
1、字符(英文,包括字母、数字、标点、运算符等)编码
字符的编码采用国际通用的ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码),每个ASCII码以1个字节(Byte)储存,从0到数字127代表不同的常用符号,例如大写A的ASCII码是65,小写a则是97。由于ASCII码只用了字节的七个位,最高位并不使用,所以后来又将最高的一个位也编入这套编码码中,成为八个位的延伸ASCII(ExtendedASCII)码,这套内码加上了许多外文和表格等特殊符号,成为目前常用的编码。基本的ASCII字符集共有128个字符,其中有96个可打印字符,包括常用的字母、数字、标点符号等,另外还有32个控制字符。标准ASCII码使用7个二进位对字符进行编码,对应的ISO标准为ISO646标准。下表展示了基本ASCII字符集及其编码:
字母和数字的ASCII码的记忆是非常简单的。我们只要记住了一个字母或数字的ASCII码(例如记住A为65,0的ASCII码为48),知道相应的大小写字母之间差32,就可以推算出其余字母、数字的ASCII码。
虽然标准ASCII码是7位编码,但由于计算机基本处理单位为字节(1byte = 8bit),所以一般仍以一个字节来存放一个ASCII字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为0(在数据传输时可用作奇偶校验位)。由于标准ASCII字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了ISO2022标准,它规定了在保持与ISO646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每种扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均为高位为1的8位代码(即十进制数128~255),称为扩展ASCII码。下表展示的是最流行的一套扩展ASCII字符集和编码:
2、汉字的编码
(1)汉字内码
汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的128种状态不能全部表示出来,因此在1980年我国颁布的《信息交换用汉字编码字符集——基本集》,即国家标准GB2312-80方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低7位(与ASCII码相同),即有128×128=16384种状态。由于ASCII码的34个控制代码在汉字系统中也要使用,为不致发生冲突,不能作为汉字编码,128除去34只剩94种,所以汉字编码表的大小是94×94=8836,用以表示国标码规定的7445个汉字和图形符号。
每个汉字或图形符号分别用两位的十进制区码(行码)和两位的十进制位码(列码)表示,不足的地方补0,组合起来就是区位码。把区位码按一定的规则转换成的二进制代码叫做信息交换码(简称国标码)。国标码共有汉字6763个(一级汉字,是最常用的汉字,按汉语拼音字母顺序排列,共3755个;二级汉字,属于次常用汉字,按偏旁部首的笔划顺序排列,共3008个),数字、字母、符号等682个,共7445个。
由于国标码不能直接存储在计算机内,为方便计算机内部处理和存储汉字,又区别于ASCII码,将国标码中的每个字节在最高位改设为1,这样就形成了在计算机内部用来进行汉字的存储、运算的编码叫机内码(或汉字内码,或内码)。内码既与国标码有简单的对应关系,易于转换,又与ASCII码有明显的区别,且有统一的标准(内码是惟一的)。

(2)汉字外码
无论是区位码或国标码都不利于输入汉字,为方便汉字的输入而制定的汉字编码,称为汉字输入码。汉字输入码属于外码。不同的输入方法,形成了不同的汉字外码。常见的输入法有以下几类:
按汉字的排列顺序形成的编码(流水码):如区位码;
按汉字的读音形成的编码(音码):如全拼、简拼、双拼等;
按汉字的字形形成的编码(形码):如五笔字型、郑码等;
按汉字的音、形结合形成的编码(音形码):如自然码、智能ABC。
输入码在计算机中必须转换成机内码,才能进行存储和处理。

(3)汉字字形码
为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。
全部汉字字码的集合叫汉字字库。汉字库可分为软字库和硬字库。软字库以文件的形式存放在硬盘上,现多用这种方式,硬字库则将字库固化在一个单独的存储芯片中,再和其它必要的器件组成接口卡,插接在计算机上,通常称为汉卡。
用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。例:用16×16点阵表示一个汉字,就是将每个汉字用16行,每行16个点表示,一个点需要1位二进制代码,16个点需用16位二进制代码(即2个字节),共16行,所以需要16行×2字节/行=32字节,即16×16点阵表示一个汉字,字形码需用32字节。
即:字节数=点阵行数×点阵列数/8
用于打印的字库叫打印字库,其中的汉字比显示字库多,而且工作时也不像显示字库需调入内存。
可以这样理解,为在计算机内表示汉字而统一的编码方式形成汉字编码叫内码(如国标码),内码是惟一的。为方便汉字输入而形成的汉字编码为输入码,属于汉字的外码,输入码因编码方式不同而不同,是多种多样的。为显示和打印输出汉字而形成的汉字编码为字形码,计算机通过汉字内码在字模库中找出汉字的字形码,实现其转换。
例1:已知汉字"春"的国标码为343AH,求其机内码?
机内码=国标码+8080H=343AH+8080H=B4BAH
例2:用24×24点阵来表示一个汉字(一点为一个二进制位),则2000个汉字需要多少KB容量?
(24×24/8)×2000/1024=140.7KB≈141KB

4,汉字的输入码、交换码、机内码、输出码的作用分别是什么?

汉字机内码(内码)(汉字存储码)的作用是统一了各种不同的汉字输入码在计算机内部的表示。 在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码。 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。 为了将汉字的各种输入码在计算机内部统一起来,就有了专用于计算机内部存储汉字使用的汉字机内码,用以将输入时使用的多种汉字输入码统一转换成汉字机内码进行存储,以方便机内的汉字处理汉字机内码是在计算机内部存储、处理的代码。 计算机既要处理汉字,又要处理英文。因此计算机必须能区别汉字字符和英文字符。英文字符的的机内码是最高为为 0的8位ASCII码。为了不与7位ASCII码发生冲突,把国标码每个字节的最高位由0改为1,其余位不变的编码作为汉字字符的机内码。 汉字机内码的范围用二进制表示是: 10100001 10100001 11111110 11111110 机内码的高位和低位比对应的国标码的高位和低位大(128)10或(10000000)2或(80)H 即: 机内码高位 = 国标码高位 + 80H 机内码低位 = 国标码低位 + 80H 又因为: 国标码高位 = 区码 + 20H 国标码低位 = 位码 + 20H 所以: 机内码高位 = 区码 + A0H 机内码低位 = 位码 + A0H 也就是说,机内码高位和机内码低位分别比对应的区码和位码大(160)10或(10100000)2或 (A0)H 例如:汉字"啊"的区位码为"1601",其中区码为(16)10或(10)H,位码为(01)10或(01)H。则: 机内码高位 = 10H + A0H = B0H 机内码低位 = 01H + A0H = A1H 所以: 机内码= B0A1H 3) 汉字输入码(外码) 汉字输入码(外码)是为了通过键盘字符把汉字输入计算机而设计的一种编码。英文输入时,相输入什么字符便按什么键,输入码和机内码一致。汉字输入时,可能要按几个键才能输入一个汉字。汉字输入方案有成百上千个,但是这千差万别的外码输入进计算机后都会转换成统一的内码。汉字输入方案大致可分为以下4种类型: (1) 音码:如全拼、双拼、微软拼音等 (2) 形码:如五笔字型、郑码、表形码等 (3)音形码:如智能ABC、自然码等 (4) 数字码:如区位码、电报码等 4) 汉字字形码(输出码) 汉字字形码(输出码)用于汉字的显示和打印,是汉字字形的数字化信息。汉字的内码是用数字代码来表示汉字,但是为了在输出时让人们看到汉字,就必须输出汉字的字形。 在汉字系统中,一般采用点阵来表示字形。 16 *16汉字点阵示意 16 * 16点阵字形的字要使用32个字节(16 * 16/8= 32)存储,24 * 24点阵字形的字要使用72个字节(24 * 24/8=72)存储。 一般来说,表现汉字时使用的点阵越大,则汉字字形的质量也越好,当然每个汉字点阵所需的存储量也越大。

5,什么是区位输入法?

区位输入法是利用区位码进行汉字输入的一种方法,又叫内码输入法。汉字区位码是一个四位的十进制数,属于流水码,不按字的音和形排列每个区位码都对应着一个唯一的汉字或符号,它的前两位叫做区号(或称“区码”),后两位叫做位号(或称“位码”)。例如,“宝”字的区位编码为1706,输入数字1706,就输入了“宝”字。这种数字也是有含义的,它们与每个汉字或字母符号所在的区和位是一一对应的。在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常用于录入特殊符号,如制表符、希腊字母等。所以说这种输入法只能供研究用,没有实用价值,建议大家不要学这种输入法,费时费力。若是遇到特殊情况,如需输入发音、字形不规则的汉字、生僻字时,区位输入法便能派上用场了。

6,郑码输入法的编码规则

第一条:要按照《郑码》的基本字根总表上所列出的基根(包括形近根),把汉字分解成基本字根才能编码。如果没有合适的基根,就要进一步分解成笔画。例如:补--衤卜恳--艮心滤--氵虍心书--乛丨丶第二条:汉字分解后,基根和笔画排列的顺序叫做“根序”。根序的确定有三种情况:l.左右字、上下字以及由单笔画组成的字,根序与规范的书写顺序一致(见上例中的“补、恳、滤、书”四个字的分解)2.具有相接、交叉和相嵌结构的字,第一笔先写的基根或笔画排列在前。例如:([]方括号内是例字)相接结构的字:夭--丿大[沃笑];疋--乛止[蛋疏];交叉结构的字:束--木口[整辣];夷--大弓[姨];屯--七凵[纯钝吨];相嵌结构的字:亘--二曰[桓恒];佥--人二(横三点)[检验]渊--氵(撇-竖)米;肃--肀(撇-竖)八[萧箫]复合结构的字:决--冫乛大[缺炔](又有相接又有相交);3.对于包围字和包孕字,要将第一笔先写的基根排在第一位。因为是以基根为单位排列根序。例如:困—囗木 闻—门耳 函—乛氺凵 式—弋工载—车 库—广车 匦—匚车九 赵—走乂但是,为了检索的快捷和归纳的划一,对于有“辶、廴”的字,确定根序时,要将“辶、廴”排列在第一位。例如:“达—辶大”、“延—廴丿止”。总之,给单字或词语编码,就是按照编码规则依次取基根的代码组成字词的编码。根序搞错编码也随之而错。因此,正确认识单字的根序十分重要。第三条:单字和词语的编码不能超过4个字母,因此要根据单字或词语中基根数的多少决定基根代码的取舍,这种取舍代码的方法叫取码方法(详见以下说明)。

7,向大家请教搜狗输入法双拼码的编码规则

[声母]
ch=I
sh=U
zh=V
empty=O

[韵母]
ai=L
an=J
ang=H
ao=K
ei=Z
en=F
eng=G
er=R
ia=W
ian=M
iang=D
iao=C
ie=X
in=N
ing=;
iong=S
iu=Q
ong=S
ou=B
ua=W
uai=Y
uan=R
uang=D
ue=T
ui=V
un=P
uo=O
v=y
ve=T

[零声母音节的韵母]
a=OA
ai=OL
an=OJ
ang=OH
ao=OK
e=OE
ei=OZ
en=OF
;eng=OG
er=OR
o=OO
ou=OB

8,区位码输入法怎么用

区位输入法是利用区位码进行汉字输入的一种方法,又叫内码输入法。汉字区位码是一个四位的十进制数,属于流水码,不按字的音和形排列每个区位码都对应着一个唯一的汉字或符号,它的前两位叫做区号(或称“区码”),后两位叫做位号(或称“位码”)。例如,“宝”字的区位编码为1706,输入数字1706,就输入了“宝”字。这种数字也是有含义的,它们与每个汉字或字母符号所在的区和位是一一对应的。在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常用于录入特殊符号,如制表符、希腊字母等。所以说这种输入法只能供研究用,没有实用价值,建议大家不要学这种输入法,费时费力。若是遇到特殊情况,如需输入发音、字形不规则的汉字、生僻字时,区位输入法便能派上用场了。   附 汉字区位表(GB2312):    http://mail.chinahome.org/whois/hzqw.php

9,区位码输入法的最大的优点是?

区位码输入法的最大的优点是(B)一字一码,无重码 区位码输入是利用国标码作为汉字编码,每个国标码对应一个汉字或一个符号,没有重码,码长为4,这就是区位码输入法的最大的优点,一字一码,无重码。 区位码输入法只要直接从键盘中输入4个由十进制数(0~9)的区位码即可输入汉字。在输入过程中当第四个数字输入后,在编辑屏幕的插入点立即显示出所键人的区位码所代表的汉字。 扩展资料 区位码是每种汉字系统必备的输入方法,这些汉字、字母、图形符号分为以下几种: 国标GB2312-80中所规定的一级汉字3755个,二级汉字3008个,共6763个; 间隔符、标点、运算符、制表符、单位符等各种符号202个; 序号60个[⒈~⒛、⑴~⒇、①~⑩、(一)~(十)]; 数字22个(0~9、 Ⅰ~Ⅻ); 英文字母大小写,共52个; 日文假名169个(平假名83个,片假名86个); 希腊字母大小写,共48个; 俄文字母大小写,共66个; 汉语拼音字母37个; 汉语拼音符号26个。 参考资料:百度百科 - 区位输入法