數字和字母的國標碼如何填寫?如217如何填寫

時間 2021-08-30 10:14:42

1樓:承冷菱

漢字國標碼,建立於2023年,目的為了使每個漢字有一個全國統一的**而頒佈了漢字編碼的國家標準。每個漢字有個二進位制編碼,叫漢字國標碼。 在我國漢字**標準gb2312-80中有6763個常用漢字規定了二進位制編碼。

每個漢字有個二進位制編碼,叫漢字國標碼。

在我國漢字**標準gb2312-80中有6763個常用漢字規定了二進位制編碼。

每個漢字使用2個位元組。

gb2312-80 gb2312將**表分為94個區,對應第一位元組;每個區94個位,對應第二位元組,兩個位元組的值分別為區號值和位號值加32(20h)。01-09區為符號、數字區,16-87區為漢字區,10-15區、88-94區是有待進一步標準化的空白區。gb2312將收錄的漢字分成兩級:

第一級是常用漢字計 3755個,置於16-55區,按漢語拼音字母/筆形順序排列;第二級漢字是次常用漢字計3008個,置於56-87區,按部首/筆畫順序排列。故而 gb2312最多能表示6763個漢字。

2023年,為了使每個漢字有一個全國統一的**,我國頒佈了漢字編碼的國家標準:gb2312-80《資訊交換用漢字編碼字符集》基本集,這個字符集是我國中文資訊處理技術的發展基礎,也是目前國內所有漢字系統的統一標準。國標碼是一個四位十六進位制數,區位碼是一個四位的十進位制數,每個國標碼或區位碼都對應著一個唯一的漢字或符號,但因為十六進位制數我們很少用到,所以大家常用的是區位碼,它的前兩位叫做區碼,後兩位叫做位碼。

輸入碼、區位碼、國標碼與機內碼,這些詞對每一位computer fan 來說,可能都不陌生,但其中的聯絡與區別,可能就不那麼清楚了,下面就這問題講述一下,以饗讀者。

我們知道,鍵盤是當前微機的主要輸入裝置,輸入碼就是使用英文鍵盤輸入漢字時的編碼。目前,我國已推出的輸入碼有數百種,但使用者使用較多的約為十幾種,按輸入碼編碼的主要依據,大體可分為順序碼、音碼、形碼、音形碼四類,如“保”字,用全拼,輸入碼為“bao”,用區位碼,輸入碼為“1703 ”,用五筆字型則為“wks”。

計算機只識別由0、1組成的**,ascii碼是英文資訊處理的標準編碼,漢字資訊處理也必須有一個統一的標準編碼。我國國家標準局於2023年5月頒佈了《資訊交換用漢字編碼字符集——基本集》,代號為gb2312-80,共對6763個漢字和682個圖形字元進行了編碼,其編碼原則為:漢字用兩個位元組表示,每個位元組用七位碼(高位為0),;國家標準將漢字和圖形符號排列在一個94行94列的二維**表中,;每兩個位元組分別用兩位十進位制編碼,前位元組的編碼稱為區碼,後位元組的編碼稱為位碼,此即區位碼,如“保”字在二維**表中處於17區第3位,區位碼即為“1703 ”。

國標碼並不等於區位碼,它是由區位碼稍作轉換得到,其轉換方法為:先將十進位制區碼和位碼轉換為十六進位制的區碼和位碼,;這樣就得了一個與國標碼有一個相對位置差的**,;再將這個**的第一個位元組和第二個位元組分別加上20h,就得到國標碼。如:

“保”字的國標碼為3123h,它是經過下面的轉換得到的:1703d->1103h->+20h->3123h。國標碼是漢字資訊交換的標準編碼,但因其前後位元組的最高位為0,與ascii碼發生衝突,如“保”字,國標碼為31h和23h,而西文字元“1”和“#”的ascii也為31h和23h,現假如記憶體中有兩個位元組為31h和23h,這到底是一個漢字?

還是兩個西文字元“1”和“#”於是就出現了二義性,顯然,國標碼是不可能在計算機內部直接採用的,於是,漢字的機內碼採用變形國標碼,其變換方法為:將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1,其餘7位不變,如:由上面我們知道,“保”字的國標碼為3123,前位元組為00110001,後位元組為00100011,高位改1為10110001和10100011 即為b1a3,因此,漢字的機內碼就是b1a3h。

顯然,漢字機內碼的每個位元組都大於128,這就解決了與西文字元的ascii碼衝突的問題。 如上所述,漢字輸入碼、區位碼、國標碼與機內碼都是漢字的編碼形式,它們之間有著千絲萬縷的聯絡,但其間的區別也是不容忽視的。

希望我能幫助你解疑釋惑。

區位碼和國標碼怎樣轉換?

2樓:四舍**入

區位碼與國標碼轉換步驟如下:

1、區碼與位碼分別轉換成十六進位制數表示;

2、區位碼的十六進位制表示+2020h=國標碼。

以具字為例,具字的區位碼為:3063

1、將30轉換成16進製表示為:1e,63轉換成16進製表示為:3f,區位碼十六進位制數表示為:1e3fh

2、1e3fh+2020h=3e5fh

所以具字的國標碼為:3e5fh

區位碼的使用方法:

在dos下的各漢字系統中,同時按alt鍵和f1鍵即可呼叫區位碼輸入方法。而在windows中常用ctrl+空格鍵和ctrl+shift鍵調出區位碼。如“2901”代表“健”字,“4582”代表“萬”字,“8150”代表“楮”字,這些都是漢字。

用區位碼還可以輸入特殊符號,比如,“0189”代表“※”(符號),“0528”代表“ゼ”(日本語),“0711”代表“й”(俄文),“0949”代表“┭”(製表符)。

3樓:薔祀

(1)區位碼先轉換成十六進位制數表示;

(2)(區位碼的十六進位制表示)+2020h=國標碼;

(3)國標碼+8080h=機內碼

舉例:以漢字“大”為例,“大”字的區內碼為2083解:1、區號為20,位號為83

2、將區位號2083轉換為十六進位制表示為1453h3、1453h+2020h=3473h,得到國標碼3473h4、3473h+8080h=b4f3h,得到機內碼為b4f3h擴充套件資料

區位碼的使用方法:

在dos下的各漢字系統中,同時按alt鍵和f1鍵即可呼叫區位碼輸入方法。而在windows中常用ctrl+空格鍵和ctrl+shift鍵調出區位碼。如“2901”代表“健”字,“4582”代表“萬”字,“8150”代表“楮”字,這些都是漢字。

用區位碼還可以輸入特殊符號,比如,“0189”代表“※”(符號),“0528”代表“ゼ”(日本語),“0711”代表“й”(俄文),“0949”代表“┭”(製表符)。

在區位碼中,01-09區為特殊字元,10-55區為一級漢字(3755個最常用的漢字,按拼音字母的次序排列),56-87區為二級漢字(3008個漢字,按部首次序排列), 在區位碼漢字輸入方法中,漢字編碼無重碼。

4樓:神亦勝

區位碼和國標碼,如果你不知道怎麼轉換,可以問一問it專業的朋友,因為這個是他們常用的一個轉換功能。

5樓:來自貓耳灘負責的曉月

1.機內碼與區位碼

機內碼高位位元組=(區號)h+a0h

機內碼低位位元組=(位號)h+a0h

2.國標碼與區位碼

國標碼高位位元組=(區號)h+20h

國標碼低位位元組=(位號)h+20h

3.區位碼用兩個10進位制數表示,另外兩種碼用兩個十六進位制數表示.

4."德"的區位碼為2134,下面舉例來看如何轉成另外兩種碼:

a.機內碼

高位位元組=(21)(十進位制)+a0h(十六進位制)=15h+a0h=b5h

低位位元組=(34)(十進位制)+a0h(十六進位制)=22h+a0h=c2h

所以,機內碼為b5c2

b.國標碼

高位位元組=(21)(十進位制)+20h(十六進位制)=15h+20h=35h

低位位元組=(34)(十進位制)+20h(十六進位制)=22h+20h=42h

所以,國標碼為3542

6樓:匿名使用者

區位碼應該是用四個十進位制數表示吧?

計算機如何顯示英文字母和中國字

7樓:匿名使用者

一個漢字佔2個位元組,一個位元組佔8位,一個字母佔1個位元組。計算機中,各種資訊都是以二進位制編碼的形式存在的,不管是文字還是其它各種資訊,在計算機中都是以0和1組成的二進位制**表示的,之所以能區別這些資訊的不同,是因為它們採用的編碼規則不同。英文字母用的是單位元組的ascii碼,漢字採用的是雙位元組的漢字內碼

1、字元(英文,包括字母、數字、標點、運算子等)編碼

字元的編碼採用國際通用的ascii碼(american standard code for information interchange,美國資訊交換標準**),每個ascii碼以1個位元組(byte)儲存,從0到數字127代表不同的常用符號,例如大寫a的ascii碼是65,小寫a則是97。由於ascii碼只用了位元組的七個位,最高位並不使用,所以後來又將最高的一個位也編入這套編碼碼中,成為八個位的延伸ascii(extendedascii)碼,這套內碼加上了許多外文和**等特殊符號,成為目前常用的編碼。基本的ascii字符集共有128個字元,其中有96個可列印字元,包括常用的字母、數字、標點符號等,另外還有32個控制字元。

標準ascii碼使用7個二進位對字元進行編碼,對應的iso標準為iso646標準。

雖然標準ascii碼是7位編碼,但由於計算機基本處理單位為位元組(1byte = 8bit),所以一般仍以一個位元組來存放一個ascii字元。每一個位元組中多餘出來的一位(最高位)在計算機內部通常保持為0(在資料傳輸時可用作奇偶校驗位)。由於標準ascii字符集字元數目有限,在實際應用中往往無法滿足要求。

為此,國際標準化組織又制定了iso2022標準,它規定了在保持與iso646相容的前提下將ascii字符集擴充為8位**的統一方法。iso陸續制定了一批適用於不同地區的擴充ascii字符集,每種擴充ascii字符集分別可以擴充128個字元,這些擴充字元的編碼均為高位為1的8位**(即十進位制數128~255),稱為擴充套件ascii碼。

2、漢字的編碼

(1)漢字內碼

漢字資訊在計算機內部也是以二進位制方式存放。由於漢字數量多,用一個位元組的128種狀態不能全部表示出來,因此在2023年我國頒佈的《資訊交換用漢字編碼字符集——基本集》,即國家標準gb2312-80方案中規定用兩個位元組的十六位二進位制表示一個漢字,每個位元組都只使用低7位(與ascii碼相同),即有128×128=16384種狀態。由於ascii碼的34個控制**在漢字系統中也要使用,為不致發生衝突,不能作為漢字編碼,128除去34只剩94種,所以漢字編碼表的大小是94×94=8836,用以表示國標碼規定的7445個漢字和圖形符號。

每個漢字或圖形符號分別用兩位的十進位制區碼(行碼)和兩位的十進位制位碼(列碼)表示,不足的地方補0,組合起來就是區位碼。把區位碼按一定的規則轉換成的二進位制**叫做資訊交換碼(簡稱國標碼)。國標碼共有漢字6763個(一級漢字,是最常用的漢字,按漢語拼音字母順序排列,共3755個;二級漢字,屬於次常用漢字,按偏旁部首的筆劃順序排列,共3008個),數字、字母、符號等682個,共7445個。

由於國標碼不能直接儲存在計算機內,為方便計算機內部處理和儲存漢字,又區別於ascii碼,將國標碼中的每個位元組在最高位改設為1,這樣就形成了在計算機內部用來進行漢字的儲存、運算的編碼叫機內碼(或漢字內碼,或內碼)。內碼既與國標碼有簡單的對應關係,易於轉換,又與ascii碼有明顯的區別,且有統一的標準(內碼是惟一的)。

(2)漢字外碼

無論是區位碼或國標碼都不利於輸入漢字,為方便漢字的輸入而制定的漢字編碼,稱為漢字輸入碼。漢字輸入碼屬於外碼。不同的輸入方法,形成了不同的漢字外碼。常見的輸入法有以下幾類:

按漢字的排列順序形成的編碼(流水碼):如區位碼;

按漢字的讀音形成的編碼(音碼):如全拼、簡拼、雙拼等;

按漢字的字形形成的編碼(形碼):如五筆字型、鄭碼等;

按漢字的音、形結合形成的編碼(音形碼):如自然碼、智慧abc。

輸入碼在計算機中必須轉換成機內碼,才能進行儲存和處理。

(3)漢字字形碼

為了將漢字在顯示器或印表機上輸出,把漢字按圖形符號設計成點陣圖,就得到了相應的點陣**(字形碼)。全部漢字字碼的集合叫漢字字型檔。漢字型檔可分為軟字型檔和硬字型檔。

軟字型檔以檔案的形式存放在硬碟上,現多用這種方式,硬字型檔則將字型檔固化在一個單獨的儲存晶片中,再和其它必要的器件組成介面卡,插接在計算機上,通常稱為漢卡。

用於顯示的字型檔叫顯示字型檔。顯示一個漢字一般採用16×16點陣或24×24點陣或48×48點陣。已知漢字點陣的大小,可以計算出儲存一個漢字所需佔用的位元組空間。

例:用16×16點陣表示一個漢字,就是將每個漢字用16行,每行16個點表示,一個點需要1位二進位制**,16個點需用16位二進位制**(即2個位元組),共16行,所以需要16行×2位元組/行=32位元組,即16×16點陣表示一個漢字,字形碼需用32位元組。

即:位元組數=點陣行數×點陣列數/8

用於列印的字型檔叫列印字型檔,其中的漢字比顯示字型檔多,而且工作時也不像顯示字型檔需調入記憶體。

可以這樣理解,為在計算機內表示漢字而統一的編碼方式形成漢字編碼叫內碼(如國標碼),內碼是惟一的。為方便漢字輸入而形成的漢字編碼為輸入碼,屬於漢字的外碼,輸入碼因編碼方式不同而不同,是多種多樣的。為顯示和列印輸出漢字而形成的漢字編碼為字形碼,計算機通過漢字內碼在字模庫中找出漢字的字形碼,實現其轉換。

機內碼與國標碼區別,機內碼和國標碼如何轉換?

1 機外碼就是你外界輸入的字元,這個字元輸入後會有一個相對應的區位碼 就是一個94 94的棋盤格格,你輸入的漢子會對應裡面的一個格子,行 列就是我們這裡的區 位 2 區位碼經過換算可以變成國標碼 所以區位碼 國標碼這一步只是表示轉換下而已 3 國標碼再經過換算可以變成機內碼 一般是16進位制數表示 ...

已知漢字 家 的區位碼是2850,國標碼是多少

家 的國標碼為 3c52h 家的拼音 ji 釋義 1 共同生活的眷屬和他們所住的地方 家庭。家眷。家長 zh ng 家園。家譜。家塾。家鄉。家風。家訓。家規。家喻戶曉。如數家珍。2 家庭所在的地方 回家。老家。安家。3 居住 可以家焉 4 對人稱自己的尊長 親屬 家祖。家父。家翁。家母。家慈。5 家...

高手請進 EXCEL如何自動識別數字和字母,並自動取位數

陣列函式,三鍵結束 mid left a1,len a1 1 min find left a1,len a1 1 0123456789 len left a1,len a1 1 回覆 paulf101 你原來沒說有這種情況啊,稍改一下就行了,思路是一樣的 left mid a1,min find a...