:: wikimiki.org ::
| 编码 |
编码加密学:有关“编码”和“密码”
编码在加密学中的应用已久。编码可将一条信息的内容/意义转换成与真实内容毫不相干的伪内容,从而在传输中可以防止非收信人理解的真实的信息。编码常用的手段是使用“密码本”进行对译。在密码本中,常用短语、词汇与另一些短语、词汇建立一一对应的关系。因此,没有密码本的人收到编码过的信息后,只能看到一些与真实内容无关的伪信息,或者完全没有意义的乱码。电报码就是常用的一种编码。
“编码”经常与“密码”混淆。
这两个词可以依据它们各自的适用范围加以区分。编码的目的在于设定一套规则(密码本),使有意义的信息与伪信息得以互化,与保密与否无关。例如,大多数电报码并不以保密为目的,电报的意义仅在于降低传递信息的成本。编码作用于“语义层”,即单词、短语的转化。在电报码中,单词可以用较少的字符数表达。但是如果信息的发送者只希望特定的收件人看明白内容,而不是所有接收到信息的人都看明白,这样编码中的对译规则就不应被所有人掌握。这时的对译规则(密码本)是秘密的,这种编码就是“加密的编码”。
与“编码”不同,“密码”的目的并不在于信息意义的转换。“编码”可以将“攻击”一词转换成“FRGPL”或“馅饼”,“密码”则作用在“语义层”之下。比如,可以将字母“a”转换成“Q”,也可以第一个“t”变成“f”,第二个“t”变成“3”,等等。有些情况下,“密码”比“编码”更方便,因为“密码”无需反复查询密码本。
“编码”曾一度被认为比“加密”更为安全,因为据认为只要密码本编制合理、保密工作正常,编码过的内容就不大可能通过穷举法、反复对比法等方法而加以破解。如今,随着自动信息处理机器(比如电子计算机)的出现和广泛应用,这种观点已不再成立,“密码”已占据加密学中的主导地位。
----
“编码”在互联网上十分常用。目前常用的汉字编码主要有“GB 2312”(GB为“国(家)标(准)”的缩写),“HZ”,“Big5”,“Unicode”(UTF)等。如果网页浏览器的网页编码选择不正确,将会看到网页上堆满了乱码。
category:信號處理
category:資訊科學
密码密码是一种用来混淆的技术,它希望将正常的(可识别的)信息转变为无法识别的信息。当然,对一小部分人来说,这种无法识别的信息是可以再加工并恢复的。參見密碼學。
密码在中文里是“口令”(password)的通称。登录网站、电子邮箱和银行取款时输入的“密码”其实严格来讲应该仅被称作“口令”,因为它不是本来意义上的“加密代码”。
category:密码学
ja:パスワード
乱码乱码(mojibake)指的是電腦系統不能顯示正確的字符,而顯示其他無意義的字符或空白,如一堆ASCII Code。这样所顯示出來的文字統稱為亂碼。乱码是因为所使用的字符的源码在本地计算机上使用了错误的显示字库,或在本地计算机的字库中找不到相应于源码所指代的字符所致。不同国家和地区的文字字库采用了相同的一段源码,或是源文件中因为文件受到破坏,致使计算机默认提取的源码错误,或是计算机没有安装相应字库,都有可能产生乱码。
可能的產生原因
1 一般是軟件程序解碼錯誤。如瀏覽器把GBK碼當成是Big5碼顯示出來, 或電子郵件程序把對方傳來的郵件錯誤解碼。如果在發送時編碼錯誤, 收件者的電郵程序是不能解碼的, 必需要寄件者的電郵程序重新編碼再寄。
2 字體檔案不對。
3 來源編碼錯誤, 或文件受到破壞。
可能的解決方法
1 嘗試去轉換編碼。一般可試Big5、GBK、UTF8三種, 如涉及的不是中文, 可以再試JIS(日文)、KR(韓文)及其他文字編碼。徹底的解決方法是雙方使用同一編碼系統, 如UTF8(Unicode的一種應用方式, 包括世界上主要的文字), 只要用戶有對應的字體檔案就可以正確的顯示出來。實際上要統一編碼系統還要克服各種客觀的困難, 現時只有靠軟件有更高的解碼能力。
2 轉換字體。如果解碼正確而出現錯誤文字, 有可能是字體檔案中沒有相對應的字符, 可嘗試轉換字體檔案。
3 如果本來出漢字的變成數字如最 欣 賞 相 中 拉(這些是Unicode), 可以把這部分抄出來, 獨立存儲成.html檔, 再用瀏覽器打開即可解碼。
4 其他。有時解碼的方法要視乎軟件和實際環境, 及不斷嘗試才能解碼, 特別在不知本來是用哪種編碼系統時。
其他
1 有時輸入漢字時也會出現亂碼, 不過這種情況很少出現。最大的原因是輸入法所用的編碼, 經編輯器輸出的字體編碼不符所致, 可嘗試轉換字體來解決。例如把GBK編碼的輸入法裝到只支援Big5的系統上, 是不能正確顯字所輸入的字的; 必需選擇Big5編碼的輸入法, 或把輸入法裝到GBK的系統中。
2 有關外文所引致的亂碼, 只有轉換支援某外文的字體檔案才能解決。如果外文是使用 香港增補字符集, 請留意瀏覽器或有關軟件能否支援。現在大部分的軟件都支援Unicode, 而 香港增補字符集 中有部分可應到Unicode的, 可以解決到一半問題。
3 字符 是中國大陸的叫法, 在香港及台灣叫 字元。
4 字體 是中國大陸的叫法, 在香港及台灣叫 字型。
5 字符 及 字體 都不是電腦專用的術語。字符 也可用在文字學上, 字體 也可用在美術上。
参看
編碼(encode)
解碼(decode)
字體檔案(font file)
外字(UDC)
香港增補字符集(HKSCS)
外部连接
[http://netlab.cse.yzu.edu.tw/~statue/freebsd/zh-tut/mail-code.html 邮件乱码]
Category:计算机软件
ja:文字化け
电报码中文电码,又称中文商用电码、中文电报码或中文电报明码,原本是於电报之中传送中文信息的方法。它是第一个把汉字化作电子讯号的编码表。
自摩尔斯电码在1835年发明后,一直只能用来传送英语或以拉丁字母拼写的文字。后来在1880年,清朝政府雇用丹麦人设计了中文汉字电报。
中文电码表采用了四位阿拉伯数字作代号,从0001到9999按四位数顺序排列,用四位数字表示最多一万个汉字、字母和符号。汉字先按部首,后按笔划排列。字母和符号放到电码表的最尾。後來由於一萬個漢字不足以應付戶籍管理的要求,又有第二字面漢字的出現。在香港,兩個字面都採用同一編碼,由輸入員人手選擇字面;在台灣,第二字面的漢字會在開首補上“1”字,變成5個數字的編碼。
应用
中文电码可用作电脑裡的中文输入法,但因中文电码是“无理码”,记忆困难,一般用户几乎无法熟练地掌握使用。
在香港,每个市民的身份证上,均会在他的姓名下面,印有中文电码,外國人取得的入港簽證亦有印上。在很多政府或商业机构的表格中,都会要求填写者填写他的中文电码,以便輸入電腦。
参看
- 中文输入法
- 摩尔斯电码
外部連結
- [http://chinesecode.no-ip.com/ 中文编码网页]
Category:字符集
Category:中文信息处理
穷举法穷举法是一种针对于密码的破译方法,就是人们常说的暴力破解法。这种方法很象数学上的“完全归纳法”并在密码破译方面得到了广泛的应用。简单来说就是将密码进行逐个推算直到找出真正的密码为止。比如一个四位并且全部由数字组成其密码共有10000种组合,也就是说最多我们会尝试10000次才能找到真正的密码。利用这种方法我们可以运用计算机来进行逐个推算,也就是说用我们破解任何一个密码也都只是一个时间问题。
字符类型
字符类型一般可以分为一下5种
- 数字型0、1、2、...9等(10個)
- 大写字母A、B、C、...Z等(26個)
- 小写字母a、b、c、...z等(26個)
- 特殊字符~、$、#、@、&、*等(33個)一般較少用
- 用户自定义字符。
如果一个多位数并且有可能包含以上所有字符的密码的组合方法一定多的惊人,相对来讲破译的时间也会长的没法接受,有时可能会长达数年之久。
字典
当然如果破译一个有8位而且有可能拥有大小写数字、字母、以及符号的密码用普通的家用电脑可能会用掉几个月甚至更多的时间去计算,其组合方法可能有几千万亿重种组合。这样长的时间显然是不能接受的。其解决办法就是运用字典,所谓字典就是给密码锁定某个范围,比如英文单词以及生日的数字组合等,所有的英文单词不过10万个左右这样可以大大缩小密码范围,很大程度上缩短了破译时间。
超级计算机与穷举法
在一些领域为了提高密码的破译效率而专门为其制造的超级计算机也不在少数,例如IBM为美国军方制造的“飓风”就是很有代表性的一个。
Category:计算机术语
category:密碼學
GB 2312GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集·基本集》,又稱為GB0,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于大陆;新加坡等地也采用此编码。几乎所有的中文系统和国际化的软件都支持GB 2312。
GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全形字符。
GB 2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖99.75%的使用频率。
对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。
分区表示
GB 2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
- 01-09区为特殊符号。
- 16-55区为一级汉字,按拼音排序。
- 56-87区为二级汉字,按部首/笔画排序。
10-15区及88-94区则未有编码。
举例来说,“啊”字是GB2312之中的第一个汉字,它的区位码就是1601。
字节结构
在使用GB2312的程序中,通常采用EUC储存方法,以便兼容于ASCII。
每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”,第二个字节称为“低位字节”。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。
例如“啊”字在大多数程序中,会以0xB0A1储存。(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。
参见
- 后续国家字符集标准:GBK、GB 18030-2000
- 同一时期的繁体字标准:大五碼(Big5)、國家標准中文交換碼(CNS 11643)、CCCII、香港增補字符集(HKSCS)
- Unicode
- 中日韓統一表意文字
Category:中文信息处理
Category:字符集
ja:GB2312
Hz赫兹是国际单位制中频率的单位,它体现每秒中的波的数量。赫兹的名字来自于德国物理学家海因里希·鲁道夫·赫兹。其符号是Hz。
1Hz = 1/s
SI 衍生單位
參看
- 頻率
Category:度量衡
ko:헤르츠
ja:ヘルツ (単位)
UnicodeUnicode(萬國碼、統一碼)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。
最新版本的 Unicode 是 2005年3月31日推出的Unicode 4.1.0 。
Unicode 的编码和实现
大概来说,Unicode 编码系统可分为编码方式和实现方式两个层次。
编码方式
Unicode 的编码方式与 ISO 10646 的通用字符集(Universal Character Set,UCS)概念相对应,目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 216 个字符。基本满足各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来扩展。
上述16位 Unicode 字符构成基本多文种平面(Basic Multilingual Plane, 简称 BMP)。最新(但未实际使用)的 Unicode 版本定义了16个辅助平面,两者合起来至少需要占据21位的编码空间,比3字节略少。但事实上辅助平面字符仍然占用4字节编码空间,与 UCS-4 保持一致。未来版本会扩充到 ISO 10646-1 实现级别3,即涵盖 UCS-4 的所有字符。UCS-4 是一个更大的尚未填充完全的31位字符集,加上恒为0的首位,共需占据32位,即4字节。理论上最多能表示 231 个字符,完全可以涵盖一切语言所用的符号。
BMP 字符的 Unicode 编码表示为 U+hhhh,其中每个 h 代表一个十六进制数位。与 UCS-2 编码完全相同。对应的4字节 UCS-4 编码后两个字节一致,前两个字节的所有位均为0。
关于 Unicode 和 ISO 10646 及 UCS 的详细关系 ,请参看通用字符集。
实现方式
Unicode 的实现方式不同于编码方式。一个字符的 Unicode 编码是确定的。但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对 Unicode 编码的实现方式有所不同。Unicode 的实现方式称为Unicode转换格式(Unicode Translation Format,简称为 UTF)。
例如,如果一个仅包含基本7位ASCII字符的 Unicode 文件,如果每个字符都使用2字节的原 Unicode 编码传输,其第一字节的8位始终为0。这就造成了比较大的浪费。对于这种情况,可以使用 UTF-8 编码,这是一种变长编码,它将基本7位ASCII字符仍用7位编码表示,占用一个字节(首位补0)。而遇到与其他 Unicode 字符混合的情况,将按一定算法转换,每个字符使用1-3个字节编码,并利用首位为0或1进行识别。这样对以7位ASCII字符为主的西文文档就大大节省了编码长度(具体方案参见UTF-8)。类似的,对未来会出现的需要4个字节的辅助平面字符和其他 UCS-4 扩充字符,2字节编码的 UTF-16 也需要通过一定的算法进行转换。
再如,如果直接使用与 Unicode 编码一致(仅限于 BMP 字符)的 UTF-16 编码,由于每个字符占用了两个字节,在Macintosh机和PC机上对字节顺序的理解是不一致的。这时同一字节流可能会被解释为不同内容,如编码为 U+594E 的字符“奎”同编码为 U+4E59 的“乙”就可能发生混淆。于是在 UTF-16 编码实现方式中使用了大尾序(big-endian)、小尾序(little-endian)的概念,以及BOM(Byte Order Mark)解决方案。(具体方案参见UTF-16)
此外 Unicode 的实现方式还包括 UTF-7、Punycode、CESU-8、SCSU、UTF-32等,这些实现方式有些仅在一定的国家和地区使用,有些则属于未来的规划方式。目前通用的实现方式是 UTF-16小尾序(BOM)、UTF-16大尾序(BOM)和 UTF-8。在微软公司Windows XP操作系统附带的记事本中,“另存为”对话框可以选择的四种编码方式除去非 Unicode 编码的 ANSI 外,其余三种“Unicode”、“Unicode big endian”和“UTF-8”即分别对应这三种实现方式。
目前辅助平面的工作主要集中在第二和第三平面的中日韩统一表意文字中,因此包括GBK、GB18030、Big5等简体中文、繁体中文、日文、韩文以及越南字喃的各种编码与 Unicode 的协调性被重点关注。考虑到 Unicode 最终要涵盖所有的字符,从某种意义而言,这些编码方式也可视作 Unicode 的出现于其之前的既成事实的实现方式,如同ASCII及其扩展Latin-1一样,后两者的字符在16位 Unicode 编码空间中的编码第一字节各位全为0,第二字节编码与原编码完全一致。但上述东亚语言编码与 Unicode 编码的对应关系要复杂得多。
非 Unicode 环境
在非 Unicode 环境下,由于不同国家和地区采用的字符集不一致,很可能出现无法正常显示所有字符的情况。微软公司使用了代码页(Codepage)转换表的技术来过渡性的部分解决这一问题,即通过指定的转换表将非 Unicode 的字符编码转换为同一字符对应的系统内部使用的 Unicode 编码。可以在“语言与区域设置”中选择一个代码页作为非 Unicode 编码所采用的默认编码方式,如936为简体中文GBK,950为繁体中文Big5(皆指PC上使用的)。在这种情况下,一些非英语的欧洲语言编写的软件和文档很可能出现乱码。而将代码页设置为相应语言中文处理又会出现问题,这一情况无法避免。从根本上说,完全采用统一编码才是解决之道,但目前上无法做到这一点。
代码页技术现在广泛为各种平台所采用。UTF-7 的代码页是65000,UTF-8 的代码页是65001。
XML 和 Unicode
XML及其子集HTML采用UTF-8作为标准字集,理论上我们可以在各种支持XML标准的浏览器上显示任何地区文字的网页,只要电脑本身安装有合适的字体即可。可以利用&#nnn;的格式显示特定的字符。nnn代表该字符的十进制 Unicode 代码。如果采用十六进制代码,在编码之前加上x字符即可。但部分旧版本的浏览器可能无法识别十六进制代码。
然而部分由于 Unicode 版本发展原因,很多浏览器只能显示 UCS-2 完整字符集也即现在使用的 Unicode 版本中的一个小子集。下表可以检验您的浏览器怎样显示各种各样的 Unicode 代码:
Unicode 编码表
外部链接
- [http://www.unicode.org/ Unicode official site]
- [http://www.decodeunicode.org/ DecodeUnicode - Unicode WIKI], 50.000 gifs and information about each character
- [http://www.alanwood.net/unicode Alan Wood’s Unicode Resources]
- [http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm The International Phonetic Alphabet in Unicode]
- [http://www.alanwood.net/unicode/cjk_compatibility_ideographs.html CJK Compatibility Ideographs]
- [http://www.unicode.org/charts/ Unicode character charts]
- [http://www.linuxforum.net/books/UTF-8-Unicode.html UTF-8 and Unicode FAQ]
- [http://fmddlmyy.home4u.china.com/text6.html 程序员写给程序员的Unicode介绍]
Category:ISO
Category:字符集
ja:Unicode
ko:유니코드
th:ยูนิโคด
zh-min-nan:Thong-iōng-bé
UTFUnicode(萬國碼、統一碼)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。
最新版本的 Unicode 是 2005年3月31日推出的Unicode 4.1.0 。
Unicode 的编码和实现
大概来说,Unicode 编码系统可分为编码方式和实现方式两个层次。
编码方式
Unicode 的编码方式与 ISO 10646 的通用字符集(Universal Character Set,UCS)概念相对应,目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 216 个字符。基本满足各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来扩展。
上述16位 Unicode 字符构成基本多文种平面(Basic Multilingual Plane, 简称 BMP)。最新(但未实际使用)的 Unicode 版本定义了16个辅助平面,两者合起来至少需要占据21位的编码空间,比3字节略少。但事实上辅助平面字符仍然占用4字节编码空间,与 UCS-4 保持一致。未来版本会扩充到 ISO 10646-1 实现级别3,即涵盖 UCS-4 的所有字符。UCS-4 是一个更大的尚未填充完全的31位字符集,加上恒为0的首位,共需占据32位,即4字节。理论上最多能表示 231 个字符,完全可以涵盖一切语言所用的符号。
BMP 字符的 Unicode 编码表示为 U+hhhh,其中每个 h 代表一个十六进制数位。与 UCS-2 编码完全相同。对应的4字节 UCS-4 编码后两个字节一致,前两个字节的所有位均为0。
关于 Unicode 和 ISO 10646 及 UCS 的详细关系 ,请参看通用字符集。
实现方式
Unicode 的实现方式不同于编码方式。一个字符的 Unicode 编码是确定的。但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对 Unicode 编码的实现方式有所不同。Unicode 的实现方式称为Unicode转换格式(Unicode Translation Format,简称为 UTF)。
例如,如果一个仅包含基本7位ASCII字符的 Unicode 文件,如果每个字符都使用2字节的原 Unicode 编码传输,其第一字节的8位始终为0。这就造成了比较大的浪费。对于这种情况,可以使用 UTF-8 编码,这是一种变长编码,它将基本7位ASCII字符仍用7位编码表示,占用一个字节(首位补0)。而遇到与其他 Unicode 字符混合的情况,将按一定算法转换,每个字符使用1-3个字节编码,并利用首位为0或1进行识别。这样对以7位ASCII字符为主的西文文档就大大节省了编码长度(具体方案参见UTF-8)。类似的,对未来会出现的需要4个字节的辅助平面字符和其他 UCS-4 扩充字符,2字节编码的 UTF-16 也需要通过一定的算法进行转换。
再如,如果直接使用与 Unicode 编码一致(仅限于 BMP 字符)的 UTF-16 编码,由于每个字符占用了两个字节,在Macintosh机和PC机上对字节顺序的理解是不一致的。这时同一字节流可能会被解释为不同内容,如编码为 U+594E 的字符“奎”同编码为 U+4E59 的“乙”就可能发生混淆。于是在 UTF-16 编码实现方式中使用了大尾序(big-endian)、小尾序(little-endian)的概念,以及BOM(Byte Order Mark)解决方案。(具体方案参见UTF-16)
此外 Unicode 的实现方式还包括 UTF-7、Punycode、CESU-8、SCSU、UTF-32等,这些实现方式有些仅在一定的国家和地区使用,有些则属于未来的规划方式。目前通用的实现方式是 UTF-16小尾序(BOM)、UTF-16大尾序(BOM)和 UTF-8。在微软公司Windows XP操作系统附带的记事本中,“另存为”对话框可以选择的四种编码方式除去非 Unicode 编码的 ANSI 外,其余三种“Unicode”、“Unicode big endian”和“UTF-8”即分别对应这三种实现方式。
目前辅助平面的工作主要集中在第二和第三平面的中日韩统一表意文字中,因此包括GBK、GB18030、Big5等简体中文、繁体中文、日文、韩文以及越南字喃的各种编码与 Unicode 的协调性被重点关注。考虑到 Unicode 最终要涵盖所有的字符,从某种意义而言,这些编码方式也可视作 Unicode 的出现于其之前的既成事实的实现方式,如同ASCII及其扩展Latin-1一样,后两者的字符在16位 Unicode 编码空间中的编码第一字节各位全为0,第二字节编码与原编码完全一致。但上述东亚语言编码与 Unicode 编码的对应关系要复杂得多。
非 Unicode 环境
在非 Unicode 环境下,由于不同国家和地区采用的字符集不一致,很可能出现无法正常显示所有字符的情况。微软公司使用了代码页(Codepage)转换表的技术来过渡性的部分解决这一问题,即通过指定的转换表将非 Unicode 的字符编码转换为同一字符对应的系统内部使用的 Unicode 编码。可以在“语言与区域设置”中选择一个代码页作为非 Unicode 编码所采用的默认编码方式,如936为简体中文GBK,950为繁体中文Big5(皆指PC上使用的)。在这种情况下,一些非英语的欧洲语言编写的软件和文档很可能出现乱码。而将代码页设置为相应语言中文处理又会出现问题,这一情况无法避免。从根本上说,完全采用统一编码才是解决之道,但目前上无法做到这一点。
代码页技术现在广泛为各种平台所采用。UTF-7 的代码页是65000,UTF-8 的代码页是65001。
XML 和 Unicode
XML及其子集HTML采用UTF-8作为标准字集,理论上我们可以在各种支持XML标准的浏览器上显示任何地区文字的网页,只要电脑本身安装有合适的字体即可。可以利用&#nnn;的格式显示特定的字符。nnn代表该字符的十进制 Unicode 代码。如果采用十六进制代码,在编码之前加上x字符即可。但部分旧版本的浏览器可能无法识别十六进制代码。
然而部分由于 Unicode 版本发展原因,很多浏览器只能显示 UCS-2 完整字符集也即现在使用的 Unicode 版本中的一个小子集。下表可以检验您的浏览器怎样显示各种各样的 Unicode 代码:
Unicode 编码表
外部链接
- [http://www.unicode.org/ Unicode official site]
- [http://www.decodeunicode.org/ DecodeUnicode - Unicode WIKI], 50.000 gifs and information about each character
- [http://www.alanwood.net/unicode Alan Wood’s Unicode Resources]
- [http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm The International Phonetic Alphabet in Unicode]
- [http://www.alanwood.net/unicode/cjk_compatibility_ideographs.html CJK Compatibility Ideographs]
- [http://www.unicode.org/charts/ Unicode character charts]
- [http://www.linuxforum.net/books/UTF-8-Unicode.html UTF-8 and Unicode FAQ]
- [http://fmddlmyy.home4u.china.com/text6.html 程序员写给程序员的Unicode介绍]
Category:ISO
Category:字符集
ja:Unicode
ko:유니코드
th:ยูนิโคด
zh-min-nan:Thong-iōng-bé
乱码乱码(mojibake)指的是電腦系統不能顯示正確的字符,而顯示其他無意義的字符或空白,如一堆ASCII Code。这样所顯示出來的文字統稱為亂碼。乱码是因为所使用的字符的源码在本地计算机上使用了错误的显示字库,或在本地计算机的字库中找不到相应于源码所指代的字符所致。不同国家和地区的文字字库采用了相同的一段源码,或是源文件中因为文件受到破坏,致使计算机默认提取的源码错误,或是计算机没有安装相应字库,都有可能产生乱码。
可能的產生原因
1 一般是軟件程序解碼錯誤。如瀏覽器把GBK碼當成是Big5碼顯示出來, 或電子郵件程序把對方傳來的郵件錯誤解碼。如果在發送時編碼錯誤, 收件者的電郵程序是不能解碼的, 必需要寄件者的電郵程序重新編碼再寄。
2 字體檔案不對。
3 來源編碼錯誤, 或文件受到破壞。
可能的解決方法
1 嘗試去轉換編碼。一般可試Big5、GBK、UTF8三種, 如涉及的不是中文, 可以再試JIS(日文)、KR(韓文)及其他文字編碼。徹底的解決方法是雙方使用同一編碼系統, 如UTF8(Unicode的一種應用方式, 包括世界上主要的文字), 只要用戶有對應的字體檔案就可以正確的顯示出來。實際上要統一編碼系統還要克服各種客觀的困難, 現時只有靠軟件有更高的解碼能力。
2 轉換字體。如果解碼正確而出現錯誤文字, 有可能是字體檔案中沒有相對應的字符, 可嘗試轉換字體檔案。
3 如果本來出漢字的變成數字如最 欣 賞 相 中 拉(這些是Unicode), 可以把這部分抄出來, 獨立存儲成.html檔, 再用瀏覽器打開即可解碼。
4 其他。有時解碼的方法要視乎軟件和實際環境, 及不斷嘗試才能解碼, 特別在不知本來是用哪種編碼系統時。
其他
1 有時輸入漢字時也會出現亂碼, 不過這種情況很少出現。最大的原因是輸入法所用的編碼, 經編輯器輸出的字體編碼不符所致, 可嘗試轉換字體來解決。例如把GBK編碼的輸入法裝到只支援Big5的系統上, 是不能正確顯字所輸入的字的; 必需選擇Big5編碼的輸入法, 或把輸入法裝到GBK的系統中。
2 有關外文所引致的亂碼, 只有轉換支援某外文的字體檔案才能解決。如果外文是使用 香港增補字符集, 請留意瀏覽器或有關軟件能否支援。現在大部分的軟件都支援Unicode, 而 香港增補字符集 中有部分可應到Unicode的, 可以解決到一半問題。
3 字符 是中國大陸的叫法, 在香港及台灣叫 字元。
4 字體 是中國大陸的叫法, 在香港及台灣叫 字型。
5 字符 及 字體 都不是電腦專用的術語。字符 也可用在文字學上, 字體 也可用在美術上。
参看
編碼(encode)
解碼(decode)
字體檔案(font file)
外字(UDC)
香港增補字符集(HKSCS)
外部连接
[http://netlab.cse.yzu.edu.tw/~statue/freebsd/zh-tut/mail-code.html 邮件乱码]
Category:计算机软件
ja:文字化け
Nosná raketaNosná raketa, také nazývaná kosmický nosič je dopravní prostředek, poháněný raketovými motory a určený pro vynášení užitečných nákladů (umělých družic, kosmických sond, kosmických lodí) do kosmického prostoru.
Po technické stránce představuje nosná raketa jednostupňovou nebo vícestupňovou raketu. Většinou jsou tyto dopravní prostředky určeny pro jedno použití, pouze výjimečně jsou některé části nosiče vícenásobně použitelné (viz např. kosmický raketoplán). Aby nosná rakety mohla dopravit užitečné zatížení na oběžnou dráhu, musí dosáhnout minimálně první kosmické rychlosti.
Historie
Většina prvních nosných raket, vyvinutých v druhé polovině padesátých let 20. století, byla odvozena od vojenských balistických raket, zejména mezikontinentálních. Výjimkou tehdy byla pouze nosná raketa Vanguard, která byla vyvíjena pro vynesení amerických vědeckých družic téhož jména v rámci Mezinárodního geofyzikálního roku 1957-1958.
Teprve v šedesátých létech byly vyvíjeny řadou států nosiče, které nebyly odvozeny od vojenských raket (např. Proton v SSSR, Diamant ve Francii, Scout v USA). Přesto však byly vyvíjeny firmami, které měly zkušenosti se stavbou vojenských balistických raket a jejich vývoj byl většinou financován z prostředků určených na obranu.
V osmdesátých létech 20. století začaly pronikat na toto pole i komerční organizace, zejména v souvislosti s rostoucímí požadavky na vypouštění stacionárních telekomunikačních družic.
V současnosti disponuje vlastními nosnými prostředky 6 států světa a jedna nadnárodní organizace a další země svoje nosné prostředky vyvíjejí. Přehled je uveden v následující tabulce:
Podívejte se také na
- Nosné rakety SSSR a Ruska
- Nosné rakety USA
- Nosné rakety Japonska
- Nosné rakety Francie
- Nosné rakety Velké Británie
- Nosné rakety ČLR
- Nosné rakety Indie
- Nosné rakety organizace ESA
Externí odkazy
- [http://www.astronautix.com/lvs/orbindex.htm Orbital Launch Vehicle Index / M. Wade. - Encyclopedia Astronatuica] (anglicky)
- [http://www.kosmo.cz/modules.php?op=modload&name=kosmo&file=index&fil=/m/nosice/index.htm Nosiče (kosmické rakety) / A. Holub. - Malá encyklopedie kosmonautiky] (česky)
Kategorie:Kosmické dopravní prostředky
nauka tuszcze warsaw bars and cafes milan italy hotels pociel
|
|
|
|
|