泰米爾文字資訊交換碼
维基百科,自由的百科全书
泰米爾文字資訊交換碼(英:Tamil Script Code for Information Interchange,TSCII),是一種針對泰米尔语的編碼。当中开首的128个字元和ASCII一样;之后的128个字元使用来放置泰米尔字母的。
跟統一碼不相同的地方在於:統一碼的編碼順序是根據音节的逻辑顺序,和印度文字資訊交換碼一样;而此編碼是根据实际的书写次序,以方便使用泰米爾文字打字机的使用者,跟泰语的TIS 620标准一样。
现时泰米尔语的文字集合Project Madurai提供的免费文本都是采用泰米爾文字資訊交換碼,但最近已经开始把文本转为使用統一碼编码。
编码表
泰米爾文字資訊交換碼 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
8x | ௦ | ௧ | ஸ்ரீ | ஜ | ஷ | ஸ | ஹ | க்ஷ | ஜ் | ஷ் | ஸ் | ஹ் | க்ஷ் | ௨ | ௩ | ௪ |
9x | ௫ | ‘ | ’ | “ | ” | ௬ | ௭ | ௮ | ௯ | ஙு | ஞு | ஙூ | ஞூ | ௰ | ௱ | ௲ |
Ax | NBSP | ா | ி | ீ | ு | ூ | ெ | ே | ை | © | ௗ | அ | ஆ | ஈ | உ | |
Bx | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | ஃ | க | ங | ச | ஞ | ட | ண | த | ந |
Cx | ப | ம | ய | ர | ல | வ | ழ | ள | ற | ன | டி | டீ | கு | சு | டு | ணு |
Dx | து | நு | பு | மு | யு | ரு | லு | வு | ழு | ளு | று | னு | கூ | சூ | டூ | ணூ |
Ex | தூ | நூ | பூ | மூ | யூ | ரூ | லூ | வூ | ழூ | ளூ | றூ | னூ | க் | ங் | ச் | ஞ் |
Fx | ட் | ண் | த் | ந் | ப் | ம் | ய் | ர் | ல் | வ் | ழ் | ள் | ற் | ன் | இ |
现时上表的位置80是U+0BE6 TAMIL DIGIT ZERO,在Unicode 4.1版本終已被收錄;位置A0是NO-BREAK SPACE。位置AD和FF未有编码。
外部連結
- TSCII主页 (页面存档备份,存于互联网档案馆)
- Unicode Technical Note #15 Text conversion From TSCII 1.7 to Unicode (页面存档备份,存于互联网档案馆)
- INFITT (International Forum for Information Technology in Tamil) (页面存档备份,存于互联网档案馆)