JIS X 0208

JIS X 0208 je japonská průmyslová norma (první část zkratky je z anglického Japanese Industrial Standard) pro dvoubytové kódování znaků, která definuje 6879 grafických znaků vhodných pro zápis textu, místních názvů, osobních jmen atd. v japonštině. Oficiální název normy je „7bitové a 8bitové dvoubytové kódování kandži pro výměnu informací“ (japonsky 7ビット及び8ビットの2バイト情報交換用符号化漢字集合 Nana-Bitto Oyobi Hachi-Bitto no Ni-Baito Jōhō Kōkan'yō Fugōka Kanji Shūgō). První verze normy byla publikována v roce 1978 pod označením JIS C 6226, revize byly vydány v letech 1983, 1990 (již pod označením JIS X 0208) a 1997.

Struktura kódu

Kódy znaků v JIS X 0208 jsou tvořeny dvěma sedmi- nebo osmibitovými hodnotami. Znak mezera a řídicí znaky jsou však reprezentovány jednobytovými kódy. ISO/IEC 646 rozděluje prostor sedmibitového kódu na 33 řídicích znaků, 94 tisknutelných znaků a znak mezera. Pokud vynecháme kódy řídicích znaků a mezery, lze při použití dvou bytů reprezentovat až 8836 (94×94) znaků; u dvoubytových znakových sad se kódový bod každého znaku zadává ve formě zvané kuten (japonsky: 区点) (někdy nazývaného quwei (čínsky: 区位), zvláště když pracujeme s kódováním GB2312 a příbuznými standardy), který určuje zónu neboli řádek (, japonsky: ku, čínsky: qu) a pozici (japonsky: ten) (čínsky: wei) tohoto znaku v zóně/řádku.

Znaková sada

JIS X 0208 definuje sadu celkem 6879 grafických znaků, nazývanou sada kandži (japonsky 漢字集合 kanji shūgō), která však kromě 6355 kandži znaků obsahuje a 524 dalších znaků (japonsky 非漢字 hikanji), včetně znaků jiných abeced – latinky, řecké abecedy, Cyrilice, kana atd. Znakům jsou přiřazeny dvoubytové kódy se sedmi anebo osmi bity v bytu rozdělené do 94 řádků neboli zón po 94 pozicích.

Speciální znaky
Jsou umístěny v řádcích 1 a 2. Zahrnují
  • 18 popisných symbolů (japonsky 記述記号 kijutsu kigō), jako například „ideografická mezera“ ( ) a japonskou čárku a tečku;
  • 8 diakritických znamének (japonsky diacritical marks) jako například dakuten a handakuten;
  • 10 znaků pro věci, které následují kana nebo kandži (japonsky 仮名又は漢字に準じるもの kana mata wa kandži ni junjiru mono) jako například znak opakování;
  • 22 závorkových symbolů (japonsky 括弧記号 kakko kigō);
  • 45 matematických symbolů (japonsky 学術記号 gakujutsu kigō);
  • 32 symbolů jednotek, které zahrnují znak měny a japonský znak pošty;
– celkem 147 znaků.
Číslice
Jsou umístěny v řádku 3. Deset číslic od „0“ do „9“.
Latinka
Umístěna v řádku 3. 26 malých a 26 velkých písmen anglické abecedy.
Hiragana
Umístěna v řádku 4. Obsahuje 48 neznělých (včetně zastaralých wi a we), 20 znělých (dakuten), 5 poloznělých (handakuten) a 10 malých znaků kana pro palatalizované a asimilované zvuky; celkem 83 znaků.
Katakana
Umístěna v řádku 5. Celkem 86 znaků; kromě katakana ekvivalentů hiragana znaků je zde malé ka/ke kana (/) a vu kana ().
Řecká písmena
Umístěna v řádku 6. 24 malých a 24 velkých písmen řecké abecedy.
Cyrilice
Umístěna v řádku 7. 33 malých a 33 velkých písmen ruské abecedy.
Znaky pro textové rámečky
Jsou umístěny v řádku 8. Tenké čáry, tlusté čáry a kombinace tenkých a tlustých čar, celkem 32 znaků.
Kandži
2965 znaků úrovně 1 (japonsky 第1水準 dai ichi suijun) od řádku 16 do řádku 47 a 3390 znaků úrovně 2 (japonsky 第2水準 dai ni suijun) od řádku 48 do řádku 84, celkem 6355.

Odkazy

Reference

V tomto článku byl použit překlad textu z článku JIS X 0208 na anglické Wikipedii.

Související články

Externí odkazy

  • JIS kandži na Cyber Librarian – JIS kanji listing
  • Japanese Standards Association database search zde lze zakoupit poslední verzi normy
  • Unification-related provisions in the JIS X 0208 and 0213 standards
Znakové sady
Kódování znaků
Nejstarší telekomunikace
ISO/IEC 8859
  • -1
  • -2
  • -3
  • -4
  • -5
  • -6
  • -7
  • -8
  • -9
  • -10
  • -11
  • -12
  • -13
  • -14
  • -15
  • -16
  • Bibliografické použití
  • ANSEL
  • ISO 5426 / 5426-2 / 5427 / 5428 / 6438 / 6861 / 6862 / 10585 / 10586 / 10754 / 11822
  • MARC-8
  • Národní normy
  • ArmSCII
  • CNS 11643
  • GOST 10859
  • GB 18030
  • HKSCS
  • ISCII
  • JIS X 0201
  • JIS X 0208
  • JIS X 0212
  • JIS X 0213
  • KPS 9566
  • KS X 1001
  • PASCII
  • SI 960
  • TIS-620
  • TSCII
  • VISCII
  • YUSCII
  • EUC
  • CN
  • JP
  • KR
  • TW
  • ISO/IEC 2022
  • CN
  • JP
  • KR
  • CCCII
  • Kódové stránky v systému MacOS
  • Arabic
  • CE Roman
  • ChineseSimp / EUC-CN
  • ChineseTrad / Big5
  • Croatian
  • Cyrillic
  • Devanagari
  • Dingbats
  • Farsi
  • Greek
  • Gujarati
  • Gurmukhi
  • Hebrew
  • Icelandic
  • Japonština / Shift-JIS
  • Korejština / EUC-KR
  • Roman
  • Romanian
  • Symbol
  • Thai / TIS-620
  • Turkish
  • Ukrainian
  • Kódové stránky v systému DOS
  • 111
  • 112
  • 113
  • 151
  • 161
  • 162
  • 163
  • 164
  • 165
  • 301
  • 437
  • 667
  • 668
  • 708
  • 709
  • 710
  • 711
  • 720
  • 737
  • 770
  • 771
  • 772
  • 773
  • 774
  • 775
  • 776
  • 777
  • 778
  • 790
  • 806
  • 808
  • 813
  • 819
  • 848
  • 849
  • 850
  • 851
  • 852
  • 853
  • 854
  • 855
  • 856
  • 857
  • 858
  • 859
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 867
  • 868
  • 869
  • 872
  • 874
  • 876
  • 877
  • 878
  • 881
  • 882
  • 883
  • 884
  • 885
  • 891
  • 895
  • 896
  • 897
  • 898
  • 899
  • 900
  • 901
  • 902
  • 903
  • 904
  • 906
  • 907
  • 909
  • 910
  • 911
  • 912
  • 913
  • 914
  • 915
  • 916
  • 919
  • 920
  • 921
  • 922
  • 923
  • 925
  • 926
  • 927
  • 928
  • 932
  • 934
  • 936
  • 938
  • 941
  • 942
  • 943
  • 944
  • 946
  • 947
  • 948
  • 949
  • 950
  • 951
  • 952
  • 953
  • 954
  • 955
  • 956
  • 957
  • 958
  • 959
  • 960
  • 961
  • 962
  • 963
  • 964
  • 965
  • 966
  • 991
  • 1004
  • 1006
  • 1008
  • 1009
  • 1010
  • 1011
  • 1012
  • 1013
  • 1014
  • 1015
  • 1016
  • 1017
  • 1018
  • 1019
  • 1020
  • 1021
  • 1023
  • 1034
  • 1036
  • 1040
  • 1041
  • 1042
  • 1043
  • 1044
  • 1046
  • 1086
  • 1088
  • 1089
  • 1090
  • 1092
  • 1098
  • 1111
  • 1114
  • 1115
  • 1116
  • 1117
  • 1118
  • 1119
  • 1124
  • 1125
  • 1126
  • 1127
  • 1129
  • 1131
  • 1133
  • 1139
  • 1161
  • 1162
  • 1163
  • 1167
  • 1168
  • 1169
  • 1174
  • 1350
  • 1351
  • 1361
  • 1362
  • 1363
  • 1373
  • Kamenický
  • Mazovia
  • MIK
  • Iran System
  • Kódové stránky ve Windows
  • 874 / TIS-620
  • 932 / Shift JIS
  • 936 / GBK
  • 949 / EUC-KR
  • 950 / Big5
  • 1250
  • 1251
  • 1252
  • 1253
  • 1254
  • 1255
  • 1256
  • 1257
  • 1258
  • 54936 / GB18030
  • Kódové stránky EBCDIC
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37/1140
  • 38
  • 39
  • 40
  • 251
  • 252
  • 254
  • 256
  • 257
  • 258
  • 259
  • 260
  • 264
  • 273/1141
  • 274
  • 275
  • 276
  • 277/1142
  • 278/1143
  • 280/1144
  • 281
  • 282
  • 283
  • 284/1145
  • 285/1146
  • 286
  • 287
  • 288
  • 289
  • 290
  • 297/1147
  • 298
  • 300
  • 320
  • 321
  • 322
  • 330
  • 361
  • 363
  • 382
  • 383
  • 384
  • 385
  • 386
  • 387
  • 388
  • 389
  • 390
  • 391
  • 392
  • 393
  • 394
  • 395
  • 410
  • 420/16804
  • 421
  • 423
  • 424/12712
  • 425
  • 435
  • 500/1148
  • 803
  • 829
  • 833
  • 834
  • 835
  • 836
  • 837
  • 838/1160
  • 839
  • 870/1153
  • 871/1149
  • 875/9067
  • 880
  • 881
  • 882
  • 883
  • 884
  • 885
  • 886
  • 887
  • 888
  • 889
  • 890
  • 892
  • 893
  • 905
  • 918
  • 930/1390
  • 931
  • 933/1364
  • 935/1388
  • 937/1371
  • 939/1399
  • 1001
  • 1002
  • 1003
  • 1005
  • 1007
  • 1024
  • 1025/1154
  • 1026/1155
  • 1027
  • 1028
  • 1030
  • 1031
  • 1032
  • 1033
  • 1037
  • 1047/924
  • 1068
  • 1069
  • 1070
  • 1071
  • 1073
  • 1074
  • 1075
  • 1076
  • 1077
  • 1078
  • 1079
  • 1080
  • 1081
  • 1082
  • 1083
  • 1084
  • 1085
  • 1087
  • 1091
  • 1097
  • 1110
  • 1112/1156
  • 1113
  • 1122/1157
  • 1123/1158
  • 1130/1164
  • 1132
  • 1136
  • 1137
  • 1150
  • 1151
  • 1152
  • 1159
  • 1165
  • 1278
  • 1303
  • 1364
  • JEF
  • KEIS
  • Platformně závislé
  • ATASCII
  • CDC display code
  • DEC-MCS
  • DEC Radix-50
  • ELWRO-Junior
  • Fieldata
  • GSM 03.38
  • HP roman8
  • PETSCII
  • Znaková sada kalkulátorů TI
  • WISCII
  • Znaková sada ZX80
  • Znaková sada ZX Spectrum
  • Unicode / ISO/IEC 10646
  • UTF-8
  • UTF-16/UCS-2
  • UTF-32/UCS-4
  • UTF-7
  • UTF-1
  • UTF-EBCDIC
  • GB 18030
  • SCSU
  • BOCU-1
  • Různé kódové stránky

    • APL
      • 293
      • 310
      • 351
      • 907
    • Cork
    • HZ
    • KOI8
    • TRON
    Příbuzná témata
  • Řídicí znaky (C0 C1)
  • CCSID
  • Kódování znaků v HTML
  • Detekce znakové sady
  • Han unifikace
  • ISO 6429/IEC 6429/ANSI X3.64
  • mojibake
  • Pahýl
    Pahýl
    Tento článek je příliš stručný nebo postrádá důležité informace.
    Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.