Windows-1252

Windows-1252またはコードページ1252 (Code Page 1252, CP1252) は、Microsoft Windowsの英語版および他の数種の西欧言語版で従来のコンポーネントが既定で使用するラテン文字文字コードである。

概要

Windowsコードページのグループの一種である。LaTeXパッケージではansinewと呼ばれる。この文字コードはISO 8859-1上位集合だが、0x80から0x9Fの範囲に制御文字ではなく図形文字を収録していることにより、IANAISO-8859-1とは異なる。Windowsではコードページ番号1252およびIANA登録名 "windows-1252" という名前で知られる。このコードページはISO 8859-15に含まれる印字可能文字もすべて収録している (ただしいくつかは異なるコードポイントにマップされている)。

ISO 8859-1と比較して追加された文字としては、各種の欧文記号の他、フランス語Œフィンランド語などで用いるŠŽユーロ記号、ISO 8859-1では小文字しか収録されていなかったŸがある。これらの文字は ISO/IEC 8859-15 でも定義されている。

多くのウェブブラウザがMIME charset ISO-8859-1をWindows-1252として扱い (ISO-8859-1の余分な制御コードはどのみちHTMLでは禁止されている)、そのため文字コードはISO-8859-1と宣言しているWebページにしばしばWindows-1252の符号が見られる。これは電子メールクライアントでも同様である。しかしこのような文字の使用には、とりわけ受信側がLinuxやMac OSなど、Windows以外のシステムであるときに、困難が伴う可能性がある。他のシステムは0x80から0x9Fの範囲に意味のある文字を割り当てていないかもしれないし、異なる独自拡張の文字を割り当てているかもしれない。

Windows-1252のような、Windowsで使われるコードページを参照するために「ANSIコードページ」という用語が使われることもある。Windows-1252はMicrosoft Windows用語ではANSIコードページとみなされているが、このコードページがANSIで標準化されたことはない。この名前は (後に変更されてISO-8859-1となった) 初期のANSI草案から取られた。このように、Windows-1252は非標準のコードページであり歴史的理由からANSIコードページと呼ばれている[1]

Unicode (UTF-8形式であることが多い) がWindows-1252などの8ビット「コードページ」に代わって徐々に使われるようになりつつある。

コード表

この項目ではを扱っています。閲覧環境によっては、色が適切に表示されていない場合があります。

以下の表にWindows-1252を示す。下線は制御文字、および制御文字と図形文字の中間的性質をもつ文字を表す。ISO-8859-1からの変更点は背景色を変え、十進表記を「太字・イタリック」にすることで強調している。

Windows-1252 (CP1252)
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x NUL
0
SOH
1
STX
2
ETX
3
EOT
4
ENQ
5
ACK
6
BEL
7
BS
8
TAB
9
LF
10
VT
11
FF
12
CR
13
SO
14
SI
15
1x DLE
16
DC1
17
DC2
18
DC3
19
DC4
20
NAK
21
SYN
22
ETB
23
CAN
24
EM
25
SUB
26
ESC
27
FS
28
GS
29
RS
30
US
31
2x SP
32
!
33
"
34
#
35
$
36
%
37
&
38
'
39
(
40
)
41
*
42
+
43
,
44
-
45
.
46
/
47
3x 0
48
1
49
2
50
3
51
4
52
5
53
6
54
7
55
8
56
9
57
:
58
;
59
<
60
=
61
>
62
?
63
4x @
64
A
65
B
66
C
67
D
68
E
69
F
70
G
71
H
72
I
73
J
74
K
75
L
76
M
77
N
78
O
79
5x P
80
Q
81
R
82
S
83
T
84
U
85
V
86
W
87
X
88
Y
89
Z
90
[
91
\
92
]
93
^
94
_
95
6x `
96
a
97
b
98
c
99
d
100
e
101
f
102
g
103
h
104
i
105
j
106
k
107
l
108
m
109
n
110
o
111
7x p
112
q
113
r
114
s
115
t
116
u
117
v
118
w
119
x
120
y
121
z
122
{
123
|
124
}
125
~
126
DEL
127
8x
128
 
129

130
ƒ
131

132

133

134

135
ˆ
136

137
Š
138

139
Œ
140
 
141
Ž
142
 
143
9x  
144

145

146

147

148

149

150

151
˜
152

153
š
154

155
œ
156
 
157
ž
158
Ÿ
159
Ax NBSP
160
¡
161
¢
162
£
163
¤
164
¥
165
¦
166
§
167
¨
168
©
169
ª
170
«
171
¬
172
SHY
173
®
174
¯
175
Bx °
176
±
177
²
178
³
179
´
180
µ
181

182
·
183
¸
184
¹
185
º
186
»
187
¼
188
½
189
¾
190
¿
191
Cx À
192
Á
193
Â
194
Ã
195
Ä
196
Å
197
Æ
198
Ç
199
È
200
É
201
Ê
202
Ë
203
Ì
204
Í
205
Î
206
Ï
207
Dx Ð
208
Ñ
209
Ò
210
Ó
211
Ô
212
Õ
213
Ö
214
×
215
Ø
216
Ù
217
Ú
218
Û
219
Ü
220
Ý
221
Þ
222
ß
223
Ex à
224
á
225
â
226
ã
227
ä
228
å
229
æ
230
ç
231
è
232
é
233
ê
234
ë
235
ì
236
í
237
î
238
ï
239
Fx ð
240
ñ
241
ò
242
ó
243
ô
244
õ
245
ö
246
÷
247
ø
248
ù
249
ú
250
û
251
ü
252
ý
253
þ
254
ÿ
255

マイクロソフトユニコードコンソーシアムのWebサイト上の情報によれば、符号位置 81, 8D, 8F, 90, および 9D は未使用である。しかし、コードページからUnicodeへ変換するためのWindows API呼び出しはこれらを対応するC1制御記号にマップしている。符号位置 80 のユーロ文字はキャロン (ハーチェク) 付きの S や Z と同様、このコードページの以前のバージョンでは存在していなかった。

英語版のWindowsでは、Windows-1252の文字はAltキーを押下したままゼロに続けて文字の3桁10進符号をテンキーで入力することにより挿入できる (ゼロを省略する点以外同様の方法で、古いコードページ437の文字も入力できる)。

脚注

  1. ^ The Old New Thing: Why is the default 8-bit codepage called "ANSI"?

関連項目

  • Windowsコードページ
  • 西欧のラテン文字集合 (コンピュータ)

外部リンク

  • Windows 1252の参照表 (英語)
  • IANAの文字コード名登録簿 (英語)
  • Windows 1252のUnicode対応表 (英語)
  • "best fit"によるWindows 1252のUnicode対応表 (英語)
日本語用の
文字コード
JIS規格
符号化文字集合
文字符号化方式
文字一覧
JIS以外の公規格
メーカーの規格
符号化文字集合
文字符号化方式
日本語を含む
多言語文字集合
Unicode
ISO/IEC 10646
JIS X 0221
文字符号化方式
文字一覧
TRONコード
日本語以外用の
文字集合
初期の文字コード
ISO/IEC 8859
書誌用
  • ISO 5426
  • ISO 5426-2
  • ISO 5427
  • ISO 5428
  • ISO 6438
  • ISO 6861
  • ISO 6862
  • ISO 9036
  • ISO 10585
  • ISO 10586
  • ISO 10754
  • ISO 11822
  • ANSEL
  • MARC-8
国家標準
EUC
ISO/IEC 2022
  • ISO/IEC 2022 CN
  • ISO/IEC 2022 KR
  • CCCII
MacOS
コードページ
  • Macintosh Standard Roman Character Set
  • アラビア語
  • CentralEurRoman
  • EUC-CN
  • Big5
  • クロアチア語
  • キリル
  • デーヴァナーガリー
  • Dingbats
  • ペルシャ語
  • ギリシア語
  • グジャラート語
  • グルムキー
  • ヘブライ語
  • アイスランド語
  • EUC-KR
  • ルーマニア語
  • MacSymbol
  • TIS-620
  • トルコ語
  • ウクライナ語
DOS
コードページ
  • 437
  • 720
  • 737
  • 775
  • 850
  • 852
  • 855
  • 857
  • 858
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 869
  • KOI8
  • Kamenicky
  • Mazovia
  • MIK
  • Iran System
Windows
コードページ
EBCDIC
コードページ
  • 37
  • 293(英語版)
  • 300(英語版)
  • 310(英語版)
  • 351(英語版)
  • 353(英語版)
  • 355(英語版)
  • 357(英語版)
  • 358(英語版)
  • 359(英語版)
  • 360(英語版)
  • 819
  • 930(英語版)
  • 933(英語版)
  • 939(英語版)
  • 1364(英語版)
  • 1390(英語版)
  • 1399(英語版)
  • 8859(英語版)
その他標準
記号用
プラットフォーム
固有
  • ATASCII
  • CDC display code
  • DEC Radix-50
  • Fieldata
  • GSM 03.38
  • HP roman8
  • PETSCII
  • TI calculator character sets
  • ZX Spectrum character set
ソフトウェア
区分け
概念
関連トピック
カテゴリ カテゴリ