ISO基本ラテンアルファベット

曖昧さ回避 基本ラテン文字」はこの項目へ転送されています。Unicodeのブロックについては「基本ラテン文字 (Unicodeのブロック)」をご覧ください。

ISO基本ラテンアルファベット(アイエスオーきほんラテンアルファベット、ISO basic Latin alphabet)は、ラテン文字ラテンアルファベット)の一種で、大文字小文字それぞれ26文字を含む。国際標準化機構 (ISO) によって国際規格として定められたもので、広く国際通信に用いられている。

ISO基本ラテンアルファベットに含まれる2組の26文字は以下のものである[1][2]

大文字ラテンアルファベット (Uppercase Latin alphabet)
A B C/Č/Ç D E F G H I J K L M N/Ñ O P Q R/Ř S/Š T U V W X Y/Ý Z/Ž
小文字ラテンアルファベット (Lowercase Latin alphabet)
a b c/č/ç d e f g h i j k l m n/ñ o p q r/ř s/š t u v w x y/ý z/ž

歴史

1960年代までに、第一世界におけるコンピュータおよび電気通信の分野で、文字をコード化するための専有されていない方法が必要であることが明らかになってきた。国際標準化機構 (ISO) は、ラテン文字のための7ビット文字コードISO 646として制定した。広く受け入れられるようにするために、この規格は、既に使用実績のある文字コードをベースとした。それは米国規格協会(ASA、後のANSI)が制定したAmerican Standard Code for Information Interchange(略称・ASCII)であった。ASCIIは英語アルファベットの26文字×2を含んでいた。ISOによって後に制定された規格、例えばISO/IEC 8859(8ビット文字コード)やISO/IEC 10646Unicodeと互換の文字コード)もまた、英語アルファベットの26文字×2を基本的なラテン文字と定義し、それに英語以外の言語で用いられる文字を拡張として加える形を取った[1]

用語

文字を含むUnicodeブロックの名称

詳細は「基本ラテン文字 (Unicodeのブロック)」を参照

Unicodeで基本ラテンアルファベットを含むブロック (U+0000-007F) は"C0 Controls and Basic Latin"(C0制御文字及び基本ラテン文字)と呼ばれる。

2つのサブセットの名称

Unicode 7.0では、基本ラテン文字は以下の2つのサブセットを持つ[3]

  • "Uppercase Latin alphabet"(大文字ラテンアルファベット)- 文字名称に "LATIN CAPITAL LETTER" の文字列を含む文字の集合
  • "Lowercase Latin alphabet"(小文字ラテンアルファベット)- 文字名称に "LATIN SMALL LETTER" の文字列を含む文字の集合

文字の名称

UnicodeでFF00からFFEFまでには全角の基本ラテンアルファベットが含まれる[4]

  • FF21 A FULLWIDTH LATIN CAPITAL LETTER A
  • FF41 a FULLWIDTH LATIN SMALL LETTER A

文字のコード化の年表

  • 1865年: パリで開催された国際電信会議で国際モールス符号が制定される。この規格は後に国際電気通信連合 (ITU) により採用される。
  • 1950年代: 国際民間航空機関 (ICAO) により無線電話通話表が制定される。[1]
  • 1963年: 米国規格協会(ASA、後のANSI)によりASCII(7ビット文字コード)が制定される。
  • 1963-1964年: IBMによりEBCDICが開発される。ASCIIと同じ文字をコード化したものだが、コードの値は異なる。
  • 1972年: 国際標準化機構 (ISO) がISO 646を制定。ASCIIと同じコード値を採用した。1983年に第2版 (ISO 646:1983) が出され、1991年に国際電気標準会議 (IEC) と共同の規格として ISO/IEC 646:1991 となった。
  • 1983年: 国際電気通信連合のITU-TがITU-T勧告 T.51 を制定。ASCIIのマルチバイト拡張。同年、ISOにより国際規格ISO 6937となる。
  • 1987年: ISO 8859-1:1987 制定(ラテンアルファベットの8ビット文字コード)
  • 1980年代中頃-後半: Microsoft Windowsで使用されるWindows-1250(英語版)Windows-1252が制定される。(おおまかにはISO/IEC 8859-1に似ている)
  • 1990年: ユニコードコンソーシアムによりUnicode 1.0が開発される[5][6]。ASCIIやISO/IEC 646と同じコード値を使用した「C0 制御文字と基本ラテン文字」ブロックを含む。
  • 1993年: Unicode 1.1互換のISO/IEC標準 ISO/IEC 10646-1:1993 が制定される。

表現

16セグメントディスプレイに表示されるアラビア数字とISO基本ラテンアルファベット

基本ラテンアルファベットは、ASCIIでは印刷可能な文字 (printable characters) に、version 1.0以降のUnicodeでは「C0制御文字及び基本ラテン文字」ブロックに属している。どちらにおいても、また、ISO/IEC 646, ISO/IEC 8859, ISO/IEC 10646においても、十六進数で大文字は41から5A、小文字は61から7Aに位置している。

使用例

国際音声記号 (IPA) では全ての小文字を使用している。X-SAMPASAMPAでは、IPAと同じ文字はIPAと同じ音声を表す。キルシェンバウムでは、"r"以外は同様である。

関連項目

脚注

  1. ^ a b “Internationalisation standardization of 7-bit codes, ISO 646”. Trans-European Research and Education Networking Association (TERENA). 2010年10月3日閲覧。
  2. ^ “RFC1815 – Character Sets ISO-10646 and ISO-10646-J-1”. 2010年10月3日閲覧。
  3. ^ http://www.unicode.org/charts/PDF/U0000.pdf
  4. ^ http://www.unicode.org/charts/PDF/UFF00.pdf
  5. ^ “Unicode character database”. The Unicode Standard. 2013年3月22日閲覧。
  6. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc.. (1990). ISBN 0-201-56788-1 

Aa  Bb  Cc/Çç  Dd  Ee  Ff  Gg  Hh  Ii  Jj  Kk  Ll  Mm  Nn/Ññ  Oo  Pp  Qq  Rr  Ss  Tt  Uu  Vv  Ww  Xx  Yy  Zz 

カテゴリ カテゴリ
日本語用の
文字コード
JIS規格
符号化文字集合
文字符号化方式
文字一覧
JIS以外の公規格
メーカーの規格
符号化文字集合
文字符号化方式
日本語を含む
多言語文字集合
Unicode
ISO/IEC 10646
JIS X 0221
文字符号化方式
文字一覧
TRONコード
日本語以外用の
文字集合
初期の文字コード
ISO/IEC 8859
書誌用
  • ISO 5426
  • ISO 5426-2
  • ISO 5427
  • ISO 5428
  • ISO 6438
  • ISO 6861
  • ISO 6862
  • ISO 9036
  • ISO 10585
  • ISO 10586
  • ISO 10754
  • ISO 11822
  • ANSEL
  • MARC-8
国家標準
EUC
ISO/IEC 2022
  • ISO/IEC 2022 CN
  • ISO/IEC 2022 KR
  • CCCII
MacOS
コードページ
  • Macintosh Standard Roman Character Set
  • アラビア語
  • CentralEurRoman
  • EUC-CN
  • Big5
  • クロアチア語
  • キリル
  • デーヴァナーガリー
  • Dingbats
  • ペルシャ語
  • ギリシア語
  • グジャラート語
  • グルムキー
  • ヘブライ語
  • アイスランド語
  • EUC-KR
  • ルーマニア語
  • MacSymbol
  • TIS-620
  • トルコ語
  • ウクライナ語
DOS
コードページ
  • 437
  • 720
  • 737
  • 775
  • 850
  • 852
  • 855
  • 857
  • 858
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 869
  • KOI8
  • Kamenicky
  • Mazovia
  • MIK
  • Iran System
Windows
コードページ
EBCDIC
コードページ
  • 37
  • 293(英語版)
  • 300(英語版)
  • 310(英語版)
  • 351(英語版)
  • 353(英語版)
  • 355(英語版)
  • 357(英語版)
  • 358(英語版)
  • 359(英語版)
  • 360(英語版)
  • 819
  • 930(英語版)
  • 933(英語版)
  • 939(英語版)
  • 1364(英語版)
  • 1390(英語版)
  • 1399(英語版)
  • 8859(英語版)
その他標準
記号用
プラットフォーム
固有
  • ATASCII
  • CDC display code
  • DEC Radix-50
  • Fieldata
  • GSM 03.38
  • HP roman8
  • PETSCII
  • TI calculator character sets
  • ZX Spectrum character set
ソフトウェア
区分け
概念
関連トピック
カテゴリ カテゴリ