アラビア文字 (Unicodeのブロック)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
アラビア文字 (Unicodeのブロック)
Arabic
範囲 U+0600..U+06FF
(256 個の符号位置)
基本多言語面
用字 アラビア文字
ペルシャ文字
主な言語・文字体系
割当済 256 個の符号位置
未使用 0 個の保留
Unicodeのバージョン履歴
1.0.0 169 (+169)
1.1 194 (+25)
3.0 206 (+12)
3.2 208 (+2)
4.0 227 (+19)
4.1 235 (+8)
5.1 250 (+15)
6.0 252 (+2)
6.1 253 (+1)
6.3 254 (+1)
7.0 255 (+1)
14.0 256 (+1)
テンプレートを表示

アラビア文字(アラビアもじ、英語: Arabic)は、Unicodeの13個目のブロック

解説[編集]

中東及び北アフリカ地域に広がるアラブ圏で広く話されている、イスラム教の聖典言語であるアラビア語に加え、イラン公用語であるペルシャ語パキスタンの公用語であるウルドゥー語アフガニスタンの公用語であるパシュトー語中華人民共和国新疆ウイグル自治区に居住するテュルク系少数民族であるウイグル人に話されているウイグル語イラクイラントルコ等のクルディスタン地域に居住するクルド人に話されているクルド語(特にソラニー方言)などの、ムスリムの多く居住するイスラム圏で用いられる他の言語の表記にも用いられるアラビア文字を収録している。

現在はアラビア文字での表記が一般的ではなくなっているものの、かつては正書法がアラビア文字であったトルコ語アゼルバイジャン語(ただしイランなどに居住するアゼルバイジャン人の話す南アゼルバイジャン語では現在もアラビア文字を用いる)、マレー語カザフ語などのための文字や、現在は死語となっているオスマン語古典アラビア語などのための文字も本ブロックに含まれている。

アラビア文字は音素文字のうち、子音のみを記述するアブジャドであり、「アブジャド」の名称もアラビア文字の古典的な並び順(アブジャド順)における最初の4文字(アリフバージームダール)に由来している。一般的な文書では母音を記述しないが、イスラム教の聖典であるクルアーン(コーラン)や、初学者及び初等教育用の教材など正しい単語の読みを明示する必要がある文書ではシャクルと呼ばれる母音記号が用いられるため、これらの記号も本ブロックに収録されている。

書字方向ヘブライ文字などと同様に右から左へと横書きされ(右横書き)、一部の例外となる文字を除いてラテン文字筆記体のように同じ単語の文字同士は繋げて綴られる。また、各文字はその単語内の位置によって独立形、語頭形、語中形、語末形の4種類の形状を取るが、本ブロック内においては単語内の位置による字形差は符号位置上は統一されており、フォント内でその挙動を制御する仕様になっている。但し、一部の文字についてはアラビア文字表示形A及びアラビア文字表示形Bブロックに単語内位置における字形差の符号位置を分けられたものが収録されている。

なお、アラビア文字から派生した、ペルシャ語を表記するためのペルシャ文字や、ウルドゥー語の表記に用いられるウルドゥー文字パンジャーブ語ラフンダー語などの表記に用いられるシャームキー文字、かつてマレー語の表記に用いられていたジャウィ文字(ただしタイに居住するマレー系民族の話すジャウィ語では現在でも使われ、マレーシアにおいても看板などの地名表記には現在でも使われている)、インドネシアでかつてジャワ語スンダ語マドゥラ語などの表記に用いられていたぺゴン文字英語版ナイジェリアニジェールなどで話されるハウサ語及び、ブルキナファソマリで話されるフラニ語の表記に用いられるアジャミ英語版、かつてマダガスカル語の表記に用いられていたソラベ文字英語版などは文献によっては別の文字体系として扱われていることがあるが、Unicode上はアラビア文字の変種として扱われ、同じ文字体系として扱われている。また、ウルドゥー語やカシミール語の表記に用いられるアラビア文字はナスタアリーク体と呼ばれる一般的なアラビア文字とは大きく字形の異なる書体が使われているが、こちらもUnicode上はアラビア文字と同じ表記体系として扱われているため、これらの文字も本ブロックに含まれている。

Unicodeのバージョン1.0においても「アラビア文字(Arabic)」というブロック名で制定されていた。[1]

収録文字[編集]

「ラテン文字転写」の列はアラビア文字のラテン翻字方式の一つであるISO 233に従う。なお、言語名の後に括弧書きで年号や年号の範囲が書かれているものについては、その期間でのみ使われたことがあり、現在では廃字となってその言語では用いられなくなっているか、あるいは一般的な表記ではなくなっていることを表す。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
ベースライン下方のマーカー
U+0600 ؀ ARABIC NUMBER SIGN アラビア文字における番号記号。ラテン文字などの"#"にあたる。アラビア・インド数字で書かれた数値の下に書かれる。[2][3]
U+0601 ؁ ARABIC SIGN SANAH アラビア文字において年号の数値の下に書かれる記号。[2][3]

U+0604 とは異なり主にグレゴリオ暦イスラム暦(ヒジュラ暦)で用いられ、グレゴリオ暦の場合は年号とこの記号の後に「キリスト教の」を意味するアラビア語عيسوي ʿīsawīの略である字母ain(U+0639 ع)の語頭形を、イスラム暦の場合はムハンマド聖遷(ヒジュラ)を表すアラビア語 هجري hijrīの略である字母heh doachashmee(U+06BE ھ)を記す。[4]

U+0602 ؂ ARABIC FOOTNOTE MARKER アラビア文字において脚註を示す際に用いられる記号で、註釈が必要な個所に脚註番号を表すアラビア・インド数字の下に書かれて、ページの下部などに再度同じ数字とこの記号の組み合わせが使われて註釈の情報が記される。[2][3][5]

ラテン文字などにおけるアスタリスク(*)やダガー()と同じような機能を持つ。

U+0603 ؃ ARABIC SIGN SAFHA
U+0604 ؄ ARABIC SIGN SAMVAT ウルドゥー語ヴィクラマ暦の年号を書くために使用する記号。[6]年号を示すアラビア・インド数字の下に書かれて、書かれた数値がヴィクラマ暦による年数の表記であることを示す。[4]
ベースライン上方のマーカー
U+0605 ؅ ARABIC NUMBER MARK ABOVE コプト暦数字英語版で用いられることがある。[6]
根号
U+0606 ؆ ARABIC-INDIC CUBE ROOT アラビア文字における3乗根(立方根)の数学記号[7]
U+0607 ؇ ARABIC-INDIC FOURTH ROOT アラビア文字における4乗根(二重平方数)の数学記号。[7]
文字様記号
U+0608 ؈ ARABIC RAY アラビア文字における数学記号で「直線」を表す。[7]
約物
U+0609 ؉ ARABIC-INDIC PER MILLE SIGN アラビア文字における千分率(パーミル)の記号。[7]
U+060A ؊ ARABIC-INDIC PER TEN THOUSAND SIGN アラビア文字における万分率の記号。[7]
通貨記号
U+060B ؋ AFGHANI SIGN アフガニスタンの公定通貨であるアフガニ通貨記号
約物
U+060C ، ARABIC COMMA アラビア文字における読点コンマ)。

現代の文章ではターナ文字シリア文字でも用いられる。[6]

U+060D ؍ ARABIC DATE SEPARATOR アラビア文字において、日付と月の名前の間の区切りに使われる記号。[2][3]
詩用記号
U+060E ؎ ARABIC POETIC VERSE SIGN 詩においてビュレットとして用いられる記号。行の先頭に書かれる。[2][5][3]
U+060F ؏ ARABIC SIGN MISRA
敬称用記号
U+0610 ؐ ARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。

「彼に神の平安と祝福がありますように」を意味するアラビア語"sallallahu alayhe wasallam"を表す。[6][2][3][8]

U+0611 ؑ ARABIC SIGN ALAYHE ASSALLAM イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。

「彼に平安がありますように」を意味するアラビア語"alayhe assalam"を表す。[6][2][3][8]

U+0612 ؒ ARABIC SIGN RAHMATULLAH ALAYHE イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。

「神が彼に慈悲を与えますように」を意味するアラビア語"rahmatullah alayhe"を表す。[6][2][3][8]

U+0613 ؓ ARABIC SIGN RADI ALLAHOU ANHU イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。

「神が彼を喜ばれますように」を意味するアラビア語"radi allahu ’anhu"を表す。[6][2][3][8]

U+0614 ؔ ARABIC SIGN TAKHALLUS 詩人の名前や名前の上に置かれる記号、または一部の文章ですべての固有名詞をマークするために使用される記号。[6][2][3][8]
クルアーンの註釈記号
U+0615 ؕ ARABIC SMALL HIGH TAH イラン及びパキスタンで出版される一部のクルアーンで、読み上げ中に休止すべき位置を示す記号。[6]

U+0679 ٹ などの一部の文字の発音記号として使用される小さな TAH 記号と混同しないこと。[6]

拡張アラビア記号
U+0616 ؖ ARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH ARABIC SMALL HIGH LIGATURE ALEF WITH YEH BARREEとも呼ぶ。[6]

早期ペルシャ語(10~16世紀)[6][9]

クルアーンの註釈記号
U+0617 ؗ ARABIC SMALL HIGH ZAIN イランクルアーンで用いられる記号で、本文中に出現する箇所で一時停止してもよいが、間を置かずに経典を読み上げることが推奨されることを示すために使用される。アラブ圏でのクルアーンにおけるU+06D6 ۖと同じ役割を持つ。[10]
U+0618 ؘ ARABIC SMALL FATHA 064E َ FATHA と混同しないこと。[6]これらの通常のものより小さなシャクルクルアーンで使用され、節の頭の字母アリフ(U+0627 ا)に付加される。前の節から休止を挟まずに経典を読む場合にアリフが表す子音[ʔ]を発音せずに前の節の最後の子音に小さなシャクルが表す母音を付加して読むことを表す。[10]
U+0619 ؙ ARABIC SMALL DAMMA 064F ُ DAMMAと混同しないこと。[6]これらの通常のものより小さなシャクルクルアーンで使用され、節の頭の字母アリフ(U+0627 ا)に付加される。前の節から休止を挟まずに経典を読む場合にアリフが表す子音[ʔ]を発音せずに前の節の最後の子音に小さなシャクルが表す母音を付加して読むことを表す。[10]
U+061A ؚ ARABIC SMALL KASRA 0650 ِ KASRAと混同しないこと。[6]これらの通常のものより小さなシャクルクルアーンで使用され、節の頭の字母アリフ(U+0627 ا)に付加される。前の節から休止を挟まずに経典を読む場合にアリフが表す子音[ʔ]を発音せずに前の節の最後の子音に小さなシャクルが表す母音を付加して読むことを表す。[10]
約物
U+061B ؛ ARABIC SEMICOLON アラビア文字におけるセミコロン

現代の文章ではターナ文字シリア文字でも用いられる。[6]

制御文字
U+061C ؜ ARABIC LETTER MARK ラテン文字などの左横書き文字とアラビア文字が混在している双方向テキストで直前の文字がアラビア文字であることを表す際に用いられる制御文字。具体的なグリフや文字幅を持たない。

主に番号付きリストや数式、日付と共に用いられ、数字の直前にこの文字を置くことで、算用数字を自動的にアラビア・インド数字に変換し、数字の位置が右寄せになるように調整されることを意図している。[11]

一般的にALMと略される。[6]

約物
U+061D ؝ ARABIC END OF TEXT MARK 最後の文章の末尾に通常のピリオドの代わりに付けられる約物。[12]
U+061E ؞ ARABIC TRIPLE DOT PUNCTUATION MARK ハウサ語ウォロフ語フラニ語マンディンカ語などのアフリカの言語における古い正書法で句点(ピリオド)として用いられていた記号。現在は使われなくなった。[13]
U+061F ؟ ARABIC QUESTION MARK アラビア文字における疑問符

現代の文章ではターナ文字シリア文字でも用いられる。[6]

カシミール語用の追加文字
U+0620 ؠ ARABIC LETTER KASHMIRI YEH カシミール語

直前の子音が口蓋化している(IPA:[-ʲ])ことを表す。

ISO 8859-6に基づく文字
U+0621 ء ARABIC LETTER HAMZA ハムザ。子音[ʔ]を表す。

アラビア語

ˌ
U+0622 آ ARABIC LETTER ALEF WITH MADDA ABOVE マッダの付いたアリフ。[ʔaː]という発音を表す。

アラビア語

U+0623 أ ARABIC LETTER ALEF WITH HAMZA ABOVE ハムザが上に付いたアリフ。[ʔa]または[ʔu]という発音を表す。

カザフ語トルクメン語(~1929)では母音[æ]を表す。

ˈ
U+0624 ARABIC LETTER WAW WITH HAMZA ABOVE ハムザの付いたワーウ。[ʔu]という発音を表す。

パシュトー語では母音[o]、バローチー語では二重長母音[ɑuː]、、アゼルバイジャン語南アゼルバイジャン語)、トルクメン語イランアフガニスタン国内で)では母音[ø]を表す。

U+0625 ARABIC LETTER ALEF WITH HAMZA BELOW ハムザが下に付いたアリフ。[ʔi]という発音を表す。 ʾ
U+0626 ARABIC LETTER YEH WITH HAMZA ABOVE ハムザが付いたヤー。[ʔi]という発音を表す。

パシュトー語では二重母音[aɪ]を、オルムル語英語版では二重母音[əɪ]を、バローチー語アゼルバイジャン語南アゼルバイジャン語)、タタール語(1920~1927)では母音[ɛ]を表す。

通常ハムザは左上に書かれるが、キルギス語ではハムザは独立形と語末形で一貫して右上に置かれる。[6]

U+0627 ا ARABIC LETTER ALEF アリフ。子音[ʔ]を表す。

ウイグル語ゼルバイジャン語南アゼルバイジャン語)では母音[a]を表す。

ʾ
U+0628 ب ARABIC LETTER BEH バー。子音[b]を表す。 b
U+0629 ة ARABIC LETTER TEH MARBUTA ター・マルブータ。必ず語末にのみ現れ、女性名詞語尾である[-at]を表す。

アラビア語でしか使われない。

U+062A ARABIC LETTER TEH ター。子音[t]を表す。 t
U+062B ARABIC LETTER THEH サー。子音[θ]を表す。
U+062C ج ARABIC LETTER JEEM ジーム。子音[d͡ʒ]を表す。 ǧ
U+062D ARABIC LETTER HAH ハー。子音[ħ]を表す。
U+062E ARABIC LETTER KHAH ハー。子音[x]を表す。
U+062F د ARABIC LETTER DAL ダール。子音[d]を表す。 d
U+0630 ذ ARABIC LETTER THAL ザール。子音[ð]を表す。
U+0631 ر ARABIC LETTER REH ラー。子音[r]を表す。

クルド語ラニー方言)では子音[ɾ]を表す。

r
U+0632 ز ARABIC LETTER ZAIN ザイン。子音[z]を表す。 z
U+0633 س ARABIC LETTER SEEN スィーン。子音[s]を表す。 s
U+0634 ARABIC LETTER SHEEN シーン。子音[ʃ]を表す。 š
U+0635 ص ARABIC LETTER SAD サード。子音[sˤ]を表す。咽頭化した[s]。
U+0636 ض ARABIC LETTER DAD ダード。子音[dˤ]を表す。咽頭化した[d]。

咽頭化した子音はアラビア語以外の言語では珍しく、発音のしづらさから俗にアラビア語を母語とするアラブ人のことを「ダードの民」と呼ぶことがある。

U+0637 ط ARABIC LETTER TAH ター。子音[tˤ]を表す。咽頭化した[t]。
U+0638 ARABIC LETTER ZAH ザー。子音[ðˤ]を表す。咽頭化した[ð]。
U+0639 ع ARABIC LETTER AIN アイン。子音[ʕ]を表す。 ʿ
U+063A غ ARABIC LETTER GHAIN ガイン。子音[ɣ]を表す。 ġ
早期ペルシャ語及びアゼルバイジャン語用の追加文字
U+063B ػ ARABIC LETTER KEHEH WITH TWO DOTS ABOVE 早期ペルシャ語(10~16世紀)[9]

子音[ɡ]やその異音である[ŋ]を表していたが、のちにU+06AF گ、U+06AB ګ、U+06AD ڭに置換され使われなくなった。[9]

U+063C ؼ ARABIC LETTER KEHEH WITH THREE DOTS BELOW 早期ペルシャ語(10~16世紀)[9]

子音[ɡ]やその異音である[ŋ]を表していたが、のちにU+06AF گ、U+06AB ګ、U+06AD ڭに置換され使われなくなった。[9]

U+063D ؽ ARABIC LETTER FARSI YEH WITH INVERTED V アゼルバイジャン語(1992~)[9]

子音[j]あるいは母音[ɯ]を表すのに用いられた。[9]

U+063E ؾ ARABIC LETTER FARSI YEH WITH TWO DOTS ABOVE 早期ペルシャ語(10~16世紀)[9]

長母音[iː]を表す。異なる語源による文法上の違いや強勢の有無を明示するために用いられた。[9]

U+063F ؿ ARABIC LETTER FARSI YEH WITH THREE DOTS ABOVE 早期ペルシャ語(10~16世紀)[9]

長母音[iː]を表す。異なる語源による文法上の違いや強勢の有無を明示するために用いられた。[9]

ISO 8859-6に基づく文字
U+0640 ـ ARABIC TATWEEL タットウィールあるいはカシーダ(kashida)。[6]強調や割付の調整などの目的で文字を引き伸ばすため、あるいは文法書などでベースとなる文字なしで単独の母音記号などを表記したり、文字の位置による字形変化を示すために用いられる。[6]

アドラム文字ハニーフィー・ロヒンギャ文字マンダ文字マニ文字詩篇パフラヴィー文字ソグド文字シリア文字でも使用される。[6]

U+0641 ARABIC LETTER FEH ファー。子音[f]を表す。 f
U+0642 ARABIC LETTER QAF カーフ。子音[q]を表す。 q
U+0643 ك ARABIC LETTER KAF カーフ。子音[k]を表す。 k
U+0644 ل ARABIC LETTER LAM ラーム。子音[l]を表す。 l
U+0645 م ARABIC LETTER MEEM ミーム。子音[m]を表す。

シンド語では短い尾を持つ形状で書かれる。[6]

m
U+0646 ن ARABIC LETTER NOON ヌーン。子音[n]を表す。 n
U+0647 ه ARABIC LETTER HEH ハー。子音[h]を表す。 h
U+0648 ARABIC LETTER WAW ワーウ。子音[w]を表す。但しペルシャ語や、タジク語などペルシャ文字を借用した言語のいくつかでは[v]を表す。

アラビア語ではこの文字単独でwaと読み、「~と(AND)」を表す。

カシミール語では長母音[oː]を、キルギス語ダルグワ語(1920~1928)では母音[o]を、カラカルパク語(~1932)では母音[o]あるいは母音[ø]を表す。

w
U+0649 ARABIC LETTER ALEF MAKSURA アラビア語では、アリフの変種の一つであり、定冠詞がつくことで長母音[aː]から短母音[a]に変化したことを表すアリフ・マクスーラとして用いられる。現在では発音されなくなったが、元は語尾に[-j]を伴っていたことに由来する。

ウイグル語などでは母音を表すために、どの位置で書かれていても下にドットの付かない ヤーと同形の文字として用いられる。[6]なお、子音[j]については通常の字母ya(U+064A )を用いる。

ウイグル語、ボスニア語(15世紀~19世紀)、ダルグワ語(1920~1928)では母音[i]を、キルギス語カラカルパク語(~1932)、トルクメン語(~1929)では母音[i]あるいは[ɯ]を、カザフ語では母音[ə]を表す。

この文字とは別にDOTLESS YEHと命名されている文字があるが、こちらはペルシャ語などで用いられるヤーの変種の一つで、単語中の書かれる位置によって点がついたり付かなかったりするため、挙動の違いから符号位置を分けられている。

U+0654 ٔ と組み合わせて使用することは意図されていない。[6]

U+064A ARABIC LETTER YEH ヤー。子音[j]を表す。

U+0654 ٔ と組み合わせて使用すると下部の点が消える。[6]

一方、それ以外の結合記号と組み合わせて使用しても下部の点は消えない。[6]

y
ISO 8859-6典拠の母音記号
U+064B ً ARABIC FATHATAN ファトハタン。母音[-an]を表す母音記号(シャクル)。
U+064C ٌ ARABIC DAMMATAN ダンマタン。母音[-un]を表す母音記号(シャクル)。

異体字として、片方が180度回転した2 つの絡み合ったダンマとして書かれることもある。[6]

U+064D ٍ ARABIC KASRATAN カスラタン。母音[-in]を表す母音記号(シャクル)。
U+064E َ ARABIC FATHA ファトハ。母音[-a]を表す母音記号(シャクル)。
U+064F ُ ARABIC DAMMA ダンマ。母音[-u]を表す母音記号(シャクル)。
U+0650 ِ ARABIC KASRA カスラ。母音[-i]を表す母音記号(シャクル)。
U+0651 ّ ARABIC SHADDA シャッダ。子音字を重子音で読むことを表す記号(シャクル)。日本語で言う「」にあたる。

マダガスカル語(旧正書法)では子音の前鼻音化を表す。

U+0652 ْ ARABIC SUKUN スクーン。無母音であり、子音のみを発音することを表す記号(シャクル)。[6]

一部のクルアーンでは、長母音が無視されていることを示すために使用される。[6]

通常は小さな円で書かれるが、クルアーンにおいては異体字のU+06E1 ۡのような形で書かれることもある。[6]

アゼルバイジャン語南アゼルバイジャン語)、トルクメン語イランアフガニスタン国内で)においては字母waw(U+0648 ﻭ)と共に用いられ、母音[o]を表す。

結合用のマッダ及びハムザ
U+0653 ٓ ARABIC MADDAH ABOVE マッダ。[aː]という長母音を表す。U+0622を参照。

南アジア及びインドネシアの正書法ではmadd jaa'izに使用される。[6]

U+0654 ٔ ARABIC HAMZA ABOVE アラビア語などではアリフ、ワーウ、ヤーに付いて頭子音[ʔ]があることを表す記号であるハムザとして使われる。

ペルシャ語などでは二つの単語の間におかれ[-i-]と発音される「~の(of)」を表すエザーフェと呼ばれる接語を表し、発音のみならず文法的な機能も明示するためこの記号が用いられる。[14]

この文字はハムザ及びエザーフェとしての用途に限定される。[6]

カシミール語では母音[ə]を表す。

U+0655 ٕ ARABIC HAMZA BELOW ハムザアリフ、ワーウ、ヤーに付いて頭子音[ʔ]があることを表す記号。母音[-i]も伴うことを示す。

カシミール語では母音[ɨ]を表す。

その他の結合記号
U+0656 ٖ ARABIC SUBSCRIPT ALEF 長母音[iː]を表す。あるいは、ペルシア語やウルドゥー語など/i/と/e/の弁別がある言語において/e/ではなく/i/であることを示す母音記号。[2]
U+0657 ٗ ARABIC INVERTED DAMMA 長母音[uː]を表す。あるいは、ペルシア語やウルドゥー語など/u/と/o/の弁別がある言語において/o/ではなく/u/であることを示す母音記号。[2]

ulta peshとも呼ばれる。[6] カシミール語ウルドゥー語[6]

カシミール語では字母waw(U+0648 و)と共に用いられ、長母音[uː]を表す。

U+0658 ٘ ARABIC MARK NOON GHUNNA ウルドゥー語バローチー語[6]シャームキー文字西パンジャーブ語、ラフンダー語)

ウルドゥー語では鼻音化[6]、シャームキー文字では鼻母音を表す。


U+0659 ٙ ARABIC ZWARAKAY パシュトー語[6]母音[ə]を表す。[15]
U+065A ٚ ARABIC VOWEL SIGN SMALL V ABOVE アフリカの諸言語[6]カシミール語[16]

カシミール語ではU+06D2 ےと共に用いられ、母音[e]を表す。

U+065B ٛ ARABIC VOWEL SIGN INVERTED SMALL V ABOVE アフリカの諸言語[6]アゼルバイジャン語南アゼルバイジャン語)、トルクメン語イランアフガニスタン国内で)、ボスニア語(15世紀~19世紀)

アゼルバイジャン語、トルクメン語ではU+06CC یと共に用いられ、母音[ɯ]を表す。

ボスニア語ではU+06BA ںと共に用いられ、子音[ɲ]を表す。[17]

U+065C ٜ ARABIC VOWEL SIGN DOT BELOW アフリカの諸言語[6]

アフリカや他の地域の正書法におけるクルアーンの文章で使用される。[6]

ハウサ語では母音[e]を表す。

U+065D ٝ ARABIC REVERSED DAMMA アフリカの諸言語[6]ソンガイ語英語版プラール語英語版ザルマ語フラニ語など)[18]

主に北アフリカで母音[o]を表すために使用される。[18]

U+065E ٞ ARABIC FATHA WITH TWO DOTS カラム語[6]カラム語では前母音の[a]と後母音の[ɑ]を弁別するため、前母音を表すためにこの記号を使用する。後母音には通常のファトハ(U+064E َ)が使われる。[18]
U+065F ٟ ARABIC WAVY HAMZA BELOW カシミール語[6]長母音[ɨː]を表す。
アラビア・インド数字
U+0660 ٠ ARABIC-INDIC DIGIT ZERO アラビア語で用いられるアラビア・インド数字0
U+0661 ١ ARABIC-INDIC DIGIT ONE アラビア語で用いられるアラビア・インド数字1
U+0662 ٢ ARABIC-INDIC DIGIT TWO アラビア語で用いられるアラビア・インド数字2
U+0663 ٣ ARABIC-INDIC DIGIT THREE アラビア語で用いられるアラビア・インド数字3
U+0664 ٤ ARABIC-INDIC DIGIT FOUR アラビア語で用いられるアラビア・インド数字4
U+0665 ٥ ARABIC-INDIC DIGIT FIVE アラビア語で用いられるアラビア・インド数字5
U+0666 ٦ ARABIC-INDIC DIGIT SIX アラビア語で用いられるアラビア・インド数字6
U+0667 ٧ ARABIC-INDIC DIGIT SEVEN アラビア語で用いられるアラビア・インド数字7
U+0668 ٨ ARABIC-INDIC DIGIT EIGHT アラビア語で用いられるアラビア・インド数字8
U+0669 ٩ ARABIC-INDIC DIGIT NINE アラビア語で用いられるアラビア・インド数字9
約物
U+066A ٪ ARABIC PERCENT SIGN アラビア文字における百分率(パーセント)の記号。
U+066B ٫ ARABIC DECIMAL SEPARATOR アラビア文字における小数点
U+066C ٬ ARABIC THOUSANDS SEPARATOR アラビア文字における位取り点。3桁ごとに区切られる。

アラビア文字におけるコンマ(U+060C ،)と同様の形状をしており、ラテン文字などのコンマを180度回転させたような形状をしている。[19]

U+066D ٭ ARABIC FIVE POINTED STAR アラビア文字におけるアスタリスク

書体によって様々な字形に変化する。[6]

古代の文字
U+066E ٮ ARABIC LETTER DOTLESS BEH 初期のアラビア語における字母バー(U+0628 ب)の字形。

元々は点が付いておらず、ター(U+062A )やサー(U+062B )と字形上は区別されていなかった。[20][21]

U+066F ٯ ARABIC LETTER DOTLESS QAF 初期のアラビア語における字母カーフ(U+0642 )の字形。

元々は点が付いていなかった。[20][21]

母音記号
U+0670 ٰ ARABIC LETTER SUPERSCRIPT ALEF 小アリフあるいは短剣アリフ。長母音[aː]を表す。 هذا hādhā (これ)のhāの部分のように通常の綴り上でアリフが書かれない場合に用いられる。

文字名に反して、実際には母音記号である。[6]

ハウサ語ではU+065C ٜと共に用いられ、長母音[eː]を表す。

拡張アラビア文字
U+0671 ٱ ARABIC LETTER ALEF WASLA ワスラの付いたアリフ。文頭以外での定冠詞"(a)l-"など、発音上は読まれないアリフを表す。

クルアーンにおけるアラビア語で用いられる。[6]

U+0672 ٲ ARABIC LETTER ALEF WITH WAVY HAMZA ABOVE バローチー語カシミール語[6]カシミール語では長母音[əː]を表す。
非推奨文字
U+0673 ٳ ARABIC LETTER ALEF WITH WAVY HAMZA BELOW カシミール語[6]長母音[ɨː]を表す。

この文字は非推奨であるため、使用は強く推奨されない。Unicodeでは代わりにU+0627 U+065Fの2文字のシーケンス(اٟ)で表記することを推奨している。[6]

高位置のハムザ
U+0674 ٴ ARABIC LETTER HIGH HAMZA カザフ語ジャウィ語[6]

二重音字(ダイグラフ)を形成する。[6]

カザフ語用の二重音字
U+0675 ٵ ARABIC LETTER HIGH HAMZA ALEF Unicode上はU+0674 U+0627 ٴا の2文字で表記することが推奨されている。[6]

母音[æ]を表す。

U+0676 ٶ ARABIC LETTER HIGH HAMZA WAW Unicode上はU+0674 U+0648 ٴو の2文字で表記することが推奨されている。[6]

母音[ø]を表す。

U+0677 ٷ ARABIC LETTER U WITH HAMZA ABOVE Unicode上はU+0674 U+06C7 ٴۇ の2文字で表記することが推奨されている。[6]

母音[ʉ]を表す。

U+0678 ٸ ARABIC LETTER HIGH HAMZA YEH Unicode上はU+0674 U+0649 ٴى の2文字で表記することが推奨されている。[6]

母音[ɘ]あるいは二重母音[əɪ]を表す。

拡張アラビア文字
U+0679 ٹ ARABIC LETTER TTEH ウルドゥー語[6]バローチー語カシミール語パンジャーブ語西パンジャーブ語)、ラフンダー語ブルシャスキー語ロヒンギャ語トルワル語シナー語

子音[ʈ]を表す。

U+067A ٺ ARABIC LETTER TTEHEH シンド語[6]子音[ʈʰ]を表す。
U+067B ٻ ARABIC LETTER BEEH シンド語[6]ハウサ語

子音[ɓ]を表す。

U+067C ټ ARABIC LETTER TEH WITH RING パシュトー語[6]オルムル語英語版

子音[ʈ]を表す。

U+067D ٽ ARABIC LETTER TEH WITH THREE DOTS ABOVE DOWNWARDS シンド語[6]

子音[ʈ]を表す。

U+067E پ ARABIC LETTER PEH ペルシャ語ウルドゥー語[6]パシュトー語ウイグル語シンド語バローチー語カシミール語クルド語ソラニー方言)、パンジャーブ語西パンジャーブ語)、ラフンダー語カザフ語キルギス語タジク語(旧正書法)、ウズベク語(~1929)、カラカルパク語(~1932)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、オスマン語ブルシャスキー語アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)、ロヒンギャ語など。

子音[p]を表す。

ペルシャ文字を借用した多くの地域で共通して使われる。

U+067F ٿ ARABIC LETTER TEHEH シンド語[6]子音[tʰ]を表す。
U+0680 ڀ ARABIC LETTER BEHEH シンド語[6]子音[bʱ]を表す。
U+0681 ځ ARABIC LETTER HAH WITH HAMZA ABOVE パシュトー語[6]コワール語オルムル語英語版

子音[d͡z]を表す。[6]

U+0682 ڂ ARABIC LETTER HAH WITH TWO DOTS VERTICAL ABOVE 現代のパシュトー語では使用されない。[6]
U+0683 ڃ ARABIC LETTER NYEH シンド語[6]アディゲ語(~1927)、ダルグワ語(1920~1928)

シンド語では子音[ɲ]を、アディゲ語では子音[]または[tʃʼ]を表す。

U+0684 ڄ ARABIC LETTER DYEH シンド語サライキ語ボスニア語(15世紀~19世紀)[6]

シンド語及びサライキ語では子音[ʄ]を、ボスニア語では子音[s]を表す。

U+0685 څ ARABIC LETTER HAH WITH THREE DOTS ABOVE パシュトー語ホラズム語[6]ブルシャスキー語ダルグワ語(1920~1928)、トルワル語シナー語コワール語オルムル語英語版

パシュトー語[6]、トルワル語、シナー語、コワール語及びオルムル語では子音[t͡s]を、ブルシャスキー語では子音[ʈ͡ʂ]を、ダルグワ語では子音[q]を表す。

U+0686 چ ARABIC LETTER TCHEH ペルシャ語ウルドゥー語[6]パシュトー語ウイグル語シンド語バローチー語カシミール語ジャウィ文字マレー語)、ぺゴン文字英語版クルド語ソラニー方言)、パンジャーブ語西パンジャーブ語)、ラフンダー語カザフ語キルギス語タジク語(旧正書法)、ウズベク語(~1929)、カラカルパク語(~1932)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、オスマン語ブルシャスキー語アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)、ロヒンギャ語など。

子音[t͡ʃ]ないしは[c]を表す。

ペルシャ文字を借用した多くの地域で共通して使われる。

U+0687 ڇ ARABIC LETTER TCHEHEH シンド語[6]トルワル語シナー語

シンド語では子音[cʰ]を、トルワル語及びシナー語では子音[ʈ͡ʂ]を表す。

U+0688 ڈ ARABIC LETTER DDAL ウルドゥー語[6]バローチー語カシミール語パンジャーブ語西パンジャーブ語)、ラフンダー語ブルシャスキー語アディゲ語(~1927)、ロヒンギャ語トルワル語シナー語サライキ語コワール語

子音[ɖ]を表す。但しアディゲ語では子音[ʔ]を表す。

U+0689 ډ ARABIC LETTER DAL WITH RING パシュトー語[6]オルムル語英語版

子音[ɖ]を表す。

U+068A ڊ ARABIC LETTER DAL WITH DOT BELOW シンド語、早期ペルシャ語ぺゴン文字英語版マダガスカル語[6]シンド語では子音[ɖ]を表す。
U+068B ڋ ARABIC LETTER DAL WITH DOT BELOW AND SMALL TAH ラフンダー語[6]
U+068C ڌ ARABIC LETTER DAHAL シンド語[6]子音[dʱ]を表す。
U+068D ڍ ARABIC LETTER DDAHAL シンド語[6]子音[ɖʱ]を表す。
U+068E ڎ ARABIC LETTER DUL 字母DULの古い字形で、シンド語では現在廃止されている。[6]

ブルシャスキー語[6]ぺゴン文字英語版ソマリ語(1932~1972)

ブルシャスキー語では子音[t͡s]、ぺゴン文字及びソマリ語では子音[ɖ]を表す。

U+068F ڏ ARABIC LETTER DAL WITH THREE DOTS ABOVE DOWNWARDS シンド語[6]

字母DULの現在の字形。[6]

子音[ɗ]を表す。

U+0690 ڐ ARABIC LETTER DAL WITH FOUR DOTS ABOVE 古いウルドゥー語で使用されていたが、現在は使用されていない。[6]
U+0691 ڑ ARABIC LETTER RREH ウルドゥー語[6]カシミール語パンジャーブ語西パンジャーブ語)、ラフンダー語ブルシャスキー語ロヒンギャ語トルワル語シナー語サライキ語コワール語

子音[ɽ]を表す。

U+0692 ڒ ARABIC LETTER REH WITH SMALL V クルド語ソラニー方言、中央クルド語)[6]オルムル語英語版

オルムル語では子音[r̝](チェコ語Řと同じ発音)を表す。

U+0693 ړ ARABIC LETTER REH WITH RING パシュトー語[6]オルムル語英語版

子音[ɽ]を表す。

U+0694 ڔ ARABIC LETTER REH WITH DOT BELOW クルド語ソラニー方言、中央クルド語)、早期ペルシャ語[6]
U+0695 ڕ ARABIC LETTER REH WITH SMALL V BELOW クルド語ソラニー方言、中央クルド語)[6]震え音(巻き舌)の子音[r]を表す。なお、クルド語において通常の字母ra(U+0631 ر)は弾き音の子音[ɾ]を表す。

U+0696 ږ ARABIC LETTER REH WITH DOT BELOW AND DOT ABOVE パシュトー語[6]子音[ʐ]、[ʝ]あるいは[ɡ]を表す。
U+0697 ڗ ARABIC LETTER REH WITH TWO DOTS ABOVE ダルグワ語[6]アディゲ語(~1927)、ダルグワ語(1920~1928)

アディゲ語、ダルグワ語では子音[t͡sʼ]を表す。

U+0698 ژ ARABIC LETTER JEH ペルシャ語ウルドゥー語[6]パシュトー語ウイグル語バローチー語カシミール語クルド語ソラニー方言)、パンジャーブ語西パンジャーブ語)、ラフンダー語タジク語(旧正書法)、ウズベク語(~1929)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、オスマン語ブルシャスキー語アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)など。

子音[ʒ]を表す。但しカシミール語では子音[t͡s]を表す。

ペルシャ文字を借用した多くの地域で共通して使われる。

U+0699 ڙ ARABIC LETTER REH WITH FOUR DOTS ABOVE シンド語[6]トルワル語シナー語

シンド語では子音[ɽ]を、トルワル語及びシナー語では子音[ʐ]を表す。

U+069A ښ ARABIC LETTER SEEN WITH DOT BELOW AND DOT ABOVE パシュトー語[6]子音[ʂ]、[ç]あるいは[x]を表す。
U+069B ڛ ARABIC LETTER SEEN WITH THREE DOTS BELOW 早期ペルシャ語[6]
U+069C ڜ ARABIC LETTER SEEN WITH THREE DOTS BELOW AND THREE DOTS ABOVE アラビア語モロッコ方言(ダリジャ)[6]
U+069D ڝ ARABIC LETTER SAD WITH TWO DOTS BELOW テュルク語[6]ダルグワ語(1920~1928)

ダルグワ語では子音[t͡s]を表す。

U+069E ڞ ARABIC LETTER SAD WITH THREE DOTS ABOVE ベルベル語ブルシャスキー語[6]ダルグワ語(1920~1928)

ベルベル語では子音[zˤ]を、ブルシャスキー語では子音[ʈ͡ʂʰ]を、ダルグワ語では子音[t͡s]を表す。

U+069F ڟ ARABIC LETTER TAH WITH THREE DOTS ABOVE 古いハウサ語[6]ぺゴン文字英語版ハウサ語では子音[(t)͡sʼ]を、ぺゴン文字では子音[ʈ]を表す。
U+06A0 ڠ ARABIC LETTER AIN WITH THREE DOTS ABOVE ジャウィ文字ぺゴン文字英語版ダルグワ語(1920~1928)、ロヒンギャ語シナー語

ジャウィ文字、ぺゴン文字、シナー語では子音[ŋ]を表す。

ダルグワ語では子音[q:]を表す。

U+06A1 ڡ ARABIC LETTER DOTLESS FEH アディゲ語(~1927)[6]
U+06A2 ڢ ARABIC LETTER FEH WITH DOT MOVED BELOW アラビア語マグリブ方言[6][22]ダルグワ語(1920~1928)

ダルグワ語では子音[]を表す。

U+06A3 ڣ ARABIC LETTER FEH WITH DOT BELOW イングーシ語(~20世紀初頭)[6]
U+06A4 ڤ ARABIC LETTER VEH 中東のアラビア語で外来語の表記に用いられる。[6]

クルド語ソラニー方言、中央クルド語)、ホラズム語、早期ペルシャ語ジャウィ文字マレー語ジャウィ語[6]ぺゴン文字英語版アディゲ語(~1927)、ロヒンギャ語

クルド語、アディゲ語では子音[v]を、ジャウィ文字、ぺゴン文字では子音[p]を表す。

U+06A5 ڥ ARABIC LETTER FEH WITH THREE DOTS BELOW 北アフリカのアラビア語で外来語の表記に用いられる。[6]
U+06A6 ڦ ARABIC LETTER PEHEH シンド語[6]子音[pʰ]を表す。
U+06A7 ڧ ARABIC LETTER QAF WITH DOT ABOVE アラビア語マグリブ方言[22]ウイグル語[6]
U+06A8 ڨ ARABIC LETTER QAF WITH THREE DOTS ABOVE アラビア語チュニジア方言[6]
U+06A9 ک ARABIC LETTER KEHEH kaf mashkulaとも呼ばれる。[6]

ペルシャ語ウルドゥー語シンド語[6]パシュトー語バローチー語カシミール語クルド語ソラニー方言)、パンジャーブ語西パンジャーブ語)、ラフンダー語タジク語(旧正書法)、トルクメン語(~1929)、ブルシャスキー語アディゲ語(~1927)、ダルグワ語(~1928)、タタール語(1920~1927)、ロヒンギャ語など。

ペルシャ文字を借用した多くの地域では通常のkaf(U+0643 ك)の代わりに子音[k]を表すために共通して使われる。

シンド語では有気音の子音[kʰ]を表す。

U+06AA ڪ ARABIC LETTER SWASH KAF シンド語

無気音の子音[k]を表す。

シンド語においては通常のkaf(U+0643 ك)とは異なる字形になる。[6]

U+06AB ګ ARABIC LETTER KAF WITH RING パシュトー語[6]オルムル語英語版

子音[ɡ]を表す。

下にリングの付いた通常のkaf(U+0643 ك)のように書かれる場合がある。[6]

U+06AC ڬ ARABIC LETTER KAF WITH DOT ABOVE ジャウィ文字のGAFへの使用は推奨されないが、既存のテキストデータには見られる場合がある。ジャウィ文字GAFに推奨される文字はアラビア文字補助ブロックに含まれるU+0762 ݢである。[6]
U+06AD ڭ ARABIC LETTER NG ウイグル語カザフ語アラビア語モロッコ方言(ダリジャ)[23]、初期ジャウィ文字マレー語)、初期ペルシャ語[6]キルギス語トルクメン語(~1929)、オスマン語タタール語(1920~1927)など。

ウイグル語、カザフ語、キルギス語、トルクメン語、オスマン語、タタール語では子音[ŋ]を表す。

U+06AE ڮ ARABIC LETTER KAF WITH THREE DOTS BELOW ベルベル語、初期ペルシャ語[6]ダルグワ語(~1920)

ダルグワ語では子音[ɡ]を表す。

ぺゴン文字英語版インドネシアにおけるアラビア文字)においては子音[ɡ]を表す字母U+08B4 ࢴの異体字としても用いられる。[6]

U+06AF گ ARABIC LETTER GAF ペルシャ語ウルドゥー語[6]ウイグル語シンド語バローチー語カシミール語クルド語ソラニー方言)、パンジャーブ語西パンジャーブ語)、ラフンダー語カザフ語タジク語(旧正書法)、ウズベク語(~1929)、カラカルパク語(~1932)、トルクメン語(~1929)、オスマン語ブルシャスキー語アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)、ロヒンギャ語ソマリ語(1932~1972)など。

子音[ɡ]を表す。但し、ダルグワ語では子音[]を表す。

ペルシャ文字を借用した多くの地域で共通して使われる。

U+06B0 ڰ ARABIC LETTER GAF WITH RING ラフンダー語[6]
U+06B1 ڱ ARABIC LETTER NGOEH シンド語[6]

子音[ŋ]を表す。

U+06B2 ڲ ARABIC LETTER GAF WITH TWO DOTS BELOW シンド語では使用されない。[6]
U+06B3 ڳ ARABIC LETTER GUEH シンド語[6]サライキ語

子音[ɠ]を表す。

U+06B4 ڴ ARABIC LETTER GAF WITH THREE DOTS ABOVE カラカルパク語(~1932)

子音[ŋ]を表す。

シンド語では使用されない。[6]

U+06B5 ڵ ARABIC LETTER LAM WITH SMALL V クルド語ソラニー方言、中央クルド語)、ボスニア語(15世紀~19世紀)[6]クルド語では子音[ɫ]を、ボスニア語では子音[ʎ]を表す。
U+06B6 ڶ ARABIC LETTER LAM WITH DOT ABOVE クルド語ソラニー方言、中央クルド語)[6]
U+06B7 ڷ ARABIC LETTER LAM WITH THREE DOTS ABOVE クルド語ソラニー方言、中央クルド語)[6]
U+06B8 ڸ ARABIC LETTER LAM WITH THREE DOTS BELOW
U+06B9 ڹ ARABIC LETTER NOON WITH DOT BELOW
U+06BA ں ARABIC LETTER NOON GHUNNA ウルドゥー語、古いアラビア語[6]カシミール語ラフンダー語ブルシャスキー語ロヒンギャ語トルワル語オルムル語英語版

ウルドゥー語、カシミール語、ラフンダー語、ブルシャスキー語、トルワル語、オルムル語では鼻母音を表す。但し、語末以外では通常の字母nun(U+0646 ن)を用いる。

古いアラビア語では元々点が書かれていなかった。

独立形・語頭形・語中形・語末形のいずれにおいても点が書かれない。[6]

U+06BB ڻ ARABIC LETTER RNOON シンド語[6]

子音[ɳ]を表す。

U+06BC ڼ ARABIC LETTER NOON WITH RING パシュトー語[6]オルムル語英語版

子音[ɳ]を表す。

U+06BD ڽ ARABIC LETTER NOON WITH THREE DOTS ABOVE ジャウィ文字マレー語ジャウィ語[6][23]

子音[ɳ]を表す。

独立形と語末形では3つの点が文字の上側に配置されるが、語頭形と語中形ではU+062B ثとの混同を防ぐために3つの点が文字の下側に移動する。[24]

U+06BE ھ ARABIC LETTER HEH DOACHASHMEE ウルドゥー語及びその他の南アジアの言語で直前の子音が有気音であることを示す二重音字を形成する。[6]

ウイグル語では通常の字母ha(U+0647 ه)の代わりに用いられ、声門摩擦音[h]を表す。[6]

U+06BF ڿ ARABIC LETTER TCHEH WITH DOT ABOVE
U+06C0 ۀ ARABIC LETTER HEH WITH YEH ABOVE オルムル語英語版

Unicodeのバージョン1.0では"arabic letter hamzah on ha"という文字名だった。[6] ペルシャ語などのエザーフェとして使う場合は、言語に適した基字の上にU+0654 ٔを使用する。[6]

実際には独立した文字ではなく合字である。[6]

オルムル語では母音[ə]を表す。

U+06C1 ہ ARABIC LETTER HEH GOAL ウルドゥー語[6]バローチー語アディゲ語(~1927)

ウルドゥー語、バローチー語では通常の字母ha(U+0647 ه)の代わりに用いられ、声門摩擦音[h]を表す。

アディゲ語では二重母音[ɘj]または[jɘ]、あるいは短母音[ɘ]または[ɜ]を表す。

U+06C2 ۂ ARABIC LETTER HEH GOAL WITH HAMZA ABOVE ウルドゥー語[6]

実際には独立した文字ではなく合字である。[6]

U+06C3 ۃ ARABIC LETTER TEH MARBUTA GOAL ウルドゥー語[6]
U+06C4 ۄ ARABIC LETTER WAW WITH RING カシミール語[6]母音[ɔ]を表す。
U+06C5 ۅ ARABIC LETTER KIRGHIZ OE キルギス語[6]母音[ø]を表す。

ワーウの尾部がループ状になっているものと、尾部を突き抜けるように横線が書かれているものの2種類のグリフのバリエーションが存在する。[6]

U+06C6 ۆ ARABIC LETTER OE ウイグル語クルド語ソラニー方言、中央クルド語)、カザフ語アゼルバイジャン語南アゼルバイジャン語)、ボスニア語(15世紀~19世紀)[6]トルクメン語イランアフガニスタン国内で)、アディゲ語(~1927)

ウイグル語では母音[ø]を、カシミール語、クルド語では母音[o]を、アゼルバイジャン語、トルクメン語では母音[y]を、カザフ語では子音[v]を、ボスニア語では母音[u]を、アディゲ語では二重母音[ɜw]または[wɜ]を表す。

U+06C7 ۇ ARABIC LETTER U アゼルバイジャン語南アゼルバイジャン語)、カザフ語キルギス語ウイグル語[6]バローチー語クルド語ソラニー方言)、カラカルパク語(~1932)、トルクメン語(~1929)、タタール語(1920~1927)

ウイグル語、バローチー語、アゼルバイジャン語、キルギス語では母音[u]を、カラカルパク語では母音[u]または母音[y]を、カザフ語では母音[ʊ]を、クルド語では長母音[uː]を、トルクメン語では母音[ø]または母音[y]を、タタール語では母音[o]を表す。

U+06C8 ۈ ARABIC LETTER YU ウイグル語[6]クルド語ソラニー方言

ウイグル語では母音[y]を、クルド語では長母音[ʉː]を表す。

U+06C9 ۉ ARABIC LETTER KIRGHIZ YU カザフ語キルギス語ボスニア語(15世紀~19世紀)[6]キルギス語では母音[y]を、ボスニア語では母音[o]を表す。
U+06CA

ۊ

ARABIC LETTER WAW WITH TWO DOTS ABOVE クルド語ソラニー方言、中央クルド語)[6]
U+06CB ۋ ARABIC LETTER VE ウイグル語カザフ語[6]キルギス語カラカルパク語(~1932)、タタール語(1920~1927)

ウイグル語、キルギス語、タタール語では子音[v]を、カラカルパク語では子音[v]あるいは子音[w]を、カザフ語では二重母音[ʉw]を表す。

U+06CC ی ARABIC LETTER FARSI YEH アラビア語ペルシャ語ウルドゥー語カシミール語[6][16]バローチー語クルド語ソラニー方言)、ラフンダー語タジク語(旧正書法)、ウズベク語(~1929)、トルクメン語(~1929)、アディゲ語(~1927)、タタール語(1920~1927)など。

語頭形と語中形には、通常のya(U+064A )と同様に下部に二つ点が付いている[6]が、独立形、語末形では点が消える。 U+0654 ٔ と組み合わせて使用すると、語頭形と語中形でも点が付いた字形になる。[6] ペルシャ文字を借用した多くの地域では通常のya(U+064A )の代わりに子音[j]を表すために共通して使われる。

カシミール語、クルド語では長母音[iː]を、タタール語では母音[i]を表す。

U+06CD ۍ ARABIC LETTER YEH WITH TAIL パシュトー語シンド語[6]パシュトー語では二重母音[əɪ]を表す。
U+06CE ێ ARABIC LETTER YEH WITH SMALL V クルド語ソラニー方言、中央クルド語)[6]

母音[e]を表す。

U+06CF

ۏ ARABIC LETTER WAW WITH DOT ABOVE バローチー語ジャウィ文字マレー語ジャウィ語)、ぺゴン文字英語版バローチー語では長母音[oː]を、ジャウィ文字、ぺゴン文字では子音[v]を表す。
U+06D0 ې ARABIC LETTER E パシュトー語ウイグル語[6]オルムル語英語版

母音[e]を表す。 シンド語でも"bbeh"という文字として使用される。[6]

U+06D1 ۑ ARABIC LETTER YEH WITH THREE DOTS BELOW メンデ諸語[23]ハウサ語[6]ぺゴン文字英語版ぺゴン文字では子音[ɲ]を表す。

U+06D2 ے ARABIC LETTER YEH BARREE ウルドゥー語バローチー語[6]カシミール語パンジャーブ語西パンジャーブ語)、ラフンダー語ブルシャスキー語トルワル語シナー語サライキ語コワール語

長母音[eː]を表す。

U+06D3 ۓ ARABIC LETTER YEH BARREE WITH HAMZA ABOVE ウルドゥー語[6]

実際には独立した文字ではなく合字である。[6]

約物
U+06D4 ۔ ARABIC FULL STOP ウルドゥー語[6]における句点(ピリオド)。

文字名は"arabic full stop"となっているが、アラビア語など他のアラビア文字を用いる言語においては、ラテン文字などで用いられる通常のピリオド(.)が用いられる。

拡張アラビア文字
U+06D5 ە ARABIC LETTER AE ウイグル語カザフ語キルギス語[6]アゼルバイジャン語南アゼルバイジャン語)、カラカルパク語(~1932)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、アディゲ語(~1927)

ウイグル語、アゼルバイジャン語では母音[æ]を、カザフ語、キルギス語、トルクメン語、ボスニア語では母音[e]を、カラカルパク語では母音[æ]または母音[e]を、アディゲ語では二重母音[ɜj]または[jɜ]を表す。

クルアーンの註釈記号
U+06D6 ۖ ARABIC SMALL HIGH LIGATURE SAD WITH LAM WITH ALEF MAKSURA アラブ圏クルアーンで用いられる記号で、本文中に出現する箇所で一時停止してもよいが、間を置かずに経典を暗唱することが推奨されることを示すために使用される。イランでのクルアーンにおけるU+0617 ؗと同じ役割を持つ。[10]
U+06D7 ۗ ARABIC SMALL HIGH LIGATURE QAF WITH LAM WITH ALEF MAKSURA
U+06D8 ۘ ARABIC SMALL HIGH MEEM INITIAL FORM
U+06D9 ۙ ARABIC SMALL HIGH LAM ALEF
U+06DA ۚ ARABIC SMALL HIGH JEEM
U+06DB ۛ ARABIC SMALL HIGH THREE DOTS
U+06DC ۜ ARABIC SMALL HIGH SEEN
U+06DD ۝ ARABIC END OF AYAH クルアーンにおいて節の終わりを示す結合記号で、その節の番号を示すアラビア・インド数字ががシンボル内に書かれる。
U+06DE ۞ ARABIC START OF RUB EL HIZB ルブ・エル・ヒズブ。節の一部の境界[6]、特に章の終わりを示す。

通常、8つの角をもつシンボルとして描かれ、星のように見える場合とそうでない場合がある。[6]

U+06DF ۟ ARABIC SMALL HIGH ROUNDED ZERO スクーン(U+0652 ْ)に使用される円形よりも小さなサイズの円。[6]
U+06E0 ۠ ARABIC SMALL HIGH UPRIGHT RECTANGULAR ZERO 「rectangular zero(長方形のゼロ)」という文字名は、この記号のアラビア語名の直訳である。[6]
U+06E1 ۡ ARABIC SMALL HIGH DOTLESS HEAD OF KHAH クルアーンにおけるスクーン(U+0652 ْ)は一般的にこの字形で書かれる。[2][25]

但しUnicode公式においてはこの文字を直接使用せず、フォント技術を用いて異体字を選択することが推奨されている。[6]

U+06E2 ۢ ARABIC SMALL HIGH MEEM ISOLATED FORM
U+06E3 ۣ ARABIC SMALL LOW SEEN
U+06E4 ۤ ARABIC SMALL HIGH MADDA 通常は U+06E5 ۥ U+06E6 ۦ U+06E7ۧ、及びU+08F3 ࣳと共に使われる。[6]
U+06E5 ۥ ARABIC SMALL WAW
U+06E6 ۦ ARABIC SMALL YEH
U+06E7 ۧ ARABIC SMALL HIGH YEH
U+06E8 ۨ ARABIC SMALL HIGH NOON
U+06E9 ۩ ARABIC PLACE OF SAJDAH サジダ。クルアーンにおいて、体を伏せて礼拝の姿勢をとるべき箇所に書かれる記号。
U+06EA ۪ ARABIC EMPTY CENTRE LOW STOP カシミール語で口蓋化を表すのにも用いられる。[16]
U+06EB ۫ ARABIC EMPTY CENTRE HIGH STOP
U+06EC ۬ ARABIC ROUNDED HIGH STOP WITH FILLED CENTRE アフリカや他の地域の正書法におけるクルアーンの文章でも、ワスラ、ikhtilasなどを表すために使用される。[6]
U+06ED ۭ ARABIC SMALL LOW MEEM
パーカリ語用の拡張アラビア文字
U+06EE ۮ ARABIC LETTER DAL WITH INVERTED V パーカリ・コリ語英語版子音[ɗ]を表す。[26]
U+06EF ۯ ARABIC LETTER REH WITH INVERTED V パーカリ・コリ語英語版子音[ɭ]を表す。[26]

早期ペルシャ語でも用いられる。[6]

東方アラビア・インド数字
U+06F0 ۰ EXTENDED ARABIC-INDIC DIGIT ZERO イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字0
U+06F1 ۱ EXTENDED ARABIC-INDIC DIGIT ONE イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字1
U+06F2 ۲ EXTENDED ARABIC-INDIC DIGIT TWO イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字2
U+06F3 ۳ EXTENDED ARABIC-INDIC DIGIT THREE イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字3
U+06F4 ۴ EXTENDED ARABIC-INDIC DIGIT FOUR イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字4

ウルドゥー語及びカシミール語においてはペルシア語のものと異なる字形のものが使われる。[6][14][27]

U+06F5 ۵ EXTENDED ARABIC-INDIC DIGIT FIVE イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字5
U+06F6 ۶ EXTENDED ARABIC-INDIC DIGIT SIX イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字6

シンド語ウルドゥー語、及びカシミール語においてはペルシア語のものと異なる字形のものが使われる。[6][14][27]

U+06F7 ۷ EXTENDED ARABIC-INDIC DIGIT SEVEN イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字7

シンド語ウルドゥー語、及びカシミール語においてはペルシア語のものと異なる字形のものが使われる。[6][14][27]

U+06F8 ۸ EXTENDED ARABIC-INDIC DIGIT EIGHT イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字8
U+06F9 ۹ EXTENDED ARABIC-INDIC DIGIT NINE イランアフガニスタンパキスタンインドで用いられるアラビア・インド数字9
拡張アラビア文字
U+06FA ۺ ARABIC LETTER SHEEN WITH DOT BELOW
U+06FB ۻ ARABIC LETTER DAD WITH DOT BELOW
U+06FC ۼ ARABIC LETTER GHAIN WITH DOT BELOW
シンド語用の記号
U+06FD ۽ ARABIC SIGN SINDHI AMPERSAND シンド語におけるアンパサンド記号(ラテン文字における「&」)。
U+06FE ۾ ARABIC SIGN SINDHI POSTPOSITION MEN シンド語における後置詞(助詞)"men"の略字。
パーカリ語用の拡張アラビア文字
U+06FF ۿ ARABIC LETTER HEH WITH INVERTED V パーカリ・コリ語英語版子音[h]を表す。なお、パーカリ語において通常の字母heh(U+0647 ه)は有声音の[ɦ]を表す。[26]

小分類[編集]

このブロックの小分類は「ベースライン下方のマーカー」(Subtending marks)、「ベースライン上方のマーカー」(Supertending mark)、「根号」(Radix symbols)、「文字様記号」(Letterlike symbol)、「約物」(Punctuation)、「通貨記号」(Currency symbol)、「詩用記号」(Poetic marks)、「敬称用記号」(Honorifics)、「クルアーンの註釈記号」(Quranic annotation sign)、「拡張アラビア記号」(Extended Arabic mark)、「制御文字」(Format character)、「カシミール語用の追加文字」(Addition for Kashmiri)、「ISO 8859-6に基づく文字」(Based on ISO 8859-6)、「早期ペルシャ語及びアゼルバイジャン語用の追加文字」(Additions for early Persian and Azerbaijani)、「ISO 8859-6典拠の母音記号」(Tashkil from ISO 8859-6)、「結合用のマッダ及びハムザ」(Combining maddah and hamza)、「その他の結合記号」(Other combining marks)、「アラビア・インド数字」(Arabic-Indic digits)、「古代の文字」(Archaic letters)、「母音記号」(Tashkil)、「拡張アラビア文字」(Extended Arabic letters)、「非推奨文字」(Deprecated letter)、「高位置のハムザ」(High hamza)、「カザフ語用の二重音字」(Digraphic letters for Kazakh)、「パーカリ語用の拡張アラビア文字」(Extended Arabic letters for Parkari)、「東方アラビア・インド数字」(Eastern Arabic-Indic digits)、「シンド語用の記号」(Signs for Sindhi)の26個となっている。[6]

本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。

ベースライン下方のマーカー(Subtending marks[編集]

この小分類にはアラビア文字において文字列の下方に書かれる記号類を収録している。文字列の長さに合わせて記号の長さを伸長させてレンダーすることが望まれている。

ベースライン上方のマーカー(Supertending mark[編集]

この小分類にはアラビア文字において文字列の上方に書かれる記号類を収録している。文字列の長さに合わせて記号の長さを伸長させてレンダーすることが望まれている。

根号(Radix symbols[編集]

この小分類にはアラビア文字において根号を表す数学記号を2種類収録している。

文字様記号(Letterlike symbol[編集]

この小分類にはアラビア文字における数学記号で直線を表す記号1文字のみを収録している。[7]

約物(Punctuation[編集]

この小分類にはアラビア文字で用いられる約物類を収録している。

通貨記号(Currency symbol[編集]

この小分類にはアフガニスタンの公定通貨であるアフガニ通貨記号1文字のみを収録している。

詩用記号(Poetic marks[編集]

この小分類にはアラビア文字で書かれた詩で用いられる記号2種類のみを収録している。

敬称用記号(Honorifics[編集]

この小分類にはイスラム教において宗教上特殊な地位のある偉人や聖人の名前を記す際にその人物名の上に書かれる祈りの言葉を表す記号を収録している。[2][8]

クルアーンの註釈記号(Quranic annotation sign[編集]

この小分類にはイスラム教の聖典であるクルアーンにおいて読み方などを示すために用いられる記号類を収録している。

拡張アラビア記号(Extended Arabic mark[編集]

この小分類には10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語(早期ペルシャ語)で用いられていた記号を1文字のみ収録している。

制御文字(Format character[編集]

この小分類には直前の文字がアラビア文字であることを示すために用いられる、具体的なグリフ・文字幅共に持たない制御文字1文字を収録している。

カシミール語用の追加文字(Addition for Kashmiri[編集]

この小分類にはインドパキスタンの係争中の土地であるカシミール地方で話されるカシミール語で用いられるアラビア文字の拡張文字を1文字のみ収録している。

ISO 8859-6に基づく文字(Based on ISO 8859-6[編集]

この小分類には基本的なアラビア文字の字母を収録している。小分類名の通り、アラビア文字の符号化規格の一つであるISO 8859-6に準拠している。表中で特に断りが無い限りはアラビア文字を表記に用いる多くの言語で共通して使用される。

本小分類に属するアラビア文字の名前は、ISO 8859-6 から派生したローマ字表記規則に従う。 これらは、アラビア語の文字名の実際の発音とは異なり、 例えばU+0628 ب ARABIC LETTER BEH は一般的なアラビア語の発音としては「ba'」となる。[6]

早期ペルシャ語及びアゼルバイジャン語用の追加文字(Additions for early Persian and Azerbaijani[編集]

この小分類には早期ペルシャ語及びアゼルバイジャン語で用いられるアラビア文字の拡張文字を収録している。早期ペルシャ語とは10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語を纏めた総称であり、かつてのペルシャ語の正書法に用いられていた文字を収録している。[9]

なお、アゼルバイジャンにおけるアゼルバイジャン語については現在はラテン文字が主要な表記体系として用いられているが、イランなどで話される南アゼルバイジャン語では現在もアラビア文字での表記が用いられている。

ISO 8859-6典拠の母音記号(Tashkil from ISO 8859-6[編集]

この小分類にはイスラム教の聖典であるクルアーンや初学者用、あるいは初等教育用の教材などで用いられる母音などを表記するための補助記号のシャクルを収録している。

なお、小分類名の"Tashkil(タシュキール)"とはシャクルと同根の単語で、アラビア語で「シャクルを振る」という動作をあらわす単語である。

結合用のマッダ及びハムザ(Combining maddah and hamza[編集]

この小分類にはシャクルのうち、ISO 8859-6に含まれていなかった結合用のマッダとハムザを収録している。

その他の結合記号(Other combining marks[編集]

この小分類にはアラビア文字を正書法に用いる様々な言語において用いられる結合記号を収録している。

アラビア・インド数字(Arabic-Indic digits[編集]

この小分類にはアラビア語で一般的に用いられる数字である、アラビア・インド数字(あるいは単にインド数字)を収録している。元来数字はインドで誕生したものであり、それまでのアラブ圏ではアラビア文字をそのまま数字として用いる伝統的なアラビア数字(呼称が同一になってしまっているが現在のラテン文字などで用いられる算用数字とは異なる)を用いていたが、インドから数字のみの用途を持つ文字を借用した結果現在まで使われるようになった経緯がある。そのため、これらの数字は「インド数字」と呼ばれている。

この小分類に属するアラビア・インド数字はアラビア語で使用されるものだが、 イランアフガニスタンパキスタンインドの諸言語で用いられるインド数字はいくつかの数字について字形が異なる[14]ため、Unicode上では "Eastern Arabic-Indic digits"(U+06F0~06F9) として別の符号領域に分けられている。[6]

古代の文字(Archaic letters[編集]

この小分類にはアラビア文字のうち、初期の加点による書き分けが存在していなかった時代の字形を2文字収録している。

母音記号(Tashkil[編集]

この小分類にはシャクルのうち、ISO 8859-6に含まれていなかったものを収録している。

拡張アラビア文字(Extended Arabic letters[編集]

この小分類にはアラビア文字のうち、アラビア語以外のみならず、ペルシャ語ウルドゥー語パシュトー語クルド語ウイグル語カザフ語アゼルバイジャン語など、アラビア文字を正書法に用いる様々な言語において用いられる拡張文字を収録している。

非推奨文字(Deprecated letter[編集]

この小分類には他の符号化規格との互換性のために追加されたが現在はUnicode上での利用が推奨されていない文字を1文字収録している。

高位置のハムザ(High hamza[編集]

この小分類にはカザフスタンなどで話されるカザフ語において二重音字を表記する際に用いられていた文字1文字を収録している。なお、現在カザフスタンにおけるカザフ語ではアラビア文字の使用は一般的に廃止されており、通常はキリル文字で書かれるが、中華人民共和国新疆ウイグル自治区に居住するカザフ人は今でもアラビア文字を用いた表記を使用している。

カザフ語用の二重音字(Digraphic letters for Kazakh[編集]

この小分類に属する文字はカザフ語の二重音字として符号化されたが、その互換性分解は望ましい表現順序を反映していない。従って、これらのカザフ語の二重音字の表現には、代わりに要素の正しい順序を持つ2文字の綴りを使用すべきである[6]

パーカリ語用の拡張アラビア文字(Extended Arabic letters for Parkari[編集]

この小分類にはパキスタンシンド州などで話されているパーカリ・コリ語英語版(あるいは単にパーカリ語とも呼ばれる)用の拡張アラビア文字を収録している。

東方アラビア・インド数字(Eastern Arabic-Indic digits[編集]

この小分類にはアラビア文字で一般的に用いられるアラビア・インド数字のうち、イランパキスタンインドのアラビア文字を用いる言語 (ペルシア語シンド語ウルドゥー語など) で使用される[6] 字形のものを収録している。一部の数字についてアラビア語で用いられるものとは異なる字形が用いられているため符号位置が分けられている。

ウルドゥー語では更に一部の数字についてアラビア語ものともペルシャ語のものとも異なる字形が用いられることがあるが、こちらはペルシャ語のものと符号位置が統一されている。

シンド語用の記号(Signs for Sindhi[編集]

この小分類にはパキスタンシンド州などで話されるシンド語において用いられる略語記号を2種類収録している。

文字コード[編集]

アラビア文字(Arabic)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+060x  ؀   ؁   ؂   ؃   ؄   ؅  ؆ ؇ ؈ ؉ ؊ ؋ ، ؍ ؎ ؏
U+061x ؐ ؑ ؒ ؓ ؔ ؕ ؖ ؗ ؘ ؙ ؚ ؛  ALM  ؝ ؞ ؟
U+062x ؠ ء آ أ ؤ إ ئ ا ب ة ت ث ج ح خ د
U+063x ذ ر ز س ش ص ض ط ظ ع غ ػ ؼ ؽ ؾ ؿ
U+064x ـ ف ق ك ل م ن ه و ى ي ً ٌ ٍ َ ُ
U+065x ِ ّ ْ ٓ ٔ ٕ ٖ ٗ ٘ ٙ ٚ ٛ ٜ ٝ ٞ ٟ
U+066x ٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩ ٪ ٫ ٬ ٭ ٮ ٯ
U+067x ٰ ٱ ٲ ٳ ٴ ٵ ٶ ٷ ٸ ٹ ٺ ٻ ټ ٽ پ ٿ
U+068x ڀ ځ ڂ ڃ ڄ څ چ ڇ ڈ ډ ڊ ڋ ڌ ڍ ڎ ڏ
U+069x ڐ ڑ ڒ ړ ڔ ڕ ږ ڗ ژ ڙ ښ ڛ ڜ ڝ ڞ ڟ
U+06Ax ڠ ڡ ڢ ڣ ڤ ڥ ڦ ڧ ڨ ک ڪ ګ ڬ ڭ ڮ گ
U+06Bx ڰ ڱ ڲ ڳ ڴ ڵ ڶ ڷ ڸ ڹ ں ڻ ڼ ڽ ھ ڿ
U+06Cx ۀ ہ ۂ ۃ ۄ ۅ ۆ ۇ ۈ ۉ ۊ ۋ ی ۍ ێ ۏ
U+06Dx ې ۑ ے ۓ ۔ ە ۖ ۗ ۘ ۙ ۚ ۛ ۜ  ۝  ۞ ۟
U+06Ex ۠ ۡ ۢ ۣ ۤ ۥ ۦ ۧ ۨ ۩ ۪ ۫ ۬ ۭ ۮ ۯ
U+06Fx ۰ ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۺ ۻ ۼ ۽ ۾ ۿ
注釈
1.^バージョン15.1時点


履歴[編集]

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0 U+066C 1 L2/00-151 Paul Nelson; Assem Hijazi; Aiman Copty (7 April 2000), Proposal to change glyph shape for U+066C ARABIC THOUSAND SEPARATOR (英語)
U+0672..0673,0679..06B7,06BA..06BE,

06C0,06C4..06C6,06CA..06CE,06D0,06D2..06D3

33 L2/01-239 ISO 11822 (15 December 1996), Extension of the Arabic coded character set for bibliographic information interchange (英語)
L2/01-329 Thomas Milo (17 August 2001), Comments on the Arabic block in Unicode (英語)
L2/01-440 Thomas Milo (2 November 2001), Some comments on the Arabic block in Unicode (英語)
L2/02-021 Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語)
L2/03-154 Jonathan Kew (16 May 2003), Proposal to encode productive Arabic-script modifier marks (英語)
L2/12-381 Roozbeh Pournader (5 November 2012), Initial and medial forms of Arabic Letter Noon Ghunna (英語)
L2/09-406 India NB (1 November 2009), Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686) (英語)
L2/09-146 Roozbeh Pournader (16 April 2009), Moving dots and Arabic script shaping: Farsi Yeh’s and Jawi Nya (英語)
L2/10-168 Kamal Mansour (5 May 2010), Problems with the joining behavior of Arabic Letter Yeh Barree (U+06D2) (英語)
L2/13-119 Roozbeh Pournader (8 May 2013), Dot positioning of U+06A3 Arabic Letter Feh with Dot Below (英語)
L2/19-002 Marc Lodewijck (2 January 2019), Comments on three Arabic-derived letters (英語)
U+0647,06D5 3 L2/14-136 Roozbeh Pournader (8 May 2014), The right hehs for Arabic script orthographies of Sorani Kurdish and Uighur (英語)
1.1 U+06DF..06E1,06E9 4 L2/01-325 Thomas Milo (14 August 2001), Variants in Arabic script – related to L2/01-304 (英語)
L2/01-425 Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks (英語)
L2/05-203 Rick McGowan (4 August 2005), Public Review Issue #73: Representative Glyphs for Arabic Characters U+06DF, U+06E0, and U+06E1 (英語)
U+06DD 1 L2/01-428 Jonathan Kew; SIL (1 November 2001), Request for clarification regarding ARABIC END OF AYAH and other Arabic enclosing marks (英語)
L2/06-332 Behdad Esfahbod; Roozbeh Pournader (15 October 2006), Proposal to change the Bidi category of five Arabic characters from AL to AN (英語)
U+06EA 1 L2/09-406 India NB (1 November 2009), Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686) (英語)
U+06DC,06E3,06E7..06E8 4
3.0 U+06B8..06B9,06BF,06FA..06FC 6 L2/01-239 ISO 11822 (15 December 1996), Extension of the Arabic coded character set for bibliographic information interchange (英語)
U+06BE 1 L2/01-329 Thomas Milo (17 August 2001), Comments on the Arabic block in Unicode (英語)
U+0653..0655 2 L2/98-409 Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語)
L2/14-127 Roozbeh Pournader (2 May 2014), Standardizing the order of Arabic combining marks (英語)
L2/17-253 Roozbeh Pournader; Bob Hallissy; Lorna Evans (29 July 2017), Proposed Draft: Unicode Technical Report Unicode Arabic Mark Ordering Algorithm (英語)
L2/17-395 Roozbeh Pournader; Bob Hallissy; Lorna Evans (23 October 2017), Proposed Draft: Unicode Technical Report #53, Unicode Arabic Mark Ordering Algorithm (英語)
L2/18-151 Roozbeh Pournader; Bob Hallissy; Lorna Evans (26 April 2018), Proposed Draft UTR #53, Unicode Arabic Mark Rendering (HTML version) (英語)
L2/18-250 Roozbeh Pournader; Bob Hallissy; Lorna Evans (23 July 2018), Unicode Arabic Mark Rendering (英語)
L2/18-298 Roozbeh Pournader; Bob Hallissy; Lorna Evans (14 September 2018), Proposed Draft UTR #53, Unicode Arabic Mark Rendering (HTML version) (英語)
L2/18-305 Roozbeh Pournader; Bob Hallissy; Lorna Evans (18 September 2018), Working Draft of Draft UTR #53 Unicode Arabic Mark Rendering (英語)
3.2 U+066E..066F 2 L2/98-409 Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語)
L2/00-354 Mark Davis; Kamal Mansour (12 October 2000), Proposal for addition to Arabic repertoire (英語)
L2/01-150 Unicode Consortium; SC2/WG2 N2357 (4 April 2001), Proposal to encode two Arabic characters to the UCS (英語)
4.0 U+0653..0655 3 L2/99-130 SC2 N3320 (14 April 1999), Text for FDAM ballot ISO/IEC 10646 FDAM #27 - Syriac (英語)
U+0656..0657,0610..0614 7 L2/00-135 Paul Nelson (7 April 2000), Proposal to add Urdu Epethit and Abbreviation Diacritics to the Arabic Block (英語)
L2/01-425 Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks (英語)
L2/01-426 Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks, Appendix: Examples of usage (14.5 MB) (英語)
U+0600..0602,060D..060E,0658 6 L2/01-425 Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks (英語)
L2/01-426 Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks, Appendix: Examples of usage (14.5 MB) (英語)
L2/02-061 Jonathan Kew (6 February 2002), Bidi committee consensus on Arabic additions from L2/01-425 (英語)
U+06EE..06EF,06FF 3 L2/01-427 Jonathan Kew; SIL (1 November 2001), Proposal to add Parkari letters to Arabic block (1.6 MB) (英語)
U+0603 1 L2/02-061 Jonathan Kew (6 February 2002), Bidi committee consensus on Arabic additions from L2/01-425 (英語)
L2/03-034 Paul Nelson; Fiona Ross; Tim Holloway; John Hudson (10 February 2003), Proposal to change character properties of ARABIC SIGN SAFHA (英語)
L2/06-332 Behdad Esfahbod; Roozbeh Pournader (15 October 2006), Proposal to change the Bidi category of five Arabic characters from AL to AN (英語)
U+0615 1 L2/03-154 Jonathan Kew (16 May 2003), Proposal to encode productive Arabic-script modifier marks (英語)
U+0658 1 L2/98-409 Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語)
L2/02-021 Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語)
L2/09-176 Muzaffar Aazim; Kamal Mansour; Roozbeh Pournader (2 May 2009), Proposal to add two Kashmiri characters and one annotation to the Arabic block (英語)
L2/12-381 Roozbeh Pournader (5 November 2012), Initial and medial forms of Arabic Letter Noon Ghunna (英語)
4.1 U+065A..065C 3 L2/98-409 Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語)
L2/02-021 Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語)
L2/03-154 Jonathan Kew (16 May 2003), Proposal to encode productive Arabic-script modifier marks (英語)
L2/03-168 Jonathan Kew (30 May 2003), Proposal to encode Arabic-script letters for African languages (英語)
L2/03-210 Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語)
L2/03-223 Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語)
L2/09-406 India NB (1 November 2009), Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686) (英語)
U+061E 1 L2/03-159 Jonathan Kew (29 May 2003), Proposal to encode Arabic triple dot punctuation mark (英語)
L2/03-210 Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語)
L2/03-223 Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語)
U+0659 1 L2/03-133 Michael Everson; Roozbeh Pournader (29 May 2003), Proposal to encode the ARABIC ZWARAKAY (英語)
L2/03-210 Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語)
L2/03-223 Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語)
U+065D..065E 2 L2/04-025 Jonathan Kew (21 January 2004), Proposal to encode 5 new Arabic script characters [WG2-N2723] (英語)
5.1 U+0606..060A 5 L2/05-320 Azzeddine Lazrek (24 October 2005), Arabic Mathematical Diverse Symbols (amds4l.pdf) (英語)
U+0616,063B..063F 6 L2/06-345 Michael Everson; Roozbeh Pournader; Elnaz Sarbar (8 November 2006), Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised) (英語)
U+0617..061A 4 L2/06-358 Michael Everson; Roozbeh Pournader (8 November 2006), Proposal to encode four Qur'anic Arabic characters in the UCS (WG2 N3185R - Revised) (英語)
6.0 U+0620,065F 2 L2/98-409 Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語)
L2/02-021 Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語)
L2/09-176 Muzaffar Aazim; Kamal Mansour; Roozbeh Pournader (2 May 2009), Proposal to add two Kashmiri characters and one annotation to the Arabic block (英語)
L2/10-169 Swaran Lata (6 May 2010), Comments on the Proposed Arabic Letter Kashmiri Yeh (英語)
6.1 U+0604 1 L2/09-144 Anshuman Pandey (22 January 2010), Proposal to Encode the Samvat Date Sign for Arabic (revision 3; WG2 N3734) (英語)
6.3 U+061C 1 L2/11-005 Matitiahu Allouche; Mohamed Mohie (17 January 2011), Proposal to encode an Arabic-Letter Mark (ALM) (英語)
L2/11-278 Matitiahu Allouche; Mohamed Mohie (20 July 2011), Proposal to encode an Arabic-Letter Mark (ALM) (replaces L2/11-005) (英語)
L2/11-432 Mohamed Mohie (15 February 2012), Revised Proposal for Arabic Letter Mark (英語)
L2/13-040 Roozbeh Pournader; Aharon Lanin (30 January 2013), Fasttracking Arabic Letter Mark (ALM) (英語)
L2/16-306 Peter Constable (28 October 2016), Script property of Arabic Letter Mark and interaction with digit substitution mechanisms (英語)
14.0 U+061D 1 L2/20-245 Khaled Hosny; Roozbeh Pournader (28 September 2020), Proposal to encode three Arabic symbols (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典[編集]

  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年2月2日閲覧。
  2. ^ a b c d e f g h i j k l m n Jonathan Kew; SIL (2001年11月1日). “Proposal to add Arabic-script honorifics and other marks” (英語). Unicode. 2024年2月11日閲覧。
  3. ^ a b c d e f g h i j Jonathan Kew; SIL (2001年11月1日). “Proposal to add Arabic-script honorifics and other marks, Appendix: Examples of usage (14.5 MB)” (英語). Unicode. 2024年2月11日閲覧。
  4. ^ a b Anshuman Pandey (2010年1月22日). “Proposal to Encode the Samvat Date Sign for Arabic (revision 3; WG2 N3734)” (英語). Unicode. 2024年2月10日閲覧。
  5. ^ a b Jonathan Kew (2002年2月6日). “Bidi committee consensus on Arabic additions from L2/01-425” (英語). Unicode. 2024年2月10日閲覧。
  6. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az ba bb bc bd be bf bg bh bi bj bk bl bm bn bo bp bq br bs bt bu bv bw bx by bz ca cb cc cd ce cf cg ch ci cj ck cl cm cn co cp cq cr cs ct cu cv cw cx cy cz da db dc dd de df dg dh di dj dk dl dm dn do dp dq dr ds dt du dv dw dx dy dz ea eb ec ed ee ef eg eh ei ej ek el em en eo ep eq er es et eu ev ew ex ey ez fa fb fc fd fe ff fg fh fi fj fk fl fm fn fo fp fq fr fs ft fu fv fw "The Unicode Standard, Version 15.1 - U0600.pdf" (PDF). The Unicode Standard (英語). 2024年2月9日閲覧
  7. ^ a b c d e f Azzeddine Lazrek (2005年10月24日). “Arabic Mathematical Diverse Symbols (amds4l.pdf)” (英語). Unicode. 2024年2月10日閲覧。
  8. ^ a b c d e f Paul Nelson (2000年4月7日). “Proposal to add Urdu Epethit and Abbreviation Diacritics to the Arabic Block” (英語). Unicode. 2024年2月11日閲覧。
  9. ^ a b c d e f g h i j k l Michael Everson; Roozbeh Pournader, Elnaz Sarbar (2006年11月8日). “Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised)” (英語). Unicode. 2024年2月10日閲覧。
  10. ^ a b c d e Michael Everson; Roozbeh Pournader (2006年11月8日). “Proposal to encode four Qur'anic Arabic characters in the UCS (WG2 N3185R - Revised)” (英語). Unicode. 2024年2月10日閲覧。
  11. ^ Matitiahu Allouche; Mohamed Mohie (2011年7月20日). “Proposal to encode an Arabic-Letter Mark (ALM) (replaces L2/11-005)” (英語). Unicode. 2024年2月10日閲覧。
  12. ^ Khaled Hosny; Roozbeh Pournader (2020年9月28日). “Proposal to encode three Arabic symbols” (英語). Unicode. 2024年2月10日閲覧。
  13. ^ Jonathan Kew (2003年5月29日). “Proposal to encode Arabic triple dot punctuation mark” (英語). Unicode. 2024年2月10日閲覧。
  14. ^ a b c d e Thomas Milo (2001年8月17日). “Comments on the Arabic block in Unicode” (英語). Unicode. 2024年2月11日閲覧。
  15. ^ Michael Everson; Roozbeh Pournader (2003年5月29日). “Proposal to encode the ARABIC ZWARAKAY” (英語). Unicode. 2024年2月10日閲覧。
  16. ^ a b c India NB (2009年11月1日). “Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686)” (英語). Unicode. 2024年2月10日閲覧。
  17. ^ Denis Moyogo Jacquerye (2020年5月13日). “Proposal to encode Bosnian Arabic characters” (英語). Unicode. 2024年2月10日閲覧。
  18. ^ a b c Jonathan Kew (2004年1月21日). “Proposal to encode 5 new Arabic script characters [WG2-N2723]” (英語). Unicode. 2024年2月10日閲覧。
  19. ^ Paul Nelson; Assem Hijazi, Aiman Copty (2000年4月7日). “Proposal to change glyph shape for U+066C ARABIC THOUSAND SEPARATOR” (英語). Unicode. 2024年2月11日閲覧。
  20. ^ a b Mark Davis; Kamal Mansour (2000年10月12日). “Proposal for addition to Arabic repertoire” (英語). Unicode. 2024年2月11日閲覧。
  21. ^ a b Unicode Consortium; SC2/WG2 N2357 (2001年4月4日). “Proposal to encode two Arabic characters to the UCS” (英語). Unicode. 2024年2月10日閲覧。
  22. ^ a b 原文:"Maghrib Arabic"。恐らくアラビア語モロッコ方言アラビア語サハラ方言アラビア語アルジェリア方言アラビア語チュニジア方言アラビア語リビア方言を纏めた呼称だと思われる。
  23. ^ a b c Marc Lodewijck (2019年1月2日). “Comments on three Arabic-derived letters” (英語). Unicode. 2024年2月10日閲覧。
  24. ^ Roozbeh Pournader (2009年4月16日). “Moving dots and Arabic script shaping: Farsi Yeh’s and Jawi Nya” (英語). Unicode. 2024年2月10日閲覧。
  25. ^ Thomas Milo (2001年8月14日). “Variants in Arabic script – related to L2/01-304” (英語). Unicode. 2024年2月11日閲覧。
  26. ^ a b c Jonathan Kew; SIL (2001年11月1日). “Proposal to add Parkari letters to Arabic block (1.6 MB)” (英語). Unicode. 2024年2月11日閲覧。
  27. ^ a b c Aleem Qureshi (2021年4月21日). “Missing Urdu digits 4, 6 and 7” (英語). Unicode. 2024年3月4日閲覧。

関連項目[編集]