Unicode

公式サイト:

Unicode [Official]

カテゴリー

参考:

コード順索引 | CyberLibrarian

平仮名/ひらがな

参考:

平仮名 | CyberLibrarian

平仮名 – Wikipedia

片仮名/カタカナ

参考:

片仮名 | CyberLibrarian

片仮名拡張 | CyberLibrarian

Katakana | Compart

片仮名 – Wikipedia

半角片仮名/半角カナ

参考:

半角片仮名 | CyberLibrarian

半角/全角形 | CyberLibrarian

Halfwidth and Fullwidth Forms – Wikipedia

濁点/半濁点

参考:

結合文字を使用した濁点や半濁点を直前の仮名と結合させる方法 – Qiita

Unicode では濁点や半濁点を別扱いしてることがあるので結合した | はてなの鴨澤

シナ「プ」スで困った話/Mac の濁点、半濁点問題 | シナプス技術者ブログ

濁点 – Wikipedia

半濁点 – Wikipedia

ツ゜ – Wikipedia

半角/全角

参考:

Unicode 半角/全角形 | CyberLibrarian

リプレイスメントキャラクター

従来の文字コードおけるベンダ依存文字や私用文字 (外字) など、Unicode に存在しない文字をコード変換した際にこの文字コードに置き換えられる。

リプレイスメントキャラクター (Replacement Character / U+FFFD)

参考:

黒いひし形にはてなマークが出る文字 (�) は UTF-8 変換時のときに変換後の対象がない置き換え文字 | コード日進月歩

日本の文字コードと Unicode との変換についての標準化検討 (y-adagio.com)

Unicode Character ‘REPLACEMENT CHARACTER’ (U+FFFD) | FileFormat.Info

Replacement Character – Wikipedia

サロゲートペア

参考:

サロゲートペア/結合文字列/合字 – Qiita

正規化

参考:

Unicode 正規化 – Wikipedia

結合文字/合字/リガチャ

参考:

Unicode の特殊な文字 “結合文字列” | ものかの

合成可能記号 | CyberLibrarian

結合文字 – Wikipedia

合字 – Wikipedia

絵文字

参考:

Unicode 13.0 絵文字 | Let’s EMOJI

Unicode 12.0 絵文字 | Let’s EMOJI

Unicode 11.0 絵文字 | Let’s EMOJI

Unicode 10.0 絵文字 | Let’s EMOJI

日中韓統合漢字 (CJK)

参考:

CJK 統合漢字 全漢字一覧 | CyberLibrarian

東アジア | CyberLibrarian

CJK 統合漢字 – Wikipedia

CJK 統合漢字 (4E00-62FF) – Wikipedia

CJK 統合漢字 (6300-77FF) – Wikipedia

CJK 統合漢字 (7800-8CFF) – Wikipedia

CJK 統合漢字 (8D00-9FFF) – Wikipedia

CJK 統合漢字拡張 A – Wikipedia

ブロック

参考:

ブロック – Wikipedia

漢字

特殊漢字
  • (U+3005)漢字の繰り返しを表す文字/踊り字
  • (U+3007)漢数字で用いる零 (ゼロ)
  • (U+303B)訓読みの繰り返しを表す文字/踊り字

参考:

グリフウィキ

々 (U+3005) | 0g0.org

〇 (U+3007) | 0g0.org

〻 (U+303B) | 0g0.org

Unicode で漢字の正規表現 | ものかの

識別子

  • ID_Start1文字目
  • ID_Continue2文字目以降
NFKC
  • XID_Start
  • XID_Continue

参考:

Unicode Identifier and Pattern Syntax (UAX #31) | Unicode [Official]

How to get all Unicode characters from specific categories? – Stack Overflow

文字プロパティ

ツール:

Character Properties – Utilities | Unicode [Official]

参考:

Unicode のコードポイントやプロパティの一覧/詳細情報などを確認 | note.nkmk.me

文字データベース

公式サイト:

Character Database (UAX #44) | Unicode [Official]

リンク:

Index of UNIDATA | Unicode [Official]

参考:

Unicode Character Database | SuikaWiki

一覧/検索サイト

Unicode キャラクター図鑑

0g0.org – Unicode と URL エンコード検索と変換サイト

Unicode 一覧表 | Labyrinthe Noir

Graphemica

Unicode | Compart

ツール

Unicode コードポイント変換 | ちょびつーる

Unicode 文字ツール | marbacka.net

UnicodeSet – Utilities | Unicode [Official]

Utilities | Unicode [Official]

記事をシェアする:
タグ:

コメントを残す

メールアドレスが公開されることはありません。

Protected by reCAPTCHA