電話応募

ENTRY

MENU

utf8mb4の照合順序について調べてみた

MySQLで文字型のカラムを作成する時に、照合順序をどうするか悩む場合があります。

今回はUTF-8での照合順序の違いを調べてみました。

MySQL8.0の文字コードutf8mb4で、日本語が絡んできそうな照合順序には以下のものがあります。

utf8mb4_bin
utf8mb4_general_ci
utf8mb4_unicode_ci
utf8mb4_unicode_520_ci
utf8mb4_0900_ai_ci
utf8mb4_0900_as_ci
utf8mb4_0900_as_cs
utf8mb4_ja_0900_as_cs
utf8mb4_ja_0900_as_cs_ks

utf8mb4_binは文字をバイナリで比較します。

「a」と「A」は文字コードが違うので異なる文字として扱われます。

それに対してutf8mb4_general_ciとutf8mb4_unicode_ciはアルファベットの大文字と小文字を区別しません。

「a」と「A」は同じ文字として扱われます。

照合順序名の末尾にある「ci」は大文字小文字を区別しない（Case Insensitive）という意味です。

utf8mb4_general_ciとutf8mb4_unicode_ciでは、日本語の扱いに違いがあります。

utf8mb4_general_ciでは「あ」と「ア」は異なる文字として扱われるのですが、utf8mb4_unicode_ciでは同じ文字として扱われます。

さらにutf8mb4_unicode_ciでは「は」「ぱ」「ば」「ハ」「バ」「パ」も同じ文字として扱われます。

utf8mb4_general_ciとutf8mb4_unicode_ciには問題があり、UTF-8で4バイトの文字は全て同じ文字として扱われます。

有名な「寿司ビール問題」がそれです。

utf8mb4_unicode_520_ciではその問題が解消されました。

utf8mb4_unicode_ciとutf8mb4_unicode_520_ciの違いは、文字を照合する際のUnicodeのバージョンが4.0.0から5.2.0になったことです。

これによって4バイト文字も適切に扱えるようになりました。

以下の照合順序はUnicodeのバージョンが9.0.0に上がっています。

utf8mb4_0900_ai_ci
utf8mb4_0900_as_ci
utf8mb4_0900_as_cs
utf8mb4_ja_0900_as_cs
utf8mb4_ja_0900_as_cs_ks

照合順序名の末尾に「ai」「cs」「ks」などが付いています。

それぞれ以下の意味になります。
|文字|意味 |例 |
|—-|————————————————–|——|
| ai |アクセントの違いを区別しない（Accent Insensitive）|A = Ä |
| as |アクセントの違いを区別する（Accent Sensitive） |A ≠ Ä|
| ci |大文字・小文字を区別しない（Case Insensitive） |A = a |
| cs |大文字・小文字を区別する（Case Sensitive） |A ≠ a|
| ks |ひらがな・カタカナを区別する（Kana Sensitive） |あ ≠ ア|

「ai」の場合「ぱ」と「ば」を区別しません。

また、「ci」の場合「や」と「ゃ」を区別しません。

「_ja」がつく照合順序の場合は「_ks」が付くか付かないかで、ひらがな・カタカナを区別するかしないかが分かれました。

以上のことをまとめると以下の表のようになりました。

utf8mb4_general_ci、utf8mb4_unicode_ciはUnicodeのバージョンが古く、4バイト文字の区別ができないので使用すべきではないです。

utf8mb4_unicode_520_ciもUnicodeのバージョンが古いので使用する意味がなさそうです。

日本語が入るカラムであれば、utf8mb4_ja_0900_as_cs_ksを選択するのが無難でしょうか。

名前を検索する時に「は」で検索したら「馬場」さんも検索結果に含めたい時などはutf8mb4_0900_ai_ciを使うと便利です。

今回はイコール「=」で一致するかどうかを見ましたが、LIKE検索をした場合や「>」「<」で大きさを比較した場合は違った結果が得られました。

まだまだ照合順序の奥は深そうです。

システム部ではデータベースのスペシャリストを募集しています。

我こそはと思う方がいましたら、システム部で一緒に働きましょう。

2019年5月20日

スタッフブログ

スタッフブログ最新記事

大感動体験のすすめと更新作業

WEBスタッフ

2025年03月20日

幹部ナビをご覧のみなさま、こんにちは。媒体部の毎日豆乳です。 2025年は月一本は映画館で映画を見よ...
続きを読む
24時間営業の需要

WEBスタッフ

2025年03月07日

求人部の上岡です。応募者の方々とやり取りする上で言葉の意味や使い方がちゃんと合ってるのか、調べる...
続きを読む
SNS好きなだけではダメ？私が入社して学んだこと!! SNSプロモーション担当るるブログ

WEBスタッフ

2025年03月04日

こんにちは！SNSプロモーション担当のるるです🌸 私はもともとSNSが大好きで、「SNSを仕事にでき...
続きを読む
なぜ今、SNSプロモーション担当をシンデレラは求めているの？

風俗面接官ブログ

2025年03月03日

こんにちは！人事部の渋谷です。今日は、「SNSプロモーション担当を今めちゃくちゃ求めてますよ！」と...
続きを読む
英語SEO暴落から復活までのお話～DMCA悪用されたの巻～

風俗面接官ブログ

2025年02月25日

ようこそ幹部ナビへ！人事部マネージャーの宇佐美です。さて、今回は「英語SEO」に関してのお話を少々...
続きを読む
風俗店員のオシゴト～25歳独身競馬好きの場合～

風俗店長ブログ

2025年02月20日

まいど！池袋西口店の全身競馬人間です！今回は風俗で働こうとお考えの未経験の方々に向けて、よく...
続きを読む

詳しい採用情報を見る

採用情報一覧へ

人気の職種

教育官ブログ

$\風俗業界時評/シン・コラム$

英語スタッフブログ!

日本一きまじめなシンデレラFCグループ時給1,200円以上でアルバイトを募集しています。

人気の職種

ご応募はお電話でも受け付けています

教育官ブログ

$\風俗業界時評/シン・コラム$

英語スタッフブログ!

日本一きまじめなシンデレラFCグループ時給1,200円以上でアルバイトを募集しています。

タグ

スタッフブログ最新記事

大感動体験のすすめと更新作業

WEBスタッフ

2025年03月20日

幹部ナビをご覧のみなさま、こんにちは。媒体部の毎日豆乳です。 2025年は月一本は映画館で映画を見よ...
続きを読む
24時間営業の需要

WEBスタッフ

2025年03月07日

求人部の上岡です。応募者の方々とやり取りする上で言葉の意味や使い方がちゃんと合ってるのか、調べる...
続きを読む
SNS好きなだけではダメ？私が入社して学んだこと!! SNSプロモーション担当るるブログ

WEBスタッフ

2025年03月04日

こんにちは！SNSプロモーション担当のるるです🌸 私はもともとSNSが大好きで、「SNSを仕事にでき...
続きを読む
なぜ今、SNSプロモーション担当をシンデレラは求めているの？

風俗面接官ブログ

2025年03月03日

こんにちは！人事部の渋谷です。今日は、「SNSプロモーション担当を今めちゃくちゃ求めてますよ！」と...
続きを読む
英語SEO暴落から復活までのお話～DMCA悪用されたの巻～

風俗面接官ブログ

2025年02月25日

ようこそ幹部ナビへ！人事部マネージャーの宇佐美です。さて、今回は「英語SEO」に関してのお話を少々...
続きを読む
風俗店員のオシゴト～25歳独身競馬好きの場合～

風俗店長ブログ

2025年02月20日

まいど！池袋西口店の全身競馬人間です！今回は風俗で働こうとお考えの未経験の方々に向けて、よく...
続きを読む

月別　アーカイブ

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

人気の職種

教育官ブログ

$\風俗業界時評/シン・コラム$

英語スタッフブログ!

日本一きまじめなシンデレラFCグループ時給1,200円以上でアルバイトを募集しています。