MySQL 有許多傳回字串的運算子和函式。本節解答以下問題:此類字串的字元集和校對是什麼?
對於接受字串輸入並傳回字串結果作為輸出的簡單函式,輸出的字元集和校對與主要輸入值相同。例如,UPPER( 傳回與 X)X 具有相同字元字串和校對的字串。相同的規則適用於 INSTR()、LCASE()、LOWER()、LTRIM()、MID()、REPEAT()、REPLACE()、REVERSE()、RIGHT()、RPAD()、RTRIM()、SOUNDEX()、SUBSTRING()、TRIM()、UCASE() 和 UPPER()。
與所有其他函式不同,REPLACE() 函式總是忽略字串輸入的校對,並執行區分大小寫的比較。
如果字串輸入或函式結果為二進位字串,則該字串具有 binary 字元集和校對。可以使用 CHARSET() 和 COLLATION() 函式檢查這一點,這兩個函式都會為二進位字串引數傳回 binary
mysql> SELECT CHARSET(BINARY 'a'), COLLATION(BINARY 'a');
+---------------------+-----------------------+
| CHARSET(BINARY 'a') | COLLATION(BINARY 'a') |
+---------------------+-----------------------+
| binary | binary |
+---------------------+-----------------------+對於合併多個字串輸入並傳回單個字串輸出的操作,標準 SQL 的「彙總規則」適用於決定結果的校對
如果出現明確的
COLLATE,則使用YY。如果出現明確的
COLLATE和YCOLLATE,則引發錯誤。Z否則,如果所有校對都是
Y,則使用Y。否則,結果沒有校對。
例如,使用 CASE ... WHEN a THEN b WHEN b THEN c COLLATE ,產生的校對為 X ENDX。相同的規則適用於 UNION、||、CONCAT()、ELT()、GREATEST()、IF() 和 LEAST()。
對於轉換為字元資料的操作,操作產生的字串的字元集和定序由 character_set_connection 和 collation_connection 系統變數定義,這些變數決定預設的連線字元集和定序(請參閱第 12.4 節「連線字元集和定序」)。這僅適用於 BIN_TO_UUID()、 CAST()、 CONV()、 FORMAT()、 HEX() 和 SPACE()。
虛擬產生欄位的表示式是上述原則的例外。在這些表示式中,無論連線字元集為何,表格字元集都用於 BIN_TO_UUID()、CONV() 或 HEX() 的結果。
如果對於字串函數傳回結果的字元集或定序有任何疑問,請使用 CHARSET() 或 COLLATION() 函數來查詢。
mysql> SELECT USER(), CHARSET(USER()), COLLATION(USER());
+----------------+-----------------+--------------------+
| USER() | CHARSET(USER()) | COLLATION(USER()) |
+----------------+-----------------+--------------------+
| test@localhost | utf8mb3 | utf8mb3_general_ci |
+----------------+-----------------+--------------------+
mysql> SELECT CHARSET(COMPRESS('abc')), COLLATION(COMPRESS('abc'));
+--------------------------+----------------------------+
| CHARSET(COMPRESS('abc')) | COLLATION(COMPRESS('abc')) |
+--------------------------+----------------------------+
| binary | binary |
+--------------------------+----------------------------+