Python正則表達(dá)式如何匹配中文
用 ’[u4e00-u9fa5]‘ 匹配中文
在字符串中匹配中文
示例:
匹配字符串中的第一個(gè)中文字符
匹配字符串中的第一個(gè)連續(xù)的中文片段
匹配字符串中的所有中文字符
注:要確保正則字符和匹配文本是 unicode 范圍內(nèi)的編碼。
其他 擴(kuò)充 范圍
幾個(gè)主要非英文語(yǔ)系字符范圍:2E80~33FFh:中日韓符號(hào)區(qū)。收容康熙字典部首、中日韓輔助部首、注音符號(hào)、日本假名、韓文音符,中日韓的符號(hào)、標(biāo)點(diǎn)、帶圈或帶括符文數(shù)字、月份,以及日本的假名組合、單位、年號(hào)、月份、日期、時(shí)間等。3400~4DFFh:中日韓認(rèn)同表意文字?jǐn)U充A區(qū),總計(jì)收容6,582個(gè)中日韓漢字。4E00~9FFFh:中日韓認(rèn)同表意文字區(qū),總計(jì)收容20,902個(gè)中日韓漢字。A000~A4FFh:彝族文字區(qū),收容中國(guó)南方彝族文字和字根。AC00~D7FFh:韓文拼音組合字區(qū),收容以韓文音符拼成的文字。F900~FAFFh:中日韓兼容表意文字區(qū),總計(jì)收容302個(gè)中日韓漢字。FB00~FFFDh:文字表現(xiàn)形式區(qū),收容組合拉丁文字、希伯來(lái)文、阿拉伯文、中日韓直式標(biāo)點(diǎn)、小符號(hào)、半角符號(hào)、全角符號(hào)等。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. 如何通過(guò)vscode運(yùn)行調(diào)試javascript代碼2. python b站視頻下載的五種版本3. JAVA抽象類(lèi)及接口使用方法解析4. 教你JS更簡(jiǎn)單的獲取表單中數(shù)據(jù)(formdata)5. 測(cè)試模式 - XSL教程 - 56. JS實(shí)現(xiàn)簡(jiǎn)單的todoList(記事本)效果7. JavaScript設(shè)計(jì)模式之策略模式實(shí)現(xiàn)原理詳解8. python如何寫(xiě)個(gè)俄羅斯方塊9. 《CSS3實(shí)戰(zhàn)》筆記--漸變?cè)O(shè)計(jì)(一)10. Python結(jié)合百度語(yǔ)音識(shí)別實(shí)現(xiàn)實(shí)時(shí)翻譯軟件的實(shí)現(xiàn)
