oracle正則表達式多項匹配時相似項有優(yōu)先級詳解
Oracle常用正則表達式函數(shù)主要以下5個:
REGEXP_LIKE:與LIKE的功能相似;REGEXP_SUBSTR :與SUBSTR的功能相似;REGEXP_INSTR :與INSTR的功能相似;REGEXP_REPLACE :與REPLACE的功能相似;REGEXP_COUNT :與COUNT的功能相似;常用的正則表達式匹配符有以下運算符,本文重點來闡述“|”指定多個選項,容易被忽視的問題。
Regexp_Like()函數(shù) 模糊匹配。
1、語法規(guī)則regexp_like(source_string,pattern[match_parameter])
2、注釋source_string:傳入的字符串,可以是常量,也可以是某個值類型為串的列;pattern:要進行匹配的字符串;match_parameter:文本量,進一步訂制搜索,取值如下:‘i’ 用于不區(qū)分大小寫的匹配。‘c’ 用于區(qū)分大小寫的匹配。‘n’ 允許將句點“.”作為通配符來匹配換行符。如果省略該參數(shù),句點將不匹配換行符。‘m’ 將源串視為多行。即將“^”和“$”分別看做源串中任意位置任意行的開始和結束,而不是看作整個源串的開始或結束。如果省略該參數(shù),源串將被看作一行來處理。如果取值不屬于上述中的某個,將會報錯。如果指定了多個互相矛盾的值,將使用最后一個值。如’ic’會被當做’c’處理。省略該參數(shù)時:默認區(qū)分大小寫、句點不匹配換行符、源串被看作一行。
3、實例代碼:
select * from (select 'ABC你好' reg from dual union select 'a233' reg from dual)where regexp_like(reg,'[0-9]','c')--匹配有數(shù)字的字符串效果:
解析:
可以看到正則表達式,通過后面的'[0-9]'的規(guī)則來獲取我們想要的數(shù)據(jù)。
二、正則表達式優(yōu)先級的注意點當我們使用REGEXP_REPLACE將多個表達式的數(shù)據(jù)替換時,這時候我們要考慮替換規(guī)則有沒有類似項,比如REGEXP_REPLACE(reg,'-BL|-BL1')即替換掉字符串reg里面包含-BL或者-BL1的字符串,此時如果我們按這種寫法REGEXP_REPLACE(reg,'-BL|-BL1'),實際效果是只會替換掉-BL,因為oracle會按照替換規(guī)則的順序來執(zhí)行,如果滿足了第一個條件,后面的就不會再去執(zhí)行了,這也是為了加快了程序的處理速度,但同時也會造成我們常常忽略的問題。
好的,我們來看看下面的具體案例吧。
代碼:
select reg, REGEXP_REPLACE(reg,'-BL|-BL1')reg_replace from (select 'A_123456D-BL1' reg FROM dual)效果:
解析:
因為正則表達式,默認會按順序執(zhí)行,此時正則表達式,-BL滿足規(guī)則了,就不會執(zhí)行-BL1了,因此就會得到的結果是對應的REG字符串里面替換后還會多出了一個1。
三、解決方案現(xiàn)實情況下,我們往往會有很多替換規(guī)則,少則幾個,多則好幾百,如果我們用replace函數(shù)估計要嵌套幾百次,估計你會直搖頭吧,雖然regexp_replace可以一次性將多個規(guī)則寫在一起,但是我們還是要注意上述提到的優(yōu)先級的問題。因此我們需要將相同的部分放到最后,如上面說到的“-BL”此時就能達到我們的需求了。
我們來看個現(xiàn)實的案例。當面對168個規(guī)則時我們會遇到哪些問題。
1、正則表達式過長解決方法:嵌套多個正則表達式 ,像竹筍一樣多疊幾層即可。
出來的數(shù)據(jù)還是有我們不想要的數(shù)據(jù),比如下面的三個批次,我們只想保存一條,如果我們替換規(guī)則不當就會造成,這三個字符串替換后還是不相同的,無法達到我們想要的效果。
解決辦法:我們首先將所有的替換規(guī)則用EXCEL表例好,然后排好優(yōu)先級,然后再去修改正則表達式。如圖所示我們將規(guī)則列好,然后用不同顏色標示優(yōu)先級。然后再整理表達式。如下圖所示小編將最小匹配項的表達式放到最后面了,這樣就能達到我們想要的效果了。
針對復雜的數(shù)據(jù)分析,首先建議從業(yè)務角度去規(guī)范,因為雖然技術可以處理,但是歷史數(shù)據(jù)處理成本是巨大,因此一個企業(yè)的數(shù)據(jù)底座搭建,是離不開強標準化的數(shù)據(jù)治理的。
到此這篇關于oracle正則表達式多項匹配時相似項有優(yōu)先級的文章就介紹到這了,更多相關oracle正則表達式多項匹配內容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持好吧啦網(wǎng)!
