배쉬 정규식 캡처 그룹 여러 영숫자 값

문자열에서 여러 영숫자 값 (이 숫자는 다를 수 있음)을 일치시키고 bash 캡처 그룹 배열에 저장하려고합니다. 그러나 첫 번째 경기 만 받고 있습니다.

mystring1='<link rel="self" href="/unix//api/clouds/1/instances/1BBBBBB"/> dsf <link rel="self" href="/unix//api/clouds/1/instances/2AAAAAAA"/>'

regex='/instances/([A-Z0-9]+)'

[[ $mystring1 =~ $regex ]]

echo ${BASH_REMATCH[1]}
1BBBBBB

echo ${BASH_REMATCH[2]}

보시다시피 그것은 내가 찾고있는 첫 번째 값과 일치하지만 두 번째 값과는 일치하지 않습니다.



답변

bash에서 전역 일치를 수행 할 수 없다는 것은 부끄러운 일입니다. 당신은 이것을 할 수 있습니다 :

global_rematch() {
    local s=$1 regex=$2
    while [[ $s =~ $regex ]]; do
        echo "${BASH_REMATCH[1]}"
        s=${s#*"${BASH_REMATCH[1]}"}
    done
}
global_rematch "$mystring1" "$regex" 
1BBBBBB
2AAAAAAA

문자열에서 일치하는 접두사를 잘라내어 다음 부분을 일치시킬 수 있습니다. 그것은 문자열을 파괴하지만, 함수에서 지역 변수이므로 누가 신경 써야합니다.

실제로 해당 함수를 사용하여 배열을 채울 것입니다.

$ mapfile -t matches < <( global_rematch "$mystring1" "$regex" )
$ printf "%s\n" "${matches[@]}"
1BBBBBB
2AAAAAAA

답변

두 번째 배열 값을 얻으려면 정규식에 두 번째 괄호 세트가 있어야합니다.

mystring1='<link rel="self" href="/unix//api/clouds/1/instances/1BBBBBB"/> dsf <link rel="self" href="/unix//api/clouds/1/instances/2AAAAAAA"/>'

regex='/instances/([A-Z0-9]+).*/instances/([A-Z0-9]+)'

[[ $mystring1 =~ $regex ]]

$ echo ${BASH_REMATCH[1]}
1BBBBBB
$ echo ${BASH_REMATCH[2]}
2AAAAAAA