본문 바로가기

aws athena 쿼리 저장

remove accents in athena query

연관검색어 생성 로직을 만들면서 athena와 mysql을 섞어썼는데, 과정에서 생각하지 못한 에러가 발생했다.
mysql varchar에서 영어 accent를 구분하지 않아서, athena에서 가져온 값과 어긋나는 것이었다.
연관검색어를 추천할때 알파벳에 accent가 붙어 있는지 없는지는 중요하지 않았기 때문에 accent는 없애기로 했다.
accent를 없애면서 normalize라는 것을 알게됐는데, 이것은 한글을 초성,중성,종성으로 분리하는데에도 써먹을 수 있었다.

SELECT NORMALIZE(REGEXP_REPLACE(NORMALIZE('á, é, í, ó, ú, ü, ñ', NFD), '[\u0300-\u036f]', ''), NFC)

 

'aws athena 쿼리 저장' 카테고리의 다른 글

athena test table  (0) 2021.06.18
[athena] split string into array  (0) 2021.05.06
[ATHENA Query] url parameter 타입 체크하기  (2) 2020.11.13