Acdong
Learn by doing
Acdong
전체 방문자
오늘
어제
  • 분류 전체보기
    • Economy
      • Saving Money
    • Self-improvement
    • Thoughts
    • Machine learning
      • Deep Learning
      • Chatbot
      • NLP
    • MLops
      • AWS
      • Container
      • Serving
    • Computer Vision
    • Data Science
      • ADsP
      • R
    • Project
    • Python
      • Data Structure & Algorithm
    • C,C++
    • API
      • ElasticSearch
    • Error Note
    • Network
    • RDBMS
      • SQL

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • [GitHub]

인기 글

태그

  • 회귀계수
  • sbert
  • R그래프
  • 이미지 전처리
  • 존댓말 반말 분류
  • 데이터 전처리
  • 포인터
  • Python
  • 다중공선성
  • c포인터
  • nlp
  • R
  • SentenceTransformer
  • plot()
  • 기계학습
  • pandas
  • 어텐션
  • 머신러닝
  • Numpy
  • R시각화

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Acdong

Learn by doing

Machine learning/NLP

[NLP]. 도로명 주소 & 지번 주소 인식 정규표현식

2022. 1. 11. 14:25
728x90

출처 : 당근마켓 블로그

https://medium.com/daangn/%EC%A3%BC%EC%86%8C-%EC%9D%B8%EC%8B%9D%EC%9D%84-%EC%9C%84%ED%95%9C-%EC%82%BD%EC%A7%88%EC%9D%98-%EA%B8%B0%EB%A1%9D-df2d8f82d25

 

import re

input_text = "인천광역시 부평구 안남로 123 행복아파트 101동 101호"

address = re.compile("(([가-힣A-Za-z·\d~\-\.]{2,}(로|길).[\d]+)|([가-힣A-Za-z·\d~\-\.]+(읍|동)\s)[\d]+)")

address.search(input_text)

 

결과 :

<re.Match object; span=(10, 17), match='안남로 123'>
반응형
저작자표시 비영리 (새창열림)

'Machine learning > NLP' 카테고리의 다른 글

[NLP]. 임베딩 벡터(embedding vector)를 문자열로 저장하는 방법(feat. byte type , base85 )  (0) 2022.06.21
[NLP]. 구어체(채팅)데이터에서 필요한 품사만 가져오기 (feat.꼬꼬마 형태소 분석기)  (0) 2022.03.04
[NLP] Fine-tuning(파인튜닝)과 in-context learning(인컨텍스트 러닝)  (0) 2021.12.14
[annotation]. 텍스트 데이터 라벨링 꿀팁(2)  (0) 2021.11.12
[annotation]. 텍스트 데이터 라벨링 꿀팁(1)  (0) 2021.11.12
    'Machine learning/NLP' 카테고리의 다른 글
    • [NLP]. 임베딩 벡터(embedding vector)를 문자열로 저장하는 방법(feat. byte type , base85 )
    • [NLP]. 구어체(채팅)데이터에서 필요한 품사만 가져오기 (feat.꼬꼬마 형태소 분석기)
    • [NLP] Fine-tuning(파인튜닝)과 in-context learning(인컨텍스트 러닝)
    • [annotation]. 텍스트 데이터 라벨링 꿀팁(2)
    Acdong
    Acdong
    E-mail : alswhddh@naver.com / 자연어처리와 MLops 를 연구하고 있는 스타트업 개발자입니다.

    티스토리툴바