Acdong
Learn by doing
Acdong
전체 방문자
오늘
어제
  • 분류 전체보기
    • Economy
      • Saving Money
    • Self-improvement
    • Thoughts
    • Machine learning
      • Deep Learning
      • Chatbot
      • NLP
    • MLops
      • AWS
      • Container
      • Serving
    • Computer Vision
    • Data Science
      • ADsP
      • R
    • Project
    • Python
      • Data Structure & Algorithm
    • C,C++
    • API
      • ElasticSearch
    • Error Note
    • Network
    • RDBMS
      • SQL

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • [GitHub]

인기 글

태그

  • plot()
  • 머신러닝
  • 어텐션
  • R그래프
  • 기계학습
  • nlp
  • 다중공선성
  • 존댓말 반말 분류
  • pandas
  • c포인터
  • Python
  • R시각화
  • sbert
  • 포인터
  • 이미지 전처리
  • 회귀계수
  • 데이터 전처리
  • SentenceTransformer
  • R
  • Numpy

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Acdong

Learn by doing

[annotation]. 텍스트 데이터 라벨링 꿀팁(2)
Machine learning/NLP

[annotation]. 텍스트 데이터 라벨링 꿀팁(2)

2021. 11. 12. 11:38
728x90

 

https://unikys.tistory.com/307

 

[엑셀] 매크로로 선택영역의 특정 문자만 색 변환하기

* 목표: 엑셀에서 선택한 영역을 가져와서 각 문자열의 문자 중에 입력한 단어가 있으면 색을 변환하는 매크로 작성 * 작성 환경: 엑셀 2010 : 예를 들면 아래와 같은 엑셀이 있을 경우 'fer'를 빨간

unikys.tistory.com

 

전 포스팅에서 키워드들 통한 라벨링 진행 방법을 소개했다.

하지만 문장의 길이가 길 수록 해당 키워드가 어디에 위치하고있는지 찾기가 너무 힘들었다.

문장의 길이가 길면 그 만큼 라벨링 속도 저하 발생...ㅠㅠ

 

그렇다고 대충보기에는 모호한 데이터들이 많았다.

"뒤지" 키워드의 경우

1) 너 뒤지고 싶냐?

2) 방을 다 뒤지고 나서도 찾을 수 없었어.

 

이런 키워드들이 자주 등장함.

 

그래서 위 링크의 방법을 통해 정확도와 느린 속도를 개선했다.

엑셀 메크로를 통해 해당 키워드의 빨간색 표시 가능

Sub highlight()
    Dim cell As Range, word As String, startIndex As Integer
    
    word = InputBox(prompt:="단어를 입력하세요", Title:="문자열 색 변환")
    
    If Len(word) > 0 Then
        For Each cell In Selection
            startIndex = InStr(1, cell, word, vbBinaryCompare)
            
            If startIndex > 0 Then
                cell.Characters(startIndex, Len(word)).Font.Color = RGB(255, 0, 0)
                cell.Characters(startIndex, Len(word)).Font.Bold = True
            End If
        Next cell
    End If
End Sub

 

결과

이렇게 되면 표시된 키워드의 주변 단어들만 봐도 대충 문장의 의미를 파악할 수 있다.

반응형
저작자표시 비영리 (새창열림)

'Machine learning > NLP' 카테고리의 다른 글

[NLP]. 도로명 주소 & 지번 주소 인식 정규표현식  (0) 2022.01.11
[NLP] Fine-tuning(파인튜닝)과 in-context learning(인컨텍스트 러닝)  (0) 2021.12.14
[annotation]. 텍스트 데이터 라벨링 꿀팁(1)  (0) 2021.11.12
[NLP]. 한국어 맞춤법 검사기 사용하기 (feat. hanspell )  (0) 2021.10.27
[전처리]. 핸드폰 번호 , 계좌번호 , 주소 필터링(Python 정규표현식)  (0) 2021.10.14
    'Machine learning/NLP' 카테고리의 다른 글
    • [NLP]. 도로명 주소 & 지번 주소 인식 정규표현식
    • [NLP] Fine-tuning(파인튜닝)과 in-context learning(인컨텍스트 러닝)
    • [annotation]. 텍스트 데이터 라벨링 꿀팁(1)
    • [NLP]. 한국어 맞춤법 검사기 사용하기 (feat. hanspell )
    Acdong
    Acdong
    E-mail : alswhddh@naver.com / 자연어처리와 MLops 를 연구하고 있는 스타트업 개발자입니다.

    티스토리툴바