Acdong
Learn by doing
Acdong
전체 방문자
오늘
어제
  • 분류 전체보기
    • Economy
      • Saving Money
    • Self-improvement
    • Thoughts
    • Machine learning
      • Deep Learning
      • Chatbot
      • NLP
    • MLops
      • AWS
      • Container
      • Serving
    • Computer Vision
    • Data Science
      • ADsP
      • R
    • Project
    • Python
      • Data Structure & Algorithm
    • C,C++
    • API
      • ElasticSearch
    • Error Note
    • Network
    • RDBMS
      • SQL

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • [GitHub]

인기 글

태그

  • nlp
  • R
  • 존댓말 반말 분류
  • pandas
  • R그래프
  • 어텐션
  • 머신러닝
  • 이미지 전처리
  • 회귀계수
  • Python
  • 다중공선성
  • plot()
  • 기계학습
  • 데이터 전처리
  • R시각화
  • c포인터
  • 포인터
  • Numpy
  • SentenceTransformer
  • sbert

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Acdong

Learn by doing

Error Note

[Tensorflow] . failed to create cublas handle: CUBLAS_STATUS_INTERNAL_ERROR

2021. 4. 8. 18:33
728x90

Tensorflow 2에서 자꾸 아래와 같은 오류가 나서 고생 했습니다.

 

2019-12-30 01:42:43.383561: W tensorflow/stream_executor/platform/default/dso_loader.cc:55] Could not load dynamic library 'cublas64_100.dll'; dlerror: cublas64_100.dll not found 
2019-12-30 01:42:43.383761: E tensorflow/stream_executor/cuda/cuda_blas.cc:238] failed to create cublas handle: CUBLAS_STATUS_INTERNAL_ERROR 
2019-12-30 01:42:43.384698: E tensorflow/stream_executor/cuda/cuda_blas.cc:238] failed to create cublas handle: CUBLAS_STATUS_INTERNAL_ERROR 
2019-12-30 01:42:43.385885: E tensorflow/stream_executor/cuda/cuda_blas.cc:238] failed to create cublas handle: CUBLAS_STATUS_INTERNAL_ERROR 
2019-12-30 01:42:43.386065: W tensorflow/stream_executor/stream.cc:1919] attempting to perform BLAS operation using StreamExecutor without BLAS support 
2019-12-30 01:42:43.386224: W tensorflow/core/common_runtime/base_collective_executor.cc:216] BaseCollectiveExecutor::StartAbort Internal: Blas GEMV launch failed:  m=1, n=4 
 [[{{node sequential/dense/MatMul}}]]





[Op:__inference_distributed_function_418]



Function call stack: 
distributed_function

 

이게 처음에 되던게 어느 순간 안되면 멘붕이 일어납니다.

 

아니 난 아무것도 안만졌는데 왜 아깐되고 지금은 안되는 것인가...

 

알고 봤더니 tensorflow GPU 메모리 문제였습니다.

 

간단하게

import os
os.environ["CUDA_VISIBLE_DEVICES"] = '1'

이 코드로 해결했습니다.

 

GPU '1' 만 지정하도록 강제하는 방법입니다.

 

mickael-k.tistory.com/32

windstop.tistory.com/159

반응형
저작자표시 비영리 (새창열림)

'Error Note' 카테고리의 다른 글

[Mac_M1]. tokenizer install error 해결하기  (0) 2022.06.12
[Mac_m1]. sentencepiece install error 해결하기  (0) 2022.06.12
[mac_M1] . ImportError: dlopen - regex error  (0) 2021.10.20
[Error] Instance of 'SQLAlchemy' has no 'Column' member (no-member) 에러 해결하기(feat. VSCode)  (0) 2020.10.30
[개발환경] Mac OS에서 아나콘다(Anaconda) 환경변수 설정하는 법 jupyter notebook 주피터 노트북  (0) 2020.07.19
    'Error Note' 카테고리의 다른 글
    • [Mac_m1]. sentencepiece install error 해결하기
    • [mac_M1] . ImportError: dlopen - regex error
    • [Error] Instance of 'SQLAlchemy' has no 'Column' member (no-member) 에러 해결하기(feat. VSCode)
    • [개발환경] Mac OS에서 아나콘다(Anaconda) 환경변수 설정하는 법 jupyter notebook 주피터 노트북
    Acdong
    Acdong
    E-mail : alswhddh@naver.com / 자연어처리와 MLops 를 연구하고 있는 스타트업 개발자입니다.

    티스토리툴바