주피터 노트북 기본경로 변경하는 방법이 여러가지가 있는 것으로 알고 있는데,

아래 방법이 가장 간단한 것 같아 첨부를 한다.

 

1. 우선 시작 메뉴에 있는 주피터 노트북 바로가기 항목을 우클릭하여 [자세히 -> 파일위치 열기] 선택

윈도우 10 기준..

 

2. 그러면 바로가기 파일이 있는 폴더로 이동하게 되는데, 그중 주피터 노트북 바로가기 선택하여 우클릭 후 ['속성'] 클릭

 

3. 속성 창이 뜨면, 대상(T) 라고 되어 있는 항목에 바로가기 실행 command가 있을텐데 가장 뒷 부분 따옴표 사이에

   원하는 경로를 기입하면된다. (처음에는 %USERPROFILE% 뭐 이런거 비슷한 써져있을거임)

 

4. 그리고 주피터 노트북 재실행하면, 된다!

반응형

ADP (데이터분석전문가) 15회 실기 후기 (불합격...확정)

 

 

마지막일줄 알았던...... 

합격하던, 불합격하던 내 기억속에서 지워버리려고 다짐했던,

ADP 15회 실기의 후기를 늦게나마 기록해 본다.

 

일단 결과적으로는 1,2 번 2개의 큰 항목의 문제 중,  2번을 통째로 못풀었기 때문에 불합격 확정이다.

 

15회 실기 후기는 별로 없지만, 그래도 네이버 카페나, 그런 곳에 몇몇 분이 다소 후기를 자세하게 써주신 분들이 계셔서,

대략 내용은 다른 글을 봐도 파악이 가능할 듯 하다..

 

일전 응시했던 ADP 실기 11회와 비교하면, 

Text mining이 출제되지 않은 것을 감안하고도, 난이도가 확 높아졌다는 것을 느꼈다.

솔직히 금번 Python으로 사용 언어를 바꾸는 모험을 했지만 서도,

공부 시간이 꽤 되었는데 , (책 두권을 대략 다 보았다.)

 

책에서 전혀 보지도 못한, timestamp 형 data가 2번에 출제되면서, Data변환 자체도 못해보고,

2번 문제를 통으로 날려먹었다.

(Timestamp가 DB에서 이야기하는 그 Timestamp가 아니다.  결론적으로 표현형태는 같겠지만... 여튼 일반적으로 DB query날리는 사람들이 접한 그 Timestamp 가 아님)

 

 

 

일단 시험 문제를 통해 후기를 좀 정리해보자면,

 

1번은 무슨 제철회사 Iot data 같은 것들을 제공해 주고,

 - EDA(탐색적 데이터 분석) 해보는 거

 - 독립변수 선별 (feature engineering)

 - 종속변수(y)를 이항으로 바꾸고 로지스틱 회귀 분석하기

 - 종속변수(y) 다항인 상태에서 SVM 포함하여 3가지 알고리즘으로 돌려보고 평가

 - 위에서 만든 모델 중 하나 적합한 모형 찾아서 군집분석 실시하고 군집분석을 반영하여 F1 score값을 통해 

   모델이 나아지는지 확인

 

과 같은 것을 진행하는 것이다.

1번문제도 기존 11회 실기의 머신러닝 문제와 비교해 나름 난이도가 낮은 편은 아니었지만, 

그나마 손을 댈 수는 있었는데, 솔직히 군집분석을 기존 머신러닝 결과에 반영하라는게 무슨 의미인지 몰라서,

좀 벙찌기도 했었다.

(나중에 카페 글을 보니 해당 군집을 또 독립변수로 놓고 학습을 하면 모델의 질이 높아질 수 있다. 뭐 그런 뜻인 것 같다. 솔직히 이와 같은 분석 방식을 난 전혀 모르고 있었다)

 

그리고 python으로 언어를 변경하면서, 준비를 안해서 좀 문제가 되었던 부분은, EDA와 Feature engineering이다.

기존 상관분석 등으로 독립변수 선별할 때 사용했던 R code를 백프로 python으로 숙지를 못하고 가서,

(대체 준비할때 난 뭐한거지?)

for 문으로 일일히, 구현을 해서, 그래프를 하나하나 뽑아낸 후 붙이는 노가다를 했었다.

 

뭐 여튼 1번도 어버버 했는데 어떻게어떻게 했는데..

 

 

 

2번은.. 전력사용량 관련 data를 제공해주었는데

그 망할 timestamp라는 무슨 열 몇자리 숫자로 구성된 데이터가 나와서,

이걸 어떻게 변환하지? 머리가 새하얗게 변하면서 그냥 망해버렸다.

가장 기본이 되는 시계열 column (3개의 data의 key가 되어야 하는 column이었음) 을 변환을 못하니 뭐 그냥 문제 자체에 손을 못대고 넋을 놓게되어 버렸다.

 

솔직히 2번문제 접하고 나서,  와... 이건 내가 이 Data형을 실무에서 경험하지 못했다면, 

아무리 공부를 많이 했어도, 책을 3~4권 더 봤어도 이걸 풀 수 있었을까? 라는 생각이 들면서

마음속 깊이, 내 자질을 의심했다. 

 

이것도 알고보니 python 함수하나로 간단히 해결되는 문제인데,  뭐 내가 이런걸 봤어야지 .ㅠ

(datatime package안에 fromtimestamp 뭐이런 함수가 있음... 열라 간단...)

사실 내가 참고한 python 데이터 분석 관련 책, R 책에는 정말 조금이라도 비슷한 유형이 하나도 나오지 않아.. 

정말 당황스러운 시간이었다..

 

여튼 이렇게 시험이 끝나고...

시험이 끝나는 동시에 불합격을 확정지으며, 씁쓸한 발걸음을 집으로 옮겼는데..

 

 

아 왜 이렇게 분한지... 3월 시험을 한번 더 응시해볼까 하는 생각...

 

 

 

그리고 그런 생각이 든 이유는 ,

이번에 R -> python으로 전환하면서, 의외로 걱정했던 것 만큼 크게 'library 공백' 이 없었다.

즉 R에서 지원하는 대부분의 분석에 필요한 Library가 python에 대부분이 구현되어 있어,

크게 불편함을 느끼지 못했다는 뜻이다.

물론 일부... 뭐 상관관계라든가... 변수 선택관련 step(전진선택법, 후진소거법, both 뭐 그런거...) 이라던가... 그런 일부는 R처럼 보기 편한 형태로 구현되어있지는 않지만... 여튼 python의 위대함을 알게되면서, 조금더 공부해보고 싶다는 생각이 들었다.

R도 좋은 언어긴 하지만, 결국 미래에는, python이 데이터 분석 계열 언어 지분을 지배할 수도 있겠다는 생각이 들었음.. 다른 또 기똥찬 뭔가가 나오지 않는 이상..

 

 

여튼 ADP 15회 실기에 대한 넋두리는 이것으로 끝...

 

ADP라는 힘든 싸움을 하는 전국의 데이터 분석 전문가 지망생들에게 repect를 보내며...

(2020에는 빅데이터 분석기사도 나온다드만....)

 

 

 

반응형

sklearn 의 학습 모듈 사용 시, “ValueError: Expected 2D array, got 1D array instead” 발생 시 해결방법.

 

머신러닝 공부를 하면서, sklearn 패키지에 있는 LinearRegression을 트레이닝 하려고 하는데,

또 짜증나게 영문 모를 에러가 발생한다.

 

이상하다... 독립 변수, 종속 변수 모두 다 확인해서... Test, Train Data도 잘 나눠서 넣었는데 이게 무슨 에러여...

분명히 개수도 맞고 데이터 형도 맞고 한데...

 

검색검색해보니... 젠장맞을..

머신러닝 알고리즘 트레이닝을 할때, sklearn 패키지 같은 경우, 독립변수(x)를 2차원 배열로 넣어야 되나보다..

(학습할 독립변수가 여러개가 될 수 있으니 그런 듯)

위와 같은 경우는,

 

이런 식으로 , x변수가 하나라도 2차원 배열로 선언을 해줘야한다.

그러고나니..

 

oh... 깔끔하게 실행됨..

 

사실 책의 예제에는 위와 같이 [[]] 형태로 2차원 배열로 선언이 되어 있었는데, 왜 그렇게 되어있는지 설명도 없고 해서, 나의 무지와 고집으로 ㅠ 1차원 배열로 선언을 했다가 결국 많은 길을 돌아왔다..

 

sklearn의 다른 알고리즘들도 동일한 형식을 가진 것들이 있는 것 같은데, 문제가 될 시 위와 같이 해결을 해보자..

 

 

정말 에러잡는다고, 시간이 두배는 걸리는 파이썬... 데이터 분석 공부..

갈 길이 멀다..

반응형

간혹 PC 환경에 따라, pip 를 최신버전으로 업그레이드 하기 위해, --upgrade 로 업그레이드를 하려다, Error가 발생하여, 정상적으로 pip 설치가 안되는 경우가 있다.

(대부분 폴더 권한 문제로 이와 같은 상황이 발생)

그럴 경우 다시 pip upgrade를 시도하면 아래와 같은 문구와 함께 정상 진행이 되지 않는다.

Error 문 :

Cannot open 경로\pip-script.py

 

이와 같은 경우, 간단히 pip 를 재설치 할 수 있는 방법이 있는데,

바로 

easy_install pip

command 이다.

아래와 같이 command 명처럼 정직하게... 쉽게 pip 최신버전으로 인스톨이 다시 진행되더라..

크게해서 보시오...

여튼 잘 고쳐져서 다행입니더...

 

 

반응형

파이썬으로 텍스트마이닝하려면, 한국인으로서는 많은 선택권이 없이 konlpy 패키지를 사용해야하는데,

konlpy package가 매우 짜증을 유발하게 하는 포인트가 많다.

 

Hannanum 같은 모듈을 사용하려는 데 import시 아래와 같은 에러가 난다면?

Error 문 : module compiled against API version 0xc but this version of numpy is 0xa

 

그러면 좌절하지말고 console 창에가서 numpy 패키지를 최신 버전으로 업그레이드 한다

pip install numpy --upgrade

(numpy 패키지가 없으면 pip install numpy 로 설치해준다..)

 

그러면 만사 해결!! 고민이 사라짐

반응형

파이썬 가지고 텍스트 마이닝 한번 해본다고, 끄적끄적 따라하다가, 

pip 로 패키지 설치하는 것 부터 낭패를 봐서, ㅋㅋㅋ 시작하자마자 포기할 뻔 함.

konlpy 패키지의 경우 R의 KoNLP와 같은 한글 텍스트 처리를 하는데 필수적인 패키지인데, 

R때도 그랬지만, 꼭 한글을 처리하는 패키지들은 Java기반으로 실행이 되면서 복잡한 설치 과정을 동반한다.

 

처음에는 그것도 모르고, anaconda prompt에서 냅다 pip install konlpy 했다가 ㅋㅋ 시뻘겋고 엄청 긴 에러문을 주르륵 대면하고 말았다.

그래서 python Konlpy package 설치 과정을 한번 정리해보면, 아래와 같다.

더 자세한 설명을 보고 싶으면, 아래 konlpy 공식 페이지에서 한번 체크를 해보자..

https://konlpy-ko.readthedocs.io/ko/v0.4.3/install/#id2

 

설치하기 — KoNLPy 0.4.3 documentation

주석 설치 및 사용 도중 문제가 발생하는 경우 다음 페이지들을 참고해주세요: 리눅스. 맥 OS. 윈도우. 발생한 문제가 어디에도 없는 경우 “New Issue” 버튼을 눌러 새로운 이슈를 생성해주시기 바랍니다. 각 머신 별 테스팅 로그는 이 곳 에서 보실 수 있습니다.

konlpy-ko.readthedocs.io

1. 우선 JDK를 설치해야한다. (1.7 version 이상.. 본인은 JAVA 9 SE를 사용... 뭐 버전은 1.7이상이면 다 가능한듯)

2. 설치한 JDK로 JAVA_HOME을 컴퓨터 환경변수에 잡는다.

   (이후 확인은 cmd창세ㅓ java -verion 같은 걸로 잘 잡혔는지 확인해본다. )

3. 위 Konlpy 공식 홈피에서 제공하는 link를 통해 Jpype를 다운받은 후 먼저 'pip install 파일명' 을 입력해서 설치를 한다.

 [주의 : python -V 명령을 통해 본인의 python version을 확인한 후 자신의 version과 컴퓨터환경(bit수)에  맞는 jpype 파일을 설치한다!

  - python version :  파일명 내 cpxx(숫자) 형태의 문구가 들어있는데 이것이 파일이 지원하는 python version이라고 생각하면된다. 예를들어  JPype1-0.7.0-cp35-cp35m-win_amd64.whl (cp35)의 경우 python 3.5x  이런식으로... 

 - 컴퓨터환경(32/64bit) : 파일명 맨뒤에 win32라고 되어있는것은 32bit amd64라고 되어있는 것은 64bit! 

   만약 이것을 지키지 않으면

   ERROR: JPype1-0.7.0-cp38-cp38-win_amd64.whl is not a supported wheel on this platform.  에러를 만남]

4. 3번까지가 완료되면 드디어 ! pip install konlpy 로 설치를 한다!

 

처음엔 저런 과정이 있는줄도 몰라 삽질을 했고, 그다음엔 저 3번 Jpype 설치하느라.. 애를 먹음..

 

여튼 모든것이다 잘 설치가 되면 아래와 같이 석세스풀리! 인스톨드가 떨어짐

 

 

 

반응형

아 주피터 노트북 쓰다가...

단축키 안쓰니 생산성 저하로 빡쳐서 찾아내어 포스팅

알고보니 Help 메뉴에 'Keyboard shortcuts' 선택하면 단축키를 볼 수 있다.

 

본인의 경우 아래 정도만 있어도 크게 쓰는데 문제가 없더라..

- 코드실행 : shift + Enter

- 에디트 모드로 변경 : Enter (왜 이걸 직관적으로 난 못 깨달았지?)

- Markdown으로 셀 변경 : m

- Code로 셀 변경 : c

- 셀 삭제 : d 두번

 

help 메뉴에서 캡처한 것도 첨부

 

 

반응형

ADP 실기만 두번떨어지고 세번째 도전이다.

첫번째 ADP 실기는, 뭐 어떻게 준비해야 하는지도 모르고,

가만히 넋놓고 있다가, 심지어 시험 전주 출장이 갑작스레 잡혀 출장다녀오자 마자 응시하고 망했던 기억이..

그러다 필기 자격이 만료되고 열받아서 다시 ADP 필기부터 응시, ... 합격후 작년 또 실기에 도전하여 아깝게 고배를 마셨다.

이후 모든 의욕이 떨어졌다가... 약 1년이 지나고서... 갑자기 삶의 의미를 찾다가 여기까지 이르렀다...

 

이번에 떨어지면 또 도전할만한, 정신적 여유와 인내심이 ㅋㅋㅋ 없어... 마지막 도전으로 종지부를 찍고자 한다.

그런데 또 마음과 열정만 앞서는 나는 이상한 승부욕을 불태운다..

기존에 계속 공부했던 R은 버리고, python으로 응시할 생각이다.

가뜩이나 ADP 자료는 인터넷상 매우 희소한 편인데, python으로 응시한 ADP는 정말 자료가 '전무' 하다.

이런 부분이 더 나의 마음을 뜨겁게 달궈서 (변태같이) 시험 준비를 해보고자 한다....

 

제발 좋은 결과로... 인터넷상에... Python ADP 실기의 좋은 사례를... 기록할 수 있었으면 좋겠다..

반응형

'혼잣말 > 혼자생각' 카테고리의 다른 글

코어 소리 영어를 시작 했다. (120일 장학금미션 완료 후기 추가)  (0) 2020.03.31
정신 없었던 11월...  (0) 2019.11.30
다시 블로그를 해보자.  (0) 2019.10.13
Trigon 폰 게임...  (0) 2019.01.09
공시생  (0) 2018.05.31

+ Recent posts