본문 바로가기

데이터분석기초4

[KT에이블스쿨] 2차 미니프로젝트 후기 - 데이터 분석 이전글 : 2023.08.29 - [코딩∙데이터분석🧑🏻‍💻/KT에이블스쿨_DX트랙] - [KT에이블스쿨] 1차 미니프로젝트 후기 8/24-8/25 이틀 동안 진행되었던 1차 미니프로젝트는 벌써 과거의 기억 속으로 사라지고 [KT에이블스쿨] 1차 미니프로젝트 후기 이전글 : 2023.08.09 - [코딩∙데이터분석🧑🏻‍💻] - [KT AIVLE] 4기 에이블스쿨 DX컨설턴트 트랙 합격 후기 4기 DX트랙의 대망의 첫! 미니 프로젝트는 8월 24, 25일로 이틀 동안 진행되었다. (향후 일정 horkheimer8.tistory.com 데이터분석, 데이터수집 강의 후기 그 동안 우리는 데이터 분석, 데이터 수집(웹크롤링)을 순식간에 다 떼고, 2차 미니프로젝트를 시작하게 되었다. 잠깐 뭘 배웠는지 복기하고 넘.. 2023. 9. 26.
[Python] Warnings.filterwarnings로 경고문 안보이게 하기 / 경고문 설정하기 코드 작성하다 보면 별건 아니지만 빨간 경고창이 나타나서 우리의 가슴을 두근거리게 할 때가 있다. 에러도 아니면서 왜 빨간색으로 나를 설레게 한담 참나 경고창은 대게 크-게 눈여겨 볼만한 것은 잘 없고(내가 무지할 수도 내가 무지렁이일 수도), 내가 자주 보는 경고문은 보통 "너가 쓰는 이 패키지 이 클래스 우리 다음 버전부터는 버리고 갈꺼다? 그때 코드 오류 나도 우린 모른다?" 뭐 대충 이런 느낌의 경고문이 대부분이다(정식 명칭은 DeprecationWarning). 그렇다면 이 눈에 거슬리는 빨간 창을 안보고 싶을 땐 어떻게 할까? 고맙게도 파이썬에는 경고문을 제어할 수 있는 Warnings 모듈이 있다. import warnings warnings.filterwarnings(action='igno.. 2023. 9. 14.
CRISP-DM 분석방법론 CRoss Industry Standard Process for Data Mining. 해서 CRISP-DM. 어떤 산업에도 적용가능한, 데이터마이닝 표준 방법론이다. 앞으로 데이터분석 공부하면서 지겹도록 볼 거다! 실습하면서도 계속 이 구조대로 코드를 짜는 연습을 하고 있다. CRISP-DM에 대해 글을 쓸까 하다가 넘 자세하게 잘 적어주신 글들이 많아서 참조 글만 붙이고 이만 총총... 전통적 데이터분석 방법론: KDD, CRISP-DM - 투이컨설팅 정보의 홍수라는 말로 표현하기에 무색할 만큼 대용량의 데이터가 축적되고 있다. 이전에 활용되었던 정형데이터의 양이 어마어마하게 증가했음은 물론, 비정형데이터를 활용할 수 있는 방법 www.2e.co.kr 데이터마이닝(Data Mining) 수행 방법론 .. 2023. 9. 14.
[pandas] df.loc 함수로 열 조회하는 법 차이 ANOVA 다변량 분산분석을 위해 titanic 데이터를 feature 변수에 따라 나누던 중, 다른 방식으로 똑같이 데이터를 뽑아낼 수 있다는 걸 발견해서 loc에 대한 이해 겸 정리 남긴다. # 1번 방법 feature, target = 'Embarked', 'Fare' # ANOVA를 위해 데이터 분리 S = titanic.loc[titanic[feature] == 'S', target] C = titanic.loc[titanic[feature] == 'C', target] Q = titanic.loc[titanic[feature] == 'Q', target] # 2번 방법 S = titanic.loc[titanic[feature] == 'S'][target] C = titanic.loc[titan.. 2023. 8. 31.