본문 바로가기

분류 전체보기76

CRISP-DM 분석방법론 CRoss Industry Standard Process for Data Mining. 해서 CRISP-DM. 어떤 산업에도 적용가능한, 데이터마이닝 표준 방법론이다. 앞으로 데이터분석 공부하면서 지겹도록 볼 거다! 실습하면서도 계속 이 구조대로 코드를 짜는 연습을 하고 있다. CRISP-DM에 대해 글을 쓸까 하다가 넘 자세하게 잘 적어주신 글들이 많아서 참조 글만 붙이고 이만 총총... 전통적 데이터분석 방법론: KDD, CRISP-DM - 투이컨설팅 정보의 홍수라는 말로 표현하기에 무색할 만큼 대용량의 데이터가 축적되고 있다. 이전에 활용되었던 정형데이터의 양이 어마어마하게 증가했음은 물론, 비정형데이터를 활용할 수 있는 방법 www.2e.co.kr 데이터마이닝(Data Mining) 수행 방법론 .. 2023. 9. 14.
[pandas] df.loc 함수로 열 조회하는 법 차이 ANOVA 다변량 분산분석을 위해 titanic 데이터를 feature 변수에 따라 나누던 중, 다른 방식으로 똑같이 데이터를 뽑아낼 수 있다는 걸 발견해서 loc에 대한 이해 겸 정리 남긴다. # 1번 방법 feature, target = 'Embarked', 'Fare' # ANOVA를 위해 데이터 분리 S = titanic.loc[titanic[feature] == 'S', target] C = titanic.loc[titanic[feature] == 'C', target] Q = titanic.loc[titanic[feature] == 'Q', target] # 2번 방법 S = titanic.loc[titanic[feature] == 'S'][target] C = titanic.loc[titan.. 2023. 8. 31.
[KT에이블스쿨] 1차 미니프로젝트 후기 이전글 : 2023.08.09 - [코딩∙데이터분석🧑🏻‍💻] - [KT AIVLE] 4기 에이블스쿨 DX컨설턴트 트랙 합격 후기 4기 DX트랙의 대망의 첫! 미니 프로젝트는 8월 24, 25일로 이틀 동안 진행되었다. (향후 일정을 보니 미프는 다 이틀씩 하는 듯 하다.) 왼쪽 트랙 일정만 보고 나는 미니프로젝트 2번 하고 빅프로젝트로 바로 넘어가는 줄 알았는데, 교육 일정을 보니 교육 단위가 끝날 때마다 미니프로젝트로 마무리를 해서 미프는 총 5-6번 정도 하고 빅프로젝트로 넘어가는 듯 했다! (다행이다) 미니프로젝트 뭐 별거 아니겠지? 하면서도 KT에서는 '미니'라는데 나에게는 '빅'프로젝트가 될까봐 조금 긴장?했던 것 같다. 또 3주간 매일 봐온 사람들이긴 하지만 우리반 사람들이랑 처음 만나는 날이.. 2023. 8. 29.
[KT AIVLE] 4기 에이블스쿨 DX컨설턴트 트랙 합격 후기 KT에서 하는 K-digital traiming 프로그램인 에이블스쿨에 지원을 했는데 어찌저찌 합격을 했다. 졸업을 앞두고 뭐할지 고민하다가 나한테 필요한 부분을 강화할 수 있는 프로그램이라서 간절한 마음으로 신청한 거긴 한데 또 막상 합격메일 받고 6개월 교육과정에 묶여있을 생각을 하니 하반기 인턴으로 시작해서 빨리 취업길부터 열어야했었나...싶은 간사한 생각도 들고 있다. 하지만 이미 등록완료하고 내일배움카드도 발급완료했는걸... DX컨설턴트 트랙으로 지원을 했다. 나는 IT전공자이긴 하지만 또 컴공은 아니고, 개발자는 나랑 맞지 않아서 데이터분석 공부하면서 내내 기획 직무를 생각하고 있어서 그렇게 했다. 마지막 학기에 데이터마이닝 공부를 하다보니 재미있어서 살짝 AI개발자 트랙이 욕심나긴 했는데.... 2023. 8. 9.