본문 바로가기

코딩∙데이터분석🧑🏻‍💻12

[pandas] df.loc 함수로 열 조회하는 법 차이 ANOVA 다변량 분산분석을 위해 titanic 데이터를 feature 변수에 따라 나누던 중, 다른 방식으로 똑같이 데이터를 뽑아낼 수 있다는 걸 발견해서 loc에 대한 이해 겸 정리 남긴다. # 1번 방법 feature, target = 'Embarked', 'Fare' # ANOVA를 위해 데이터 분리 S = titanic.loc[titanic[feature] == 'S', target] C = titanic.loc[titanic[feature] == 'C', target] Q = titanic.loc[titanic[feature] == 'Q', target] # 2번 방법 S = titanic.loc[titanic[feature] == 'S'][target] C = titanic.loc[titan.. 2023. 8. 31.
[KT에이블스쿨] 1차 미니프로젝트 후기 이전글 : 2023.08.09 - [코딩∙데이터분석🧑🏻‍💻] - [KT AIVLE] 4기 에이블스쿨 DX컨설턴트 트랙 합격 후기 4기 DX트랙의 대망의 첫! 미니 프로젝트는 8월 24, 25일로 이틀 동안 진행되었다. (향후 일정을 보니 미프는 다 이틀씩 하는 듯 하다.) 왼쪽 트랙 일정만 보고 나는 미니프로젝트 2번 하고 빅프로젝트로 바로 넘어가는 줄 알았는데, 교육 일정을 보니 교육 단위가 끝날 때마다 미니프로젝트로 마무리를 해서 미프는 총 5-6번 정도 하고 빅프로젝트로 넘어가는 듯 했다! (다행이다) 미니프로젝트 뭐 별거 아니겠지? 하면서도 KT에서는 '미니'라는데 나에게는 '빅'프로젝트가 될까봐 조금 긴장?했던 것 같다. 또 3주간 매일 봐온 사람들이긴 하지만 우리반 사람들이랑 처음 만나는 날이.. 2023. 8. 29.
[KT AIVLE] 4기 에이블스쿨 DX컨설턴트 트랙 합격 후기 KT에서 하는 K-digital traiming 프로그램인 에이블스쿨에 지원을 했는데 어찌저찌 합격을 했다. 졸업을 앞두고 뭐할지 고민하다가 나한테 필요한 부분을 강화할 수 있는 프로그램이라서 간절한 마음으로 신청한 거긴 한데 또 막상 합격메일 받고 6개월 교육과정에 묶여있을 생각을 하니 하반기 인턴으로 시작해서 빨리 취업길부터 열어야했었나...싶은 간사한 생각도 들고 있다. 하지만 이미 등록완료하고 내일배움카드도 발급완료했는걸... DX컨설턴트 트랙으로 지원을 했다. 나는 IT전공자이긴 하지만 또 컴공은 아니고, 개발자는 나랑 맞지 않아서 데이터분석 공부하면서 내내 기획 직무를 생각하고 있어서 그렇게 했다. 마지막 학기에 데이터마이닝 공부를 하다보니 재미있어서 살짝 AI개발자 트랙이 욕심나긴 했는데.... 2023. 8. 9.
[웹크롤링] python selenium beautifulsoup 파싱한 html에 코드가 없을 때 / 데이터가 안나올 때 / 페이지 로딩 대기 / 페이지 대기 / 페이지 조작 역시나... 경데분 과제로 브랜드 하나를 골라서 매장 정보 크롤링하는 걸 하고 있는데, 적당한 사이트를 찾다가 빽다방으로 선택했다. 개발자 도구로 코드 확인해보니 html 코드도 딱 tbody > tr > td, td, td, ... 교과서 예제랑 거의 비슷하길래 딱이군! 했는데 역시 예제는 예제였던것...! 현실은 교과서처럼 아름답지 않고 -_- from bs4 import BeautifulSoup import urllib.request import pandas as pd from selenium.webdriver.support.select import Select URL = "https://paikdabang.com/store/" html = urllib.request.urlopen(URL) soup.. 2022. 11. 28.