본문 바로가기
코딩∙데이터분석🧑🏻‍💻

[선형대수 과제] 머신러닝 프로젝트 + 10장짜리 레포트

by 빕비빅 2020. 12. 4.

교수님... 그냥 절 죽이세오...

아 재이수하지말 걸... 본전도 못찾겠네ㅡㅡ

선형대수 시간에 배운 게 어찌 쓰인다는 말인지 하나도 모르겠는데,

일단 해보자. 좋은 프로젝트 경험 + 언제 소논문 영어로 하나 써보겠어!

 

그냥 끄적인 글이니까 훗날 저처럼 아무것도 모른채로 머신러닝의 세계에 내동댕이쳐지신 분들께서... 제가 어떻게 기획, 공부, 빌드업, 코딩하는지 봐주시면 감사드리겠습니다(꾸벅)

혹시 구글의 농간으로 이 작고 보잘 것 없는 문서를 보고 계신 머신러닝 전문가분께서 읽으신다면 오류났다/조언/잔소리/이거 이렇게 하는 거 아니다/이렇게 해봐라 뭐든 상관없으니 틀린 부분 이상한 부분 있으면 얼마든 지적해주세요 감사합니다


당면한 문제들

무슨 주제?!

아니 잠만 뭐 어떻게 하는데?

내 이 코딩 찌끄랭이가 구현할 수 있을까? 아 정신건강을 위해 그냥 생각하지 말자...

근데 구현하려면 뭐부터 공부해야 하지?

데이터셋은 뭐 써? 

에 10장짜리 영어로 레포트? 실화냐 일단 생각하지 말아보자


데이터셋은 뭐 써?

교수님께서 던져주신 사이트 : "kaggle competition"(https://www.kaggle.com/datasets), "data.gov"(data.gov)

 

Find Open Datasets and Machine Learning Projects | Kaggle

Download Open Datasets on 1000s of Projects + Share Projects on One Platform. Explore Popular Topics Like Government, Sports, Medicine, Fintech, Food, More. Flexible Data Ingestion.

www.kaggle.com

 

Data.gov

The home of the U.S. Government’s open data Here you will find data, tools, and resources to conduct research, develop web and mobile applications, design data visualizations, and more. For information regarding the Coronavirus/COVID-19, please visit Cor

www.data.gov

내가 찾은 것 : 머신러닝에 쓸만한 공공 데이터셋 찾을 수 있는 사이트들을 정리해둔 글이다.

 

Best Public Datasets for Machine Learning and Data Science

Best open-access datasets for machine learning, data science, sentiment analysis, computer vision, natural language processing (NLP)…

medium.com

관심 주제부터 찾아볼까

뭘 하고 싶은지는 잘 모르겠고 아 환경, 에너지, 교통 이런 문제는 내가 해결하고 싶지 않아... 라는 느낌으로 싫지 않은 데이터셋만 찾아보니 크롬에 열어둔 창만 오만오천개...

하나씩 읽어보니 또 문제점이 데이터셋 그래, 흥미로운 건 알겠어, 근데 내 머릿 속 아이디어들이 머신러닝으로 구현가능한지도 모르겠고, 구현 방식 어떤 걸 선택해야할지 모르겠는걸?

안되겠다 머신러닝 기본 이론과 구현기법/과정부터 보고 오자

2020/11/19 - [코딩 훈련🧑🏻‍💻] - [선형대수 과제] 머신러닝 기본 이론

 

[선형대수 과제] 머신러닝 기본 이론

지도학습/비지도학습 분류는 뭐고 회귀는 뭔데 그거 어떻게 하는 건데 이걸로 뭘 할 수 있을까 이걸 하려면 어떤 데이터가 필요할까

horkheimer8.tistory.com

조금 알아보고 든 생각

일단 비지도학습으로 가기로 했다 (+ 지도학습하기엔 어려울 듯. 클래스 데이터도 있어야하는데, 공공데이터에서 클래스 데이터로 쓸 걸 따로 뽑아내야하는데... 이 기준? 정하는 데서부터 우당탕하게 될 것 같아서 일단 다음 기회에...)

무에서 유(마구잡이 뒤죽박죽에서 클래스를 분류함)를 창조하는 느낌이기도 하고, 공공데이터 활용에는 이 방식이 좀 더 적용하기에 알맞은 것 같아서 비지도학습으로 결정 땅땅!  ㅗㅎ 

 

댓글