CS/DB

· CS/DB
2에서 뽑아낸 이 train data에서 33개 family 의 date 별 평균값을 뽑아내서 y값에 둔다 가게 위치, 품목은 신경쓰지 않고 그냥 팔린 갯수만 확인하는거다. 그럴 경우 우상향 그래프를 확인할 수 있다. dp의 시간축을 average sale 에서 끌어오고, X축과 미래 90일을 설정해본다. 그 후 회귀분석 모델을 가져와 X, y 로 학습한다. 그러면 학습된 model을 y_pred 로 확인할 수 있고, 이를 통해서 미래 90일을 y_fore 로 확인할 수 있다. 이를 시각화해보면 파란선은 학습된 모델, 회색선은 예상치인것을 확인할 수 있다. degree 를 늘릴수록 파랑선이 휘는것을 확인할 수 있는데, 너무 곧게도 아니고, 너무 휘게도(과적합) 아니게 하는 것이 regression 의 포..
· CS/DB
난 미래의 판매량을 예측해야하는데 보기가 거지같다. date 도 중복되어있고 store_nbr, family 도 중복되어있다. 이럴때 보기 쉽기 위해선 중복을 병합하는 방법을 써야한다. 우선 date 별로 보기 위해선 date 를 상위 index 로 끌어내야한다. 이걸 좀만 더 분석해보면 train data의 정보를 알 수 있는데 우선 1684일동안의 데이터를 나타낸 것이며 store_nbr는 총 54개가 있고 각 store 별로 33개의 물품이 있다. 모든 store 에서는 동일한 33개의 물품을 팔고 있는 모양이다. 기본적인 데이터 분석이 끝났으니 다음엔 본격적인 training 을 해보겠다.
· CS/DB
csv 데이터를 보면,, 이걸 어떻게 확인하지라는 생각이 든다. 뉴비에게는 확인하는법도 어려웠따... 우선 open notebook 을 한다음에 자신이 원하는 프로젝트를 여기서 찾아야한다 이를테면 이런식으로 키워드를 치면 금방 원하는 것을 찾을 수 있고, 열어서 데이터를 오른쪽에 업로드해둬야 한다. 찾은 데이터를 copy file path 한 후 이런식으로 바꿔두면 pandas 혹은 csv 로 분석할 데이터를 확인하는게 가능하다 1. import CSV 로 확인 우선 pandas 보다 조금 불편한 csv 로 확인하는것부터 보면 우선 import 부터 해준 후에 이렇게 for 문을 통해서 데이터를 확인해도 되고 이렇게 list 로 감싸서 2차원 list 로 데이터를 만져도 된다 2. pandas 로 확인 ..
· CS/DB
본 글은 생활코딩님 강의의 리뷰입니다! First normalization 제 1 정규화의 핵심은, atomic columns, 한 표에는 한 항목만 들어갈 수 있다. 입니다. 왜냐구요? query 문을 칠 때, WHERE = 'tag' 일 경우, 한 행 안에 'tag, RGB' 가 들어가있는 것은 찾을 수 없습니다.... 한 행 안에는 한 항목만 들어있어야 query 문으로 찾을 수 있지요! M대 N 관계, 즉 다대다 관계에서 어떻게 처리가 되는지 확인함과 동시에 표가 어떻게 처리되는지 확인해 봅시다 일단 ER 다이어그램 상에서 다대다 관계가 어떻게 처리되는지 확인해 봅시다. 저자와 글이 이렇게 다대다 관계로 엮여 있는 경우를 생각해 봅시다. 이런 경우, atomicity 를 확보하기 위해 취해야하는 ..
· CS/DB
DB 강의를 들을 때는 너무 추상적이었는데, 갓고잉님의 실제 서비스와 엮은 강의를 들으니 조금 더 명확해지는 것 같았다. 웹페이지와 entity, attribute, relationship 을 대응해서 배우니 명확해진건 맞지만, entity 와 attribute 가 어떤 관계를 가질까 라는 의문이 들었다. 내가 생각한 그 둘의 본질은 이렇다 entity 데이터의 큰 덩어리. 사용자가 직접 만들어내는 것 혹은 사용자의 신윈 같은 것이 될 수 있음. attribute 데이터의 작은 덩어리. 사용자가 부가적으로 만들어내는 것 혹은 entity를 식별하기 위한 고유한 ID 같은 것이 이에 해당한다.
· CS/DB
foreign key, primary key, candidate key 는 DB 수업을 들었지만 계속해서 헷갈리는 부분이었다. 내가 본질을 잘 꿰차고 있지 못해서 발생하는 일이 아닐까 라는 생각이 들었다. 갓활코딩님의 강의를 듣고 다시 정리한 각 단어의 의미를 다음과 같은 것 같았다. foreign key 이는 '관계' 를 표현한다. ER 다이어그램 상에서는 relationship 즉 관계로 표현이 되고 마름모로 나타나진다. foreign key 는 종속 관계의 entity 에서 활용이 많이 되는데, 혼자서도 독자적으로 존재할 수 있는 entity(부모) 의 경우 primary key 를 갖게 하고, 부모에게 종속되어 존재하는 entity(자식) 의 경우 foreign key 를 부여해야 한다. 예를 들..
· CS/DB
본 글은 생활코딩의 관계형 데이터 모델링 강의를 리뷰한 글입니다. 대학 강의에서 DB 과목때 배운 ER 다이어그램이 실제로 어떻게 사용되는지 보았다. 실제 웹 서비스와 대응하여 배웠더니 훨씬 재밌었다. Egoing님 대박... 역시 티칭에 진심이신분... draw.io 서비스도 정말 대박인것 같다. ER 정말 직관적으로 그릴 수 있게 되어있다. https://app.diagrams.net/ Flowchart Maker & Online Diagram Software Flowchart Maker and Online Diagram Software diagrams.net (formerly draw.io) is free online diagram software. You can use it as a flowcha..
yeonlee
'CS/DB' 카테고리의 글 목록