일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 원데이클래스
- 우리가빛의속도로갈수없다면
- 다이어트는내일부터
- 오블완
- 양주카페
- 이북리더기
- 의정부카페
- 마켓컬리
- 키보드케이스
- 씨유마카롱
- 티스토리챌린지
- 예스24북클럽
- 빅데이터
- 예스24
- 빅데이터청년인재
- 다니엘루틴
- r
- 간헐적단식
- 일상
- 아이패드키보드
- 편의점
- 영화
- 편의점디저트
- 북클러버
- 북클럽
- 독서
- 다이어트습관
- 편의점마카롱
- 쫀득한마카롱
- 어드밴트캘린더
- Today
- Total
목록교육/빅데이터 청년인재_경희대 R (16)
저장소
###텍스트마이닝 기본 함수 letters[3]LETTERS[3]lettersletters[1:12]LETTERS[2:15] ##소문자 대문자 전환tolower('KOREA')toupper('korea') ##바이트 세주는 함스 nchar nchar('korea')length('korea') nchar('한국')length('한국') nchar('한국',type = 'bytes') ##substr 문자열 추출(중요!!)substr('BigDataAnalysis', start=4, stop=7)substr('BigDataAnalysis', 4,7) country
앙상블_시계열, 배깅(bagging), 부스팅(boosting), 랜덤포레스트(randomForest)###시계열 예측 이해와 활용 str(AirPassengers) AirPassengers plot(AirPassengers) apts
install.packages('arulesViz')library(arulesViz)data('Groceries')summary(Groceries)head(Groceries) #트랜젝션 데이터라 바로 볼 수X 데이터프레임 변환 필요. gro=as(Groceries,'data.frame') ##R연관규칙 생성 및 주요 규칙확인rules=apriori(Groceries,parameter=list(support=0.001,confidence=0.5))#apriori가 A살 때 B산다는 규칙을 만들어주는 함수 rulesinspect(head(sort(rules,by='lift'),3)) #lift값으로 정렬해서 상위 3개 확인 inspect(head(sort(rules,by='lift'),5)) plot(rul..
###상관분석_무방향성 데이터분석 cor(iris$Sepal.Width,iris$Sepal.Length) auto=read.csv('autoparts.csv')auto1=auto[auto$prod_no=='90784-76001',c(2:11)]auto2=auto1[auto1$c_thickness32]=2auto3$flag[auto3$c_thickness32]=2auto4$flag[auto4$c_thickness
###의사결정나무auto=read.csv('autoparts.csv')auto1=auto[auto$prod_no=='90784-76001',c(2:11)]auto2=auto1[auto1$c_thickness
###지도학습 알고리즘 ##서포트 벡터 머신auto=read.csv('autoparts.csv',header=T)auto1=auto[auto$prod_no=='90784-76001',c(2:11)]auto2=auto1[auto1$c_thickness
###회귀분석 - 추정(결과변수가 연속변수일 경우)에 활용하는 대표적인 분석방법##단순회귀분석과 다중회귀분석,로지스틱회지분석 ##전처리auto=read.csv('autoparts.csv')dim(auto)is.na(auto)complete.cases(auto)auto[!complete.cases(auto),]head(auto)auto1=auto[auto$prod_no=='90784-76001',c(2:11)]head(auto1) summary(auto1)boxplot(auto1)boxplot(auto1$separation)auto2=auto1[auto$c_thickness
#변수 다 제거(메모리 삭제) rm(list=ls()) ###EDA탐색적 데이터 분석 autoparts=read.csv('autoparts.csv')head(autoparts)head(autoparts,10) autoparts1=autoparts[autoparts$prod_no=='90784-76001',c(2:11)]dim(autoparts1) autoparts1[!complete.cases(autoparts1),] #채워져있지 않은 것이 있냐고 묻는 것, 결측치가 없다고 나옴autoparts1[is.na(autoparts1),] ##기초통계량 summarysummary(autoparts1) ##데이터분포 boxplotboxplot(autoparts1)boxplot(autoparts1$separatio..