본문 바로가기

R programming

(4)
[R:04] 기초문법(함수) 01.aggregate 함수 aggregate: 데이터의 특정 컬럼을 기준으로 통계량을 구해주는 함수 문법:aggregate(계산될컬럼~기준될컬럼, 데이터 , 함수) > aggregate(Sales~Year,Fruits,sum) aggregate(Sales~Fruit,Fruits,sum) aggregate(Sales~Fruit,Fruits,max) aggregate(Sales~Fruit+Year,Fruits,max) fruits year name qty price 1 2000 apple 6 6000 2 2000 banana 2 1000 3 2000 peach 7 3500 4 2000 berry 9 900 5 2001 apple 10 10000 6 2001 banana 7 3500 7 2001 peach ..
[R:03] 비정형 데이터 분석 기초(WordCloud이용) install.packages("KoNLP") #형태소분석 라이브러리인 KoNLP(한글자연어처리패키지)를 설치 install.packages("wordcloud") #주어진 데이터를 WordCloud형태로 그리는 패키지 설치 Sys.setenv(JAVA HOME: \\Program Files\\Java\\jre1.8.0_211') #시스템 set environment install.packages("rJava") #라브러리 호출시 에러발생하는데, 에러없이 불러들이기 위해서 운영체제에 맞는 rJava설치 install.packages("KoNLP") library(KoNLP) useSejongDic()#세종 한글사전 로딩 txt
[R:02]R에서 사용하는 데이터 타입 01.R에서 사용하는 데이터 타입 자료 형태 구성차원 자료 유형 다른 형 데이터 공존여부 스칼라(scala) 단일 수치/문자/논리 불가 벡터(vector) 1차원 수치/문자/논리 불가 팩터(factor) 1차원 수치/문자 불가, 범주형 데이터 행렬(matrix) 2차원 수치/문자/논리 불가 데이터 프레임(data frame) 2차원(테이블형) 수치/문자/논리 가능 배열(array) 2차원 이상 수치/문자/논리 불가 리스트(list) 2차원 이상 수치/문자/논리 가능 *데이터 프레임: 엑셀과 같이 숫자, 문자 등 다양한 데이터를 하나의 테이블에 담을 수 있는 자료구조 *벡터(vector)와 팩터(factor)의 차이: factor는 vector형과 유사하지만 엄연히 다르다. 다름의 기준은 바로 factor..
[R:01]데이터의 개념 및 R다운로드 방법 [데이터의 개념] 데이터: 이론을 세우는 데 기초가 되는 사실이나 자료 01) 데이터의 정의 -프로그램을 운용할 수 있는 형태로 기호화 및 숫자화한 자료를 의미 -객관적사실 또는 추론이나 예측을 위한 근거의 역할 수행 02) 데이터의 유형 -정성적 데이터(Qualitative):언어나 문자로 표현된 데이터 ex) 페이스북에 올린글, 주관식 질문에 대한 답변, 바이러스의 감염 속도 증가 -정량적 데이터(Quantitave):수치, 도형, 기호로 표현된 데이터 ex)키, 몸무게, 날짜, 일조량 [R다운로드 방법] R-SDK(개발환경)다운: https://ftp.harukasan.org/CRAN/ R-studio다운: https://www.rstudio.com/ 이 위에 있는 두 사이트에 들어가셔서 두 프로그..