파이썬과 R 7강
데이터 타입
list [ ]
Tuple ( ) : 고칠수가 없음 수정이 불가함
Dictionary { K : V }
Set : 집합 - list와 달리 중복과 순서가 없음 { }
s1 = {1,2,3,4,5}
s2 = {2,4,6}
Set의 교집합, 합집합, 차집합을 구할 수 있음
교집합 : print(s1.intersection(s2)) # {2, 4}
합집합 : print(s1.union(s2)) #{1,2,3,4,5,6}
차집합 : print(s1.difference(s2)) #{1,3,5}
Exception handling : 예외처리
try:
dct[key]
except:
print("Key %s is missing. Add it with empty value" % key)
dct[key] = []
# dct라는 dictionary에서 key 변수에 있는 값을 찾는데 만약에 없을 경우 exception이 발생할 경우에는 except으로 가서.. print해주고 dict[key]를 []로 넣어줘라 라는 것
함수는 def로 선언하면 됨.
def test_function():
print("This is test_function')
def power_this(x, power=2):
return x ** power
#위의 함수는 호출할때 매개변수를 하나만 넘겨주면 그 하나는 x에 대입되고 power는 default 2가 들어가는 것임. 매개변수를 2개 넘겨주면 둘 다 값이 들어가는 것 같음
lambda 함수 36분
->간단한 함수를 쓴거라고 생각하면 됨
텍스트 파일 읽을때 pandas 라이브러리를 이용함..
엑셀파일 읽을때 사용하는 함수 pd.read_excel(~~)
결측치 처리는 7강 pdf파일에 참고 Missing values in Python 부분 읽고 기억하기!!
999라고 입력값이 있으면 Missing value 으로 간주됨 -> numpy library 사용
bmi4.weight = bmi4.weight.replace(999, np.NaN)
bmi4.dropna(inplace=True)
이렇게 써주면 결측치의 행을 없애준다.
자세한 내용은 pdf파일 28p에 참고사이트의 링크를 타고 들어가서 공부하도록..
뒤에 Numpy와 Pandas에 관한것도 교수님이 정리해주신거라고 말씀하시면서 설명은 안해주시고 각자 공부하라고 하셨음.
사이트 링크 달아놓은것들은 설명이 잘되어있어서 달아놓은거니까 사이트에 들어가서 보라고 하심.
'대학교' 카테고리의 다른 글
[데이터과학개론] 데이터의 기초개념 - 데이터, 정보, 지식 (0) | 2022.11.27 |
---|---|
[데이터과학개론] Git Bash 사용법 (0) | 2022.11.13 |
[파이썬과 R] 파이썬과 R을 이용한 자료입력 및 출력 (0) | 2022.09.25 |
[파이썬과 R] 파이썬과 R 구조적 프로그래밍 (0) | 2022.09.25 |
[파이썬과 R] 파이썬 아나콘다, 스파이더, 주피터 노트북, 콜랩 (0) | 2022.08.20 |