소연의_개발일지
article thumbnail
[Python] Pandas를 이용한 레고 데이터셋 분석
개발공부/Python 2023. 8. 20. 21:27

학습 내용 출처: 유데미 안젤라 파이썬 강의 배울 내용 판다스 데이터프레임에 파이썬 목록 슬라이싱 기술 적용 .agg() 함수를 사용하여 데이터를 집계하는 법 맷플롯립에서 두 개의 축이 있는 산점도, 막대 차트, 꺾은선형 차트를 만드는 법 기본키와 외래키로 구성된 데이터베이스 스키마를 이해 공통의 키를 공유하는 데이터프레임을 병합하는 법 개발환경 운영체제: Window OS, Window 10 개발언어: Python 3.11 개발 툴: Google Colab 추가 패키지: Matplotlib, pandas 사용 자료 데이터 분석 구글 콜랩에서 이미지 추가하는 방법 더보기 주피터에서 추가하는 방법 폴더에 있는 파일을 불러오면 판다스 가져오기 import pandas as pd matplotlib 글씨체 한..

article thumbnail
[Python] matplotlib로 시간 흐름에 따른 개발 언어 인기도 분석하기
개발공부/Python 2023. 8. 20. 15:54

오늘날 여전히 사용되는 가장 오래된 개발 언어는 1957년에 개발된 포트란이다. 이후로 그 외 많은 개발 언어가 발전 해왔다. 그런데 가장 인기있는 개발 언어는 무었일까? 이 질문에 대한 답은 스택오버플로우(Stack Overflow)에서 찾을 수 있다. 스택 오버플로우의 각 게시물은 태그가 함께 제시된다. 그리고 개발 언어 이름이 태그될 수 있다. 공부 소스 출처: 유데미 안젤라 Python 강의 개발환경 운영체제: Window OS, Window 10 개발언어: Python 3.11 개발 툴: Google Colab 추가 패키지: Matplotlib, pandas 사용 자료 데이터 분석 데이터 임포트 import pandas as pd 자료 가져오기 헤더 행을 0으로 설정하면 열 자체의 이름으로 대체..

article thumbnail
[Python] 구글 코랩(colab) seaborn, matplotlib 한글 깨짐 현상 해결방법
개발공부/Python 2023. 8. 20. 13:21

오늘은 구글 코랩을 사용하여 보스턴 집값을 예측해보는 시간을 가졌다. 구글 코랩에서 씨본 한국어 적용이 안되는 문제가 생김. 해결방법 1. 폰트 설치 코드 맨 위쪽에 다음과 같은 코드를 입력하고 실행한다. (나눔 폰트 설치) !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 설치가 진행된다. 2. 폰트 설정 matplotlib 라이브러리 임포트 하는 부분에서 다음과 같이 폰트를 설정해준다. import matplotlib.pyplot as plt plt.rc('font', family='NanumBarunGothic') plt.rcParams['axes.unicode_minus'] =False 나눔바름 고..

article thumbnail
[Python] 100명의 죄수 문제 matplotlib 그래프로 시각화하기
개발공부/Python 2023. 8. 18. 14:06

문제 상황 100명의 죄수가 있습니다. 각 죄수에게 0부터 99까지의 번호가 부여됩니다. 100개의 박스가 있으며, 각 박스 안에는 0부터 99까지의 번호 중 하나가 들어 있습니다. 각 번호는 한 번만 나옵니다. 각 죄수는 박스를 최대 50개까지 열 수 있습니다. 죄수가 자신의 번호를 찾으면 다음 죄수가 시도합니다. 만약 죄수가 50개의 박스를 열어도 자신의 번호를 찾지 못하면 실패로 간주됩니다. 전체 코드 # 랜덤 모듈 임포트 import random # 초기 변수 설정 n_prisoners = 100 # 죄수의 수 prisoners = list(range(n_prisoners)) # 0부터 99까지의 죄수 번호 리스트 boxes = [] # 박스의 내용 (초기화) failures = 0 # 실패한 횟..

article thumbnail
[Python] 로지스틱 회귀(LogisticRegression) 이용하여 붓꽃 데이터 분석

개발 환경 정리 운영체제: Windows OS 프로그래밍 언어: Python 개발 툴: Jupyter Lab 데이터 시각화: matplotlib, seaborn 데이터 처리: pandas, numpy 머신러닝 프레임워크: scikit-learn 필요한 모듈 / 라이브러리 import In [1]: # 라이브러리 import import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 데이터 가져오기 df = pd.read_csv('../data/iris/iris.csv') df.head() Out[1]: Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWid..

article thumbnail
[Python] 선형 회귀(Linear Regression) 이용하여 보스턴 하우스 집값 예측하기

개발 환경 정리 운영체제: Windows OS 프로그래밍 언어: Python 개발 툴: Jupyter Lab 데이터 시각화: matplotlib, seaborn 데이터 처리: pandas, numpy 머신러닝 프레임워크: scikit-learn 자료 보스턴 하우스 데이터: 이 데이터셋은 StatLib 라이브러리에서 가져온 것이며 카네기 멜론 대학교에서 관리하고 있다. 이 데이터셋은 보스턴 시의 주택 가격에 관한 것이다. 제공된 데이터셋에는 13개의 특성을 가진 506개의 인스턴스가 있다. 데이터셋의 설명은 아래 표와 같다. **참고: 원래는 보스턴 데이터는 사이킷런 모듈에서 아래처럼 임포트가 가능했으나, 윤리적 문제 때문에 삭제되었다. from sklearn.datasets import load_bost..

article thumbnail
[Python] sklearn 모듈 KNeighborsClassifier 알고리즘으로 도미, 빙어 구분하기

자료 # 도미 생선의 길이 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] # 도미생선의 무게 bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610...

article thumbnail
[Python] 소상공인시장진흥공단 광주 상가 정보 시각화해보기
개발공부/Python 2023. 8. 8. 20:48

개발환경 주피터, python 목적 광주광역시 올리브영 입점 추천 프로그램을 만들던 중 seaborn과 matplotlib로 화장품 매장들을 시각화 해보기 위함 자료 출처 공공데이터포탈 - 소상공인시장진흥공단_상가(상권)정보 이 자료 중 소상공인시장진흥공단_상가(상권)정보_광주_202306.csv 를 사용하였다. https://www.data.go.kr/dataset/15012005/fileData.do 자료 import import pandas as pd import seaborn as sns import matplotlib as plt df = pd.read_csv('소상공인시장진흥공단_상가(상권)정보_광주_202306.csv', low_memory=False) # DtypeWarning: Colum..

[PostgreSQL] pandas로 DB 접근해 테이블 불러오기
개발공부/SQL & DB 2023. 8. 8. 19:29

필요 모듈 import pandas as pd import matplotlib.pyplot as plt from sqlalchemy import create_engine 없다면 콘솔창에서 설치하거나 인터프리터 설정에서 추가해 준다. 설치 명령어 ''' 설치해야함 pip install sqlalchemy psycopg2 pip install pandas pip install matplotlib ''' 예시 코드 import pandas as pd import matplotlib.pyplot as plt from sqlalchemy import create_engine # PostgreSQL과 연결 DATABASE_URL = "postgresql+psycopg2://postgres:1234@10.10.20...

article thumbnail
[postgreSQL] pgAdmin으로 CSV 파일 import 해 오기
개발공부/SQL & DB 2023. 8. 5. 01:28

전제조건: csv 파일이 데이터로 존재해야 함. 광주 구/법정동/행정동 있는 데이터를 준비해서 postgreSQL 에 넣어보려고 한다. 1. CSV 파일 준비 데이터 출처: 행정표준코드관리시스템 https://www.code.go.kr/index.do 행정표준코드 관리시스템 www.code.go.kr 구글 스프레드시트에서 작업한 파일을 파일-다운로드-쉼표로 구분된 값(CSV) 파일로 다운받았다. 만약 XLSX파일이나 XLS 파일이 있다면, 파일 형식을 CSV로 바꿔서 내보내기 하면 된다. 2. 테이블 생성 테이블을 쿼리문을 통해 생성 CREATE TABLE "TB_DONG" ( "DONG_ID" INTEGER GENERATED BY DEFAULT AS IDENTITY PRIMARY KEY, "GU_NAM..