목록데이터분석 (4)
회계 밖 세상

데이터베이스에서 원하는 조건에 맞는 데이터만 골라내는 것은 데이터 분석의 첫 번째 단계입니다. 오늘은 실무에서 자주 사용되는 SQL 필터링 기법들을 살펴보겠습니다.기본 필터링: WHERE 절 활용가장 기본적인 데이터 필터링은 WHERE 절을 사용하는 것입니다. 예를 들어, 회계 데이터에서 특정 계정 코드만 추출하고 싶다면:SELECT * FROM financial_data_2024 WHERE account_code = 'A1001';이 쿼리는 financial_data_2024 테이블에서 계정 코드가 'A1001'인 모든 행을 반환합니다.데이터 개수 확인하기필터링된 결과가 얼마나 많은지 미리 확인하고 싶을 때는 COUNT() 함수를 사용합니다:SELECT COUNT(*) as total_records F..
매년 업데이트되는 데이터를 비교 분석하는 일은 다양한 업무 분야에서 자주 발생합니다. 매출 데이터, 고객 정보, 재고 현황, 직원 정보 등 시간에 따라 변화하는 모든 데이터에 적용할 수 있는 방법입니다. 오늘은 SQLite와 DB Browser를 활용해 2023년 vs 2024년 데이터 비교를 실무 예제로 정리해보겠습니다.1. 데이터 준비 및 테이블 구조 확인먼저 비교할 두 테이블의 구조를 파악해야 합니다. DB Browser에서 다음 명령어로 테이블 정보를 확인할 수 있습니다.PRAGMA table_info(data_2023);PRAGMA table_info(data_2024);이 명령어는 컬럼명, 자료형, NULL 허용 여부 등을 보여주어 두 테이블의 구조가 동일한지 확인할 수 있습니다.실무 팁: 테..
데이터 분석 작업을 하다 보면 여러 개의 CSV 파일을 하나로 합쳐야 하는 경우가 종종 있습니다. 특히 기업의 ERP 시스템에서 대용량 데이터를 여러 파일로 나누어 다운로드받은 경우, 이를 다시 하나로 합쳐야 분석 작업을 수월하게 진행할 수 있습니다. 이번 글에서는 파이썬의 pandas 라이브러리를 활용해 여러 CSV 파일을 효율적으로 병합하는 방법을 소개합니다.목차CSV 파일 합치는 방법 비교개별 변수 저장 방식으로 CSV 파일 합치기반복문을 활용한 CSV 파일 합치기통합 결과 검증 방법한국어 환경의 인코딩 문제 해결최종 코드 및 실행 결과1. CSV 파일 합치는 방법 비교여러 CSV 파일을 합치는 방법에는 크게 다음과 같은 방법들이 있습니다:pandas.concat() - 행 방향으로 여러 DataF..
데이터 분석이나 업무 자동화를 하다 보면 여러 개의 CSV 파일을 하나로 합쳐야 하는 상황이 자주 발생합니다. 이번 글에서는 CSV 파일을 합치는 두 가지 실용적인 방법을 소개해 드리려고 합니다.1. 파이썬 코드로 CSV 파일 합치기파이썬의 pandas 라이브러리를 사용하면 CSV 파일을 쉽게 합칠 수 있습니다. 이 방법은 다양한 옵션과 세부 조정이 가능하다는 장점이 있습니다.import pandas as pdfrom glob import glob# 폴더 내의 모든 csv파일 목록을 불러온다file_names = glob("data/*.csv")# 빈 데이터프레임 하나를 생성한다total = pd.DataFrame()# 방법 1: 파일을 하나씩 읽어서 합치기for file_name in file_name..