본문 바로가기
반응형

pandas6

Pandas 정렬 고급편: 다중 조건 정렬과 GroupBy 후 정렬 완전 정복 Pandas 정렬 고급편: 다중 조건 정렬과 GroupBy 후 정렬 완전 정복Pandas는 데이터 분석에서 가장 널리 사용되는 도구입니다. 그만큼 "정렬" 또한 강력하고 유연한 기능을 제공합니다.특히 실무에서는 하나의 조건만이 아니라, 여러 조건으로 정렬하거나 groupby로 묶은 후 정렬해야 하는 경우가 매우 많습니다. 이번 글에서는 Pandas의 다중 조건 정렬과 groupby 후 정렬을 예제 중심으로 완벽하게 설명합니다.✅ 1. 다중 조건 정렬 (sort_values + by 리스트)Pandas에서 여러 조건으로 정렬하려면 sort_values()의 by에 리스트 형태로 컬럼을 넣어주면 됩니다.📌 예제 데이터import pandas as pddf = pd.DataFrame({ 'name': .. 2025. 5. 3.
파이썬 리스트 vs Pandas vs NumPy 정렬 성능 비교 파이썬 리스트 vs Pandas vs NumPy 정렬 성능 비교파이썬에서 데이터를 다룰 때, 단순한 list를 사용할지,혹은 고성능을 자랑하는 Pandas와 NumPy를 사용할지 고민해보신 적 있나요?이번 글에서는 기본 리스트 정렬, Pandas 정렬, NumPy 정렬을실제로 동일한 조건에서 벤치마크하여 어떤 상황에 어떤 도구가 유리한지 살펴봅니다.✅ 비교 대상 요약 라이브러리 정렬 함수 특징 파이썬 기본 리스트sorted() / list.sort()순수 파이썬, 유연하지만 느릴 수 있음NumPynp.sort()빠르고 메모리 효율적, C기반Pandasdf.sort_values()편리한 기능 제공, 오버헤드 있음✅ 테스트 환경Python 3.11NumPy 1.26+Pandas 2.2+데이터 크기: 1,.. 2025. 4. 26.
파이썬으로 다양한 형태의 표 만들기: 가로표, 세로표 (PrettyTable, Pandas, HTML) 파이썬으로 다양한 형태의 표 만들기: 가로표, 세로표 (PrettyTable, Pandas, HTML)Python에서는 여러 가지 방법으로 가로표, 세로표, 텍스트 기반 표, HTML 표 등을 만들 수 있으며, 각 방법마다 장단점이 존재합니다. 이번 글에서는 초보자를 위한 표 만들기 가이드를 제공하며, 다양한 형태의 표를 만드는 방법과 추가 기능을 설명하겠습니다.🔹 1. 초급자: 기본 리스트와 딕셔너리를 활용한 표 만들기✅ 방법 1: 리스트로 가로표 만들기# 리스트를 사용하여 가로표 만들기table = [ ["이름", "나이", "직업"], ["홍길동", 27, "엔지니어"], ["강감찬", 34, "마케팅"], ["이순신", 40, "군인"]]# 표 출력for row in tab.. 2025. 3. 14.
파이썬으로 데이터 테이블 만들기: (리스트, 딕셔너리, pandas, sqlite) 파이썬으로 데이터 테이블 만들기: (리스트, 딕셔너리, pandas, sqlite)데이터를 다루다 보면 테이블 형태로 정리하여 출력하는 경우가 많습니다. Python에서는 여러 가지 방법으로 데이터 테이블을 생성 및 관리할 수 있으며, 초급자부터 숙련자까지 사용할 수 있는 다양한 라이브러리가 존재합니다. 이번 글에서는 Python에서 테이블을 만드는 방법을 소개합니다.🔹 파이썬에서 데이터 테이블을 만드는 방법파이썬에서 데이터 테이블을 만들 수 있는 대표적인 방법은 다음과 같습니다. 방법 주요 라이브러리 특징 기본 리스트와 딕셔너리list, dict기본 내장 기능으로 간단한 테이블 표현 가능PrettyTableprettytable터미널에서 보기 좋은 텍스트 기반 테이블Pandas DataFramepa.. 2025. 3. 14.
CSV 파일 크기 문제 해결 방법: 초급, 중급, 고급 단계별 가이드 CSV 파일 크기 문제 해결 방법: 초급, 중급, 고급 단계별 가이드CSV 파일은 데이터를 저장하고 교환하는 데 널리 사용되지만, 파일 크기가 커지면 성능 문제가 발생할 수 있습니다. 초급, 중급, 고급자의 접근 방식을 단계별로 살펴보고, 각 기술 스택의 기본 개념과 장단점을 정리해 보겠습니다.🔹 초급자: 기본적인 CSV 압축 및 최적화✅ 해결 방법 1: CSV 압축하여 저장하기 (ZIP, GZIP)🔹 기술 스택: zip, gzip, tar📌 기본 개념CSV 파일은 텍스트 기반이므로 압축하면 저장 공간을 절약할 수 있습니다. zip과 gzip을 사용하면 손쉽게 압축할 수 있으며, gzip은 CSV를 읽을 때도 압축된 상태로 처리할 수 있어 유용합니다.💡 예제 코드 (Python)import gzi.. 2025. 3. 13.
소프트웨어별 CSV 최대 줄(Row) 수 제한 : excel, XLSX, Google Sheets, MySQL 소프트웨어별 CSV 최대 줄(Row) 수 제한 : excel, XLSX, Google Sheets, MySQL 소프트웨어별 CSV 파일의 최대 줄(Row) 수 제한은 각 프로그램 및 라이브러리의 메모리 할당 방식과 32비트/64비트 환경에 따라 다릅니다. 주요 소프트웨어 및 라이브러리의 CSV 처리 한계를 정리하면 다음과 같습니다.📌 소프트웨어별 CSV 최대 줄(Row) 수 제한 소프트웨어/라이브러리 최대 줄 수 제한 설명 Microsoft Excel (XLSX)1,048,576 줄한 워크시트에서 열 수 있는 최대 행 수 (XLSX 기준)Microsoft Excel (CSV 열기)약 1,048,576 줄메모리 한계에 따라 다를 수 있음Google Sheets10,000,000 셀예를 들어 10개 열이.. 2025. 3. 12.
반응형