Data Science/Python
[Python] 대용량 데이터 처리 및 분석을 위한 PyArrow (Apache Arrow)
PyArrow란?인메모리 분석을 위한 개발 플랫폼인 Apache Arrow의 Python용 라이브러리이다. Apache Arrow는 빅 데이터 시스템이 데이터를 빠르게 처리하고 이동할 수 있도록 하는 일련의 기술이 포함되어 있다. 최신 하드웨어에서 효율적인 분석 작업을 위해 구성된 플랫 및 계층적 데이터에 대해 표준화된 언어 독립적 열 메모리 형식을 지원한다. 호환성PyArrow는 현재 Python 3.7, 3.8, 3.9 및 3.10과 호환됩니다. Windows, macOS 및 다양한 Linux 배포판(Ubuntu 16.04, Ubuntu 18.04 포함)에서 지원하고, 64비트 시스템을 권장합니다.설치pip install pyarrowWindows에서 핍 휠 가져오기 문제가 발생하면 Visual ..
2022. 2. 16. 03:06
최근댓글