대규모 데이터 세트를 위한 알고리즘과 데이터 구조
-
- 28,99 €
-
- 28,99 €
Beschreibung des Verlags
확률 및 디스크 기반 데이터 구조 및 알고리즘에 대한 액세스 가능하고 아름답게 설명된 소개입니다.
Marcus Young, Prosper Marketplace
최신 데이터 세트가 방대해지면서 기존의 데이터 구조와 알고리즘은 한계에 도달했습니다. 이 재미있고 실용적인 가이드에서는 대규모 분산 데이터 집합도 안정적으로 처리할 수 있는 최신 기술을 소개합니다.
대규모 데이터 세트를 위한 알고리즘 및 데이터 구조에서는 다음에 대해 안내합니다.
실제 문제에 대한 확률론적 스케치 데이터 구조
애플리케이션에 적합한 데이터베이스 엔진 선택
효율적인 온디스크 데이터 구조 및 알고리즘 평가 및 설계
대규모 시스템과 관련된 알고리즘 트레이드 오프 이해하기
스트리밍 데이터에서 기본 통계 도출
스트리밍 데이터를 올바르게 샘플링
제한된 공간 리소스로 백분위수 계산
대규모 데이터 세트를 위한 알고리즘 및 데이터 구조는 최신 빅 데이터 애플리케이션을 처리하는 데 완벽한 새로운 방법의 도구 상자를 보여줍니다. Google, Facebook 및 진정으로 방대한 양의 데이터로 작동하는 기타 엔터프라이즈 애플리케이션을 뒷받침하는 새로운 데이터 구조 및 알고리즘을 탐색합니다. 이러한 효과적인 기술은 금융에서 텍스트 분석에 이르기까지 모든 분야에 적용할 수 있습니다. 그래픽, 일러스트레이션 및 실습 업계 사례를 통해 복잡한 아이디어를 프로젝트에 실용적으로 구현할 수 있으며 수수께끼로 풀 수 있는 수학적 증명이 없습니다. 이 독특한 가이드를 따라 작업하면 데이터의 정확성을 유지하면서 공간을 절약할 수 있는 최적의 지점을 찾을 수 있습니다.
기술에 대해
표준 알고리즘 및 데이터 구조는 대규모 분산 데이터 세트에 적용될 때 느려지거나 완전히 실패할 수 있습니다. 빅 데이터용으로 설계된 알고리즘을 선택하면 시간을 절약하고 정확도를 높이며 처리 비용을 줄일 수 있습니다. 이 독특한 책은 최첨단 연구 논문을 디스크와 클라우드에서 스케치, 스트리밍 및 대규모 데이터 세트 구성을 위한 실용적인 기술로 추출합니다.
책에 대해
대규모 데이터 세트를 위한 알고리즘 및 데이터 구조에서는 대규모 분산 데이터에 대한 처리 및 분석 기술을 소개합니다. 업계 이야기와 재미있는 삽화로 가득한 이 친근한 가이드는 복잡한 개념도 쉽게 이해할 수 있도록 합니다. Bloom 필터, Count-min 스케치, HyperLogLog 및 LSM-트리와 같은 강력한 알고리즘을 자신의 사용 사례에 매핑하는 방법을 배우면서 실제 사례를 탐색하게 됩니다.