Databricks

Why Databricks?

데이터엔지니어, 데이터과학자, 비즈니스분석가 모두에게 최고의 데이터플랫폼 제공

단일 플랫폼에서데이터&Al 통합

데이터엔지니어링,데이터분석,
머신러닝까지 한곳에서!
Databricks는 모든 데이터 작업을
통합하는 Lakehouse플랫폼을 제공합니다.
  • 데이터저장, 처리, 분석, AI 모델 개발까지
    하나의 플랫폼에서
  • SQL,Python,R.Scala 등 다양한 언어 지원
  • 실시간 및 배치 데이터 처리 가능

초고속 데이터 처리성능

대용량 데이터를 신속하게 처리하는 Apache Spark기반 엔진
  •  기존 Hadoop 대비 최대100배 빠른속도
  • 수십억개의 데이터도 빠르고 안정적으로 분석가능
  • 클라우드 네이티브 환경으로 자동 확장 지원

강력한 머신러닝 & AI 지원

데이터과학자를위한AI 최적화환경
  • AutOML 기능 제공 -> 모델 학습을 자동화
  • MLfIow 기반 MLOps +모 델실험 및 배포 간편
  • 데이터 준비부터 모델 배포까지 엔드투엔드 AI워크플로우 제공

비용 절감 & 운영 최적화

기업의 데이터 운영비용을 절감하는 스마트 클라우드 활용
  • 스팟 인스턴스 활용으로 불필요한 비용 절감
  • 데이터 중복제거 및 스토리지 최적화 기능 제공
  • 사용량 기반과금-> 필요한 만큼만 사용하여 비용 효율적

강력한 보안 & 데이터 거버넌스

기업데이터를 안전하게 보호하는 최고 수준의 보안 환경
  • 데이터저장, 처리, 분석, AI 모델 개발까지
    하나의 플랫폼에서
  • SQL,Python,R.Scala 등 다양한 언어 지원
  • 실시간 및 배치 데이터 처리 가능

오픈 소스 기반의 플랫폼

Data & AI 생태계의 다른 플랫폼과 쉬운 연결

Databricks의 활용 범위

End to End를 Databricks Lakehouse가 지원

최신 Data + AI 가속화 기능

Databricks SQL

SQL검색대시보드 이용을 간단히

Databricks Notebook & AutoML

SQL/Python 베이스 코딩부터 AutoML까지

Databricks Delta Live Table

데이터 파이프라인 및 품질 관리

Databricks Unity Catalog

데이터 사전, 데이터 리니지