Dataiku
데이터 과학 및 머신 러닝 플랫폼 리더
Dataiku 특징
Generative AI
기업 규모의 현실적이고, 안전한 Generative AI 애플리케이션 구축
간소화된 개발 툴, 사전 구축된 유스케이스, AI를 활용한 어시스턴트 제공
데이터 준비 가속화
구축되고 사용자 정의 가능한 시각적 및 코드 레시피를 통해 데이터 준비에 소요되는 시간 단축
AutoML로 팀 역량 강화
모든 유형의 데이터 전문가가 AutoML과 AI 기술을 사용하여 고급 기계 학습 모델을 구축하고 평가
사용하기 쉬운 시각적 ML 프레임워크로 기능 엔지니어링을 가속화하고 모델 실험 추적
전체 ML 프로젝트를 쉽게 재사용 및 복제 가능
통합, 운영, 반복
데이터 과학자, ML 엔지니어 및 운영자가 프로덕션 환경에서 기계 학습 모델 및 AI 프로젝트를 배포, 모니터링 및 관리
드리프트 모니터링을 자동화하고 모델 성능을 쉽게 비교하며 비즈니스 애플리케이션을 위한 지속적인 고품질 출력 제공
- 현실적이고, 안전한 Generative AI 애플리케이션 구축
- 데이터 준비 가속화
- AutoML로 팀 역량 강화
- 통합, 운영, 반복
데이터 준비(전처리)
-
시각적인 인터랙티브 환경을 통한 데이터 정리 및 변환(사용자 기본 설정에 따라 모두, 아니요 또는 로우 코드 사용)을 수행합니다.
-
간편한 데이터 처리에서 고급 데이터 처리까지, 모든 수준의 데이터 처리를 위해 다양한 내장 프로세서를 활용합니다.
시각화
-
기본 제공 차트 및 대시보드를 통해 즉각적인 시각 정보를 얻거나 인터랙티브 Python, R 및 SQL 노트북을 사용자 지정할 수 있습니다.
-
값의 분포, 자동으로 탐지된 이상값, 유효하지 않거나 누락된 값, 전체 요약 통계량 등 열의 빠른 시각적 분석을 기반으로 데이터를 탐색할 수 있습니다.
거버넌스 & MLOps
-
프로젝트 번들에는 디자인 환경부터 프로덕션 환경에 이르는 영역까지 프로젝트에 필요한 모든 것이 포함되어 있습니다.
-
내장된 데이터 드리프트 모니터링은 문제가 모델 성능에 영향을 미치기 전에 이를 사전에 감지합니다.
-
프로젝트 계획 및 승인은 생산 도입 계획 및 시도의 품질과 거버넌스를 보장합니다.
머신 러닝
-
scikit-learn, MLlib, XGBoost, TensorFlow, Keras 등의 최첨단 머신 러닝 라이브러리로 구동되며 설정 가능한 AutoML을 활용합니다.
-
고급 커스텀 머신 러닝을 위해 Python 및 R에서 직접 코드를 커스터마이징합니다.
-
고급 데이터 사이언티스트는 Jupyter, PyCharm, RStudio 또는 VScode와 같은 코드 노트북이나 통합 개발 환경(IDE)을 사용할 수 있습니다.
DataOps
-
Dataiku 비주얼 플로우와 레시피를 통해 Coder와 Non-coder 모두 집계, 조인 및 기타 변환을 포함한 데이터 파이프라인을 쉽게 구축할 수 있습니다.
-
기본 제공 스케줄러를 사용하여 IT 부문에 요청할 필요없이 일상적인 자동화 작업을 위한 대시보드 및 파이프라인을 자동으로 새로고침할 수 있습니다.
-
대시보드, 경고 및 프로젝트 요약을 통해 관계자에게 프로젝트 활동, 상태 및 운영 상태에 대한 정보를 제공합니다.
애플리케이션
-
비즈니스 사용자와 분석가가 상호작용하여 다양한 인사이트를 온디맨드 방식으로 제공하는 Dataiku 프로젝트 로직을 활용해 맞춤형 웹 애플리케이션을 만들 수 있습니다.
-
내장된 Dataiku 대시보드를 활용하거나 데이터 및 결과를 최고의 시각화 플랫폼에 전달하여 다양한 조직에 정보를 전달할 수 있습니다.