top of page

Dataiku

​데이터 과학 및 머신 러닝 플랫폼 리더

Dataiku 특징

Generative AI

기업 규모의 현실적이고, 안전한 Generative AI 애플리케이션 구축

간소화된 개발 툴, 사전 구축된 유스케이스, AI를 활용한 어시스턴트 제공

​데이터 준비 가속화

구축되고 사용자 정의 가능한 시각적 및 코드 레시피를 통해 데이터 준비에 소요되는 시간 단축

AutoML로 팀 역량 강화

모든 유형의 데이터 전문가가 AutoML과 AI 기술을 사용하여 고급 기계 학습 모델을 구축하고 평가

사용하기 쉬운 시각적 ML 프레임워크로 기능 엔지니어링을 가속화하고 모델 실험 추적

전체 ML 프로젝트를 쉽게 재사용 및 복제 가능

통합, 운영, 반복

데이터 과학자, ML 엔지니어 및 운영자가 프로덕션 환경에서 기계 학습 모델 및 AI 프로젝트를 배포, 모니터링 및 관리

​드리프트 모니터링을 자동화하고 모델 성능을 쉽게 비교하며 비즈니스 애플리케이션을 위한 지속적인 고품질 출력 제공

- 현실적이고, 안전한 Generative AI 애플리케이션 구축

- 데이터 준비 가속화

- AutoML로 팀 역량 강화

- 통합, 운영, 반복

데이터 준비(전처리)

  • 시각적인 인터랙티브 환경을 통한 데이터 정리 및 변환(사용자 기본 설정에 따라 모두, 아니요 또는 로우 코드 사용)을 수행합니다.

  • 간편한 데이터 처리에서 고급 데이터 처리까지, 모든 수준의 데이터 처리를 위해 다양한 내장 프로세서를 활용합니다.

시각화

  • 기본 제공 차트 및 대시보드를 통해 즉각적인 시각 정보를 얻거나 인터랙티브 Python, R 및 SQL 노트북을 사용자 지정할 수 있습니다.

  • 값의 분포, 자동으로 탐지된 이상값, 유효하지 않거나 누락된 값, 전체 요약 통계량 등 열의 빠른 시각적 분석을 기반으로 데이터를 탐색할 수 있습니다.

거버넌스 & MLOps

  • 프로젝트 번들에는 디자인 환경부터 프로덕션 환경에 이르는 영역까지 프로젝트에 필요한 모든 것이 포함되어 있습니다.

  • 내장된 데이터 드리프트 모니터링은 문제가 모델 성능에 영향을 미치기 전에 이를 사전에 감지합니다.

  • 프로젝트 계획 및 승인은 생산 도입 계획 및 시도의 품질과 거버넌스를 보장합니다.

​머신 러닝

  • scikit-learn, MLlib, XGBoost, TensorFlow, Keras 등의 최첨단 머신 러닝 라이브러리로 구동되며 설정 가능한 AutoML을 활용합니다.

  • 고급 커스텀 머신 러닝을 위해 Python 및 R에서 직접 코드를 커스터마이징합니다.

  • 고급 데이터 사이언티스트는 Jupyter, PyCharm, RStudio 또는 VScode와 같은 코드 노트북이나 통합 개발 환경(IDE)을 사용할 수 있습니다.

DataOps

  • Dataiku 비주얼 플로우와 레시피를 통해 Coder와 Non-coder 모두 집계, 조인 및 기타 변환을 포함한 데이터 파이프라인을 쉽게 구축할 수 있습니다.

  • 기본 제공 스케줄러를 사용하여 IT 부문에 요청할 필요없이 일상적인 자동화 작업을 위한 대시보드 및 파이프라인을 자동으로 새로고침할 수 있습니다.

  • 대시보드, 경고 및 프로젝트 요약을 통해 관계자에게 프로젝트 활동, 상태 및 운영 상태에 대한 정보를 제공합니다.

애플리케이션

  • 비즈니스 사용자와 분석가가 상호작용하여 다양한 인사이트를 온디맨드 방식으로 제공하는 Dataiku 프로젝트 로직을 활용해 맞춤형 웹 애플리케이션을 만들 수 있습니다.

  • 내장된 Dataiku 대시보드를 활용하거나 데이터 및 결과를 최고의 시각화 플랫폼에 전달하여 다양한 조직에 정보를 전달할 수 있습니다.

bottom of page