시각적 데이터 분석 및 머신 러닝을 위한 오픈 소스 소프트웨어입니다. Python 프로그래밍 언어로 개발되었으며 직관적인 그래픽 사용자 인터페이스를 제공합니다. Orange는 시각화, 통계 분석, 분류, 클러스터링 및 데이터 분석의 다른 측면을 포함하여 데이터 작업을 위한 광범위한 도구를 제공합니다.
주요 특징: -샘플링, 데이터 세트 조인, 테스트 / 트레이닝 / 검증 세트로 나누기, 속성에 역할 할당과 같은 광범위한 데이터 작업 수행 -그래픽 및 대화식 데이터 탐색 -이상치 필터링, 결 측값 제공, PCA, 다양한 데이터 변환 등 -연관 모델 구축, 군집 분석, 가변 중요도 분석 등 -다양한 데이터 마이닝 및 통계 알고리즘 (예 : 분류 트리, 뉴런 네트워크, 선형 및 로지스틱 회귀, K- 평균)을 사용하여 다양한 분석 모델 구성 -모델을 다른 IT 응용 프로그램과 통합 할 수 있도록 스코어링 코드 작성 (스코어링 코드에는 모델 및 데이터 변환이 포함될 수 있음) -데이터 마이닝 모델 (LIFT, ROK, KS, Confusion Matrix)의 모델 품질 평가 및 비교 -모델 품질 보고서 생성 (MS Office)
드래그 앤 드롭 기술을 사용하여 복잡한 분석 프로세스를 간단한 방법으로 정의 할 수 있습니다. 고급 사용자는 자신 만의 스크립트와 새로운 노드 유형을 만들 수 있습니다.
AdvancedMiner는 응용 프로그램 내에서 쉽게 생성 및 / 또는 확장 할 수있는 고급 사용자에게 무한한 추가 기능을 제공합니다.
고급 기능: -SQL 언어 지원 (분석 기능 포함) -R 패키지와 통합 -Java 및 Hadoop Hive와 통합