Юрченко І.В., Гуцуляк І.В. Метод перехресної перевірки у машинному навчанні // Proceedings of the ХХIX International Scientific and Practical Conference "Trends in science and practice of today" (Stockholm, Sweden, July 26-29, 2022).– Pp. 255–258.
View/ Open
Date
2022-07-26Author
Юрченко, Ігор Валерійович
Гуцуляк, Іван Васильович
Metadata
Show full item recordAbstract
Задача полягає у дослідженні стандартного набору даних бінарної (0 або 1) класифікації з репозиторію машинного навчання (Pima Indians Diabetes Dataset), який ілюструє початок захворювання діабетом у індіанців південноамериканського племені Піма [5]. Дані мають вісім вхідних показників: Pregnancies (перенесена вагітність), Glucose (рівень глюкози), BloodPressure (кров’яний тиск), SkinThickness (товщина шкіри), Insulin (рівень інсуліну), Body Mass Index (індекс маси тіла), Diabetes Pedigree (генеалогія діабету у родичів), Age (вік). Результуючий прогнозний показник – Outcome (0 або 1 – відсутність або наявність діабету).
Процедура 10-кратної перехресної перевірки використовується для оцінки кожного з оцінюваних алгоритмів (суміш гауссових розподілів, логістична регресія, гауссовий наївний байєс, бернуллів наївний байєс, мультиноміальний наївний байєс), сконфігурованого з одним і тим самим випадковим початковим числом, щоб гарантувати, що виконуються однакові розбиття для навчальних даних і що кожний алгоритм оцінюється точно так само [2,4].