Ми використовуємо табличні набори даних, спочатку з OpenML, зібрані в набір еталонних наборів даних від команди Inria-Soda на HuggingFace. Ми навчаємо на 28 855 навчальних зразках і тестуємо на решті 9 619 зразках. Усі MLP навчаються з розміром пакету 64, 64 та 0,0005, і ми вивчаємо 3 шари по 100 нейронів кожен. Ми визначаємо шість основних метрик, які використовуються в нашій роботі тут.Ми використовуємо табличні набори даних, спочатку з OpenML, зібрані в набір еталонних наборів даних від команди Inria-Soda на HuggingFace. Ми навчаємо на 28 855 навчальних зразках і тестуємо на решті 9 619 зразках. Усі MLP навчаються з розміром пакету 64, 64 та 0,0005, і ми вивчаємо 3 шари по 100 нейронів кожен. Ми визначаємо шість основних метрик, які використовуються в нашій роботі тут.

Посібник для ґіків з експериментів у машинному навчанні

2025/09/21 13:47

Анотація та 1. Вступ

1.1 Пост-хок пояснення

1.2 Проблема розбіжностей

1.3 Заохочення консенсусу пояснень

  1. Пов'язані роботи

  2. Pear: регуляризатор узгодження пост-хок пояснювача

  3. Ефективність навчання консенсусу

    4.1 Метрики узгодження

    4.2 Покращення метрик консенсусу

    [4.3 Узгодженість за яку ціну?]()

    4.4 Чи все ще цінні пояснення?

    4.5 Консенсус та лінійність

    4.6 Два терміни втрат

  4. Обговорення

    5.1 Майбутня робота

    5.2 Висновок, подяки та посилання

Додаток

A ДОДАТОК

A.1 Набори даних

У наших експериментах ми використовуємо табличні набори даних, спочатку з OpenML та скомпільовані в набір еталонних наборів даних від команди Inria-Soda на HuggingFace [11]. Ми надаємо деякі деталі про кожен набір даних:

\ Bank Marketing Це набір даних бінарної класифікації з шістьма вхідними ознаками і приблизно збалансованими класами. Ми навчаємо на 7 933 навчальних зразках і тестуємо на решті 2 645 зразках.

\ California Housing Це набір даних бінарної класифікації з сімома вхідними ознаками і приблизно збалансованими класами. Ми навчаємо на 15 475 навчальних зразках і тестуємо на решті 5 159 зразках.

\ Electricity Це набір даних бінарної класифікації з сімома вхідними ознаками і приблизно збалансованими класами. Ми навчаємо на 28 855 навчальних зразках і тестуємо на решті 9 619 зразках.

A.2 Гіперпараметри

Багато наших гіперпараметрів є постійними у всіх наших експериментах. Наприклад, всі MLP навчаються з розміром пакету 64 і початковою швидкістю навчання 0,0005. Також, всі MLP, які ми вивчаємо, мають 3 прихованих шари по 100 нейронів кожен. Ми завжди використовуємо оптимізатор AdamW [19]. Кількість епох варіюється від випадку до випадку. Для всіх трьох наборів даних ми навчаємо протягом 30 епох, коли 𝜆 ∈ {0,0, 0,25}, і 50 епох в інших випадках. При навчанні лінійних моделей ми використовуємо 10 епох і початкову швидкість навчання 0,1.

A.3 Метрики розбіжностей

Ми визначаємо кожну з шести метрик узгодження, використаних у нашій роботі.

\ Перші чотири метрики залежать від топ-𝑘 найважливіших ознак у кожному поясненні. Нехай 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) представляє топ-𝑘 найважливіших ознак у поясненні 𝐸, нехай 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) буде рангом важливості ознаки 𝑠 у поясненні 𝐸, і нехай 𝑠𝑖𝑔𝑛(𝐸, 𝑠) буде знаком (позитивним, негативним або нульовим) оцінки важливості ознаки 𝑠 у поясненні 𝐸.

\

\ Наступні дві метрики узгодження залежать від усіх ознак у кожному поясненні, а не лише від топ-𝑘. Нехай 𝑅 буде функцією, яка обчислює ранжування ознак у поясненні за важливістю.

\

\ (Примітка: Krishna та ін. [15] вказують у своїй статті, що 𝐹 має бути набором ознак, визначених кінцевим користувачем, але в наших експериментах ми використовуємо всі ознаки з цією метрикою).

A.4 Результати експерименту з непотрібними ознаками

Коли ми додаємо випадкові ознаки для експерименту в розділі 4.4, ми подвоюємо кількість ознак. Ми робимо це, щоб перевірити, чи пошкоджує наша втрата консенсусу якість пояснення, розміщуючи нерелевантні ознаки в топ-𝐾 частіше, ніж моделі, навчені природним шляхом. У таблиці 1 ми повідомляємо відсоток випадків, коли кожен пояснювач включав одну з випадкових ознак у топ-5 найважливіших ознак. Ми спостерігаємо, що в цілому ми не бачимо систематичного збільшення цих відсотків між 𝜆 = 0,0 (базова MLP без нашої втрати консенсусу) і 𝜆 = 0,5 (MLP, навчена з нашою втратою консенсусу)

\ Таблиця 1: Частота потрапляння непотрібних ознак у топ-5 рангів, виміряна у відсотках.

A.5 Більше матриць розбіжностей

Рисунок 9: Матриці розбіжностей для всіх метрик, розглянутих у цій статті, на даних Bank Marketing.

\ Рисунок 10: Матриці розбіжностей для всіх метрик, розглянутих у цій статті, на даних California Housing.

\ Рисунок 11: Матриці розбіжностей для всіх метрик, розглянутих у цій статті, на даних Electricity.

A.6 Розширені результати

Таблиця 2: Середня точність тестування для навчених нами моделей. Ця таблиця організована за набором даних, моделлю, гіперпараметрами у втраті та коефіцієнтом зменшення ваги (WD). Середні значення отримані за кількома випробуваннями, і ми повідомляємо середні значення ± одна стандартна похибка.

A.7 Додаткові графіки

Рисунок 12: Поверхні логітів для MLP, кожна навчена з різним значенням лямбда, на 10 випадково побудованих тривимірних площинах з набору даних Bank Marketing.

\ Рисунок 13: Поверхні логітів для MLP, кожна навчена з різним значенням лямбда, на 10 випадково побудованих тривимірних площинах з набору даних California Housing.

\ Рисунок 14: Поверхні логітів для MLP, кожна навчена з різним значенням лямбда, на 10 випадково побудованих тривимірних площинах з набору даних Electricity.

\ Рисунок 15: Додаткові графіки кривих компромісу для всіх наборів даних та метрик.

\

:::info Автори:

(1) Аві Шварцшильд, Університет Меріленду, Коледж-Парк, Меріленд, США та робота завершена під час роботи в Arthur (avi1umd.edu);

(2) Макс Цембалест, Arthur, Нью-Йорк, Нью-Йорк, США;

(3) Картік Рао, Arthur, Нью-Йорк, Нью-Йорк, США;

(4) Кіган Хайнс, Arthur, Нью-Йорк, Нью-Йорк, США;

(5) Джон Дікерсон†, Arthur, Нью-Йорк, Нью-Йорк, США ([email protected]).

:::


:::info Ця стаття доступна на arxiv за ліцензією CC BY 4.0 DEED.

:::

\

Ринкові можливості
Логотип SIX
Курс SIX (SIX)
$0.01306
$0.01306$0.01306
-2.09%
USD
Графік ціни SIX (SIX) в реальному часі
Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою [email protected] для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.

Вам також може сподобатися

CME Group розширює криптодеривативи з ф'ючерсами XRP та SOL з котируванням по споту

CME Group розширює криптодеривативи з ф'ючерсами XRP та SOL з котируванням по споту

CME Group запускає ф'ючерси XRP і SOL з котируванням за спотовими цінами, розширюючи доступ до криптовалют для роздрібних клієнтів з довшими термінами дії та зниженими витратами на перенесення позицій. CME Group запустила спот
Поділитись
LiveBitcoinNews2025/12/16 11:30
Нещодавнє зростання Solana (SOL) може вражати, але інвестори, які націлені на життєзмінний ROI, дивляться в інший бік

Нещодавнє зростання Solana (SOL) може вражати, але інвестори, які націлені на життєзмінний ROI, дивляться в інший бік

Пост "Нещодавнє ралі Solana (SOL) може вражати, але інвестори, які націлені на життєзмінний ROI, дивляться в інший бік" з'явився на BitcoinEthereumNews.com. Останнє ралі Solana (SOL) привернуло інвесторів з усього світу, але більша історія для інвесторів з баченням полягає в тому, куди прямують наступні хвилі життєзмінних прибутків. Оскільки Solana продовжує демонструвати високі рівні використання екосистеми та мережі, поступово створюється сцена для Mutuum Finance (MUTM). MUTM оцінюється в $0,035 у своєму швидкозростаючому передпродажі. Зростання ціни на 14,3% - це те, на що інвестори очікуватимуть у наступній фазі. Понад $15,85 мільйонів було зібрано, оскільки передпродаж продовжує набирати обертів. На відміну від більшості токенів, що катаються на короткострокових хвилях прогріву, Mutuum Finance стає вибором, орієнтованим на утиліті, з більшим потенціалом цінності, а отже, все кращим варіантом для інвесторів, які шукають більше, ніж просто рух ціни. Solana утримує прибутки біля $234, оскільки спекуляції тривають Solana (SOL) наразі торгується за ціною $234,08, утримуючи свій 24-годинний діапазон близько $234,42 до $248,19, що ілюструє останню тенденцію. Токен зафіксував сильні семиденні прибутки майже на 13%, значно перевищуючи більшість своїх конкурентів, оскільки його підтримують зростаючий обсяг та інституційні покупки. Рівень опору знаходиться на $250-$260, а рівень підтримки, здається, на $220-$230, і тому це важливі рівні для потенційного прориву або відкату ринку. Однак нова DeFi криптовалюта Mutuum Finance розглядається ринковими спостерігачами як така, що має більший потенціал зростання, оскільки все ще перебуває на етапі передпродажу. Mutuum Finance Фаза 6 Передпродажу Mutuum Finance наразі перебуває на Етапі передпродажу 6 і пропонує токени за $0,035. Передпродаж відбувається дуже швидко, і інвестори вже зібрали понад $15,85 мільйонів. Проект також очікує на стейблкоїн, прив'язаний до USD на блокчейні Ethereum для зручних платежів та як зберігач довгострокової цінності. Mutuum Finance - це платформа DeFi з подвійним кредитуванням та багатоцільовим призначенням, яка приносить користь як позичальникам, так і кредиторам. Вона надає мережу для роздрібних, а також...
Поділитись
BitcoinEthereumNews2025/09/18 06:23
Bank of America: Банківська галузь США рухається до багаторічної фази ончейн розвитку.

Bank of America: Банківська галузь США рухається до багаторічної фази ончейн розвитку.

PANews повідомив 16 грудня, посилаючись на CoinDesk, що Bank of America заявив у звіті в понеділок, що політика щодо криптовалют переходить від обговорення до впровадження
Поділитись
PANews2025/12/16 10:43